[Rio-pm] Conteudo de uma pagina em Ajax
breno
breno em rio.pm.org
Quinta Dezembro 18 05:00:46 PST 2008
2008/12/18 Gabriel Vieira <gabriel.vieira em gmail.com>:
> Não tem nada de Ajax na página, há apenas links dentro de comandos JS
> que direciona ao conteúdo.
>
Gabriel (Lima), acho q o q eles querem dizer com isso é que ou vc usa
algo mais sofisticado como o WWW::Selenium ou observa a lógica do site
dentro do fonte e faz um scraping 'manual'. Por exemplo, se o seu
problema resume-se aos links do "jornal" no site indicado, uma olhada
(bem) rápida sugere que os links seguem o formato "prefixo tipo data
orgao", em que:
prefixo = 'http://www.iof.mg.gov.br/iodiario/'
tipo = exec, trt, legi, etc
data = data escolhida, em formato DDMMAAAA
orgao = X.asp
uma vez mapeado, vc chega a um formulário que (acredito eu) possa ser
tratado com o Mecha. Experimente para um e veja se a lógica funciona e
se vai dar muito trabalho fazer para todos. Ai escolha se vale a pena
fazer desse jeito ou usar uma engine de javascript.
Espero ter ajudado,
[]s
-b
Mais detalhes sobre a lista de discussão Rio-pm