[Rio-pm] Conteudo de uma pagina em Ajax

breno breno em rio.pm.org
Quinta Dezembro 18 05:00:46 PST 2008


2008/12/18 Gabriel Vieira <gabriel.vieira em gmail.com>:
> Não tem nada de Ajax na página, há apenas links dentro de comandos JS
> que direciona ao conteúdo.
>

Gabriel (Lima), acho q o q eles querem dizer com isso é que ou vc usa
algo mais sofisticado como o WWW::Selenium ou observa a lógica do site
dentro do fonte e faz um scraping 'manual'. Por exemplo, se o seu
problema resume-se aos links do "jornal" no site indicado, uma olhada
(bem) rápida sugere que os links seguem o formato "prefixo tipo data
orgao", em que:

prefixo = 'http://www.iof.mg.gov.br/iodiario/'
tipo = exec, trt, legi, etc
data = data escolhida, em formato DDMMAAAA
orgao = X.asp

uma vez mapeado, vc chega a um formulário que (acredito eu) possa ser
tratado com o Mecha. Experimente para um e veja se a lógica funciona e
se vai dar muito trabalho fazer para todos. Ai escolha se vale a pena
fazer desse jeito ou usar uma engine de javascript.

Espero ter ajudado,


[]s

-b


Mais detalhes sobre a lista de discussão Rio-pm