[Rio-pm] Conteudo de uma pagina em Ajax

Eden Cardim edencardim em gmail.com
Quinta Dezembro 18 03:52:17 PST 2008


2008/12/18 gabriel lima <gabriellima333 em hotmail.com>:
> Olá pessoal tudo bem?
>
> Estou com um pequeno problema na empresa onde faço estágio.
> Estou no 2ºP do curso Sistemas de Informação na PUC-Minas e ainda não tenho
> conhecimentos suficientes para fazer o que me foi pedido. Preciso
> retirar do site www.iof.mg.gov.br alguns jornais que estão no canto infeior
> esquerdo.
>
> Por exemplo, preciso retirar o conteudo da página que aparece ao clicar em:
>> Executivo > Governo do Estado > Qualquer um dos links
>
> Já tentei usar o WWW::Mechanize para resolver o meu problema usando o método
> $mech->links(); para depois pedir uma nova requisição. Mas não funcionou.
> O site utiliza Ajax, e como eu já disse anteriormente, estou com as mãos
> atadas. Gostaria que os mais experientes me ajudassem com alguma solução
> para
> este problema.

A depender de quão complexo seja o "AJAX", você pode olhar o source e
descobrir se ele está meramente fazendo requisições e carregando
conteúdo na página assincronamente como se fosse um frame (tendo em
vista que é um site governamental, aposto que é isso que acontece).
Agora, se estiverem usando um webservice mais complexo, você precisa
de uma engine de javascript, coisa que o mechanize não tem.
Experimenta o selenium (que usa o próprio browser como engine) ou o
rhino, que é uma engine de Javascript independente.

-- 
   Eden Cardim       Need help with your Catalyst or DBIx::Class project?
  Code Monkey                    http://www.shadowcat.co.uk/catalyst/
 Shadowcat Systems Ltd.  Want a managed development or deployment platform?
http://edenc.vox.com/            http://www.shadowcat.co.uk/servers/


Mais detalhes sobre a lista de discussão Rio-pm