[Cascavel-pm] Busca automatica via Perl

Igor Sutton Lopes igor.sutton em gmail.com
Quinta Março 29 06:40:35 PDT 2007


On 2007/03/29, at 13:10, <stenio.morais em caixa.gov.br>  
<stenio.morais em caixa.gov.br> wrote:

> Galera,
>
> Eu não quero de forma alguma construir um buscador não. Longe disto.
>
> So quero analisar pegar os links que os buscadores retorna a cada  
> consulta realizada.
>
> Meu problema eh que são milhares de consulta  e devem ser feitas em  
> vários Buscadores (Yahoo, AltaVista, GOoble, INFSeeach, Excite,  
> TodoBR, Terra, RadarUol, MSN...e ai vai... ). Por isso quero  
> descartar o uso de API própria de cada buscador.
>

Stenio,

Eu sugiro a utilização do LWP. Mas você pode utilizar a API do  
provedor do serviço, quando existente de maneira independente. Abaixo  
segue um exemplo do que *eu* faria prá isso acontecer. Substitua os  
'...' pela implementação e voi-lá!

<code>
sub search_google {
     my $query_text = shift;
     ...
     return [ @search_results ];
}

sub search_yahoo {
     my $query_text = shift;
     ...
     return [ @search_results ];
}

sub search_msn {
     my $query_text = shift;
     ...
     return [ @search_results ];
}

my $dispatcher = {
     'yahoo' => \&search_yahoo,
     'google' => \&search_google,
}

sub search {
     my $query_text = shift;
     my $results = {};
     foreach (keys %$dispatcher) {
         $results{$_} = $dispatcher->{$_}->($query_text);
     }
     return $results;
}

my $results = search('política');

print Dumper $results;
</code>

Espero que ajude!

--
Igor Sutton
igor.sutton em gmail.com



-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: http://mail.pm.org/pipermail/cascavel-pm/attachments/20070329/9899b32a/attachment.html 
-------------- Próxima Parte ----------
Um anexo não texto foi limpo...
Nome  : PGP.sig
Tipo  : application/pgp-signature
Tam   : 186 bytes
Descr.: This is a digitally signed message part
Url   : http://mail.pm.org/pipermail/cascavel-pm/attachments/20070329/9899b32a/attachment.bin 


Mais detalhes sobre a lista de discussão Cascavel-pm