[SP-pm] Busca eficiente em array.

Daniel de Oliveira Mantovani daniel.oliveira.mantovani at gmail.com
Wed Sep 16 18:59:31 PDT 2009


2009/9/16 Nilson Santos Figueiredo Jr. <acid06 em gmail.com>:
> 2009/9/16 Daniel de Oliveira Mantovani <daniel.oliveira.mantovani em gmail.com>:
>> Vou explicar melhor, estou criando um programa que pega todos os links
>> de um determinado website, eu preciso saber os links que já foram
>> pegos, para não entrar na página de novo
>> Em várias páginas de um website existem o mesmo link, e eu só preciso
>> do link uma vez, preciso varrer todas as páginas uma vez.
>> Resumindo, preciso saber se eu já peguei determinada página, e para
>> isso olho no array, se não existir eu faço, se existir eu pulo.
>
> Em outras palavras, você está fazendo um link crawler/spider/similar?
> Ou não segue os links depois, recursivamente?

Sigo os links sim recursivamente.

>
> -Nilson Santos F. Jr.
> _______________________________________________
> SaoPaulo-pm mailing list
> SaoPaulo-pm em pm.org
> http://mail.pm.org/mailman/listinfo/saopaulo-pm
>



-- 
"Deus usa os loucos pra confundir os sábios"
http://mantovanihouse.blogspot.com/
This is my poney:
-------(\_------------_/)-----------
-------)--(----------)--(-----------
------(----(---------)----)----------
-------)----(-------)----(-----------
-------(----(-------)----)-----------
--------\_-(\\.---.//)-_/------------
----------\)' -8--8- '(/--------------
-----------/------------\---------------
----------(--)--------(--)--------------
------------(_c__c_)----------------
----------------------------------------
perl -MLWP::Simple -le 'grep{ print $1 if
/href="(http.+?)"/}split($/,get("http://www.perl.org.br"))'


More information about the SaoPaulo-pm mailing list