[Cascavel-pm] webcrawler usando Socket

João Gabriel jamorreu em gmail.com
Segunda Outubro 17 15:07:12 PDT 2005


Só "ler" o HTML da página e pegar o valor do Content-type, não?

--
[]'s
João Gabriel
CGiClube.net - www.cgiclube.net
Vitória Perl Mongers - vitoria.pm.org



Em 17/10/05, Alceu R. de Freitas Jr.<glasswalk3r em yahoo.com.br> escreveu:
>
> --- Nilson Santos Figueiredo Junior <acid06 em gmail.com>
> escreveu:
>
> > Você tem que pensar que o LWP implementa TUDO
> > relativo à Web. Ou seja,
> > tem como você garantir que todo link será seguido. E
> > ele faz tudo
> > seguindo os padrões corretamente, entre outras
> > coisas.
>
> Ah, mas eu não preciso disso tudo. Preciso fazer um
> simples GET para o header do arquivo solicitado. O
> primeiro pacote vai conter o campo MIME TYPE que eu
> preciso, depois disso é fazer parse na resposta.
>
> > Mas, de qualquer forma, eu acabei de fazer um teste
> > e, aqui na máquina
> > onde estou (Windows 2000) consome menos de 6MB de
> > memória, ou seja,
> > 10MB a menos do que você reportou.
> >
> > Tem certeza que é o LWP?
>
> Desculpe. LWP + URI. Estou sem o script aqui, mas eu
> preciso usar um método específico do LWP, algo como
> "get-header" ou "header".
>
> []'s
>
>
> Alceu Rodrigues de Freitas Junior
> --------------------------------------
> glasswalk3r em yahoo.com.br
> http://www.imortais.cjb.net
> -----------------------------------------------------------------------
> A well-used door needs no oil on its hinges.
> A swift-flowing stream does not grow stagnant.
> Neither sound nor thoughts can travel through a vacuum.
> Software rots if not used.
> These are great mysteries -- The Tao Of Programming, 5.1
>
>
>
>
>
>
>
>
> _______________________________________________________
> Promoção Yahoo! Acesso Grátis: a cada hora navegada você acumula cupons e concorre a mais de 500 prêmios! Participe! http://yahoo.fbiz.com.br/
> _______________________________________________
> Cascavel-pm mailing list
> Cascavel-pm em pm.org
> http://mail.pm.org/mailman/listinfo/cascavel-pm
>


Mais detalhes sobre a lista de discussão Cascavel-pm