[SP-pm] Capturar dados de sites

Andre Carneiro andregarciacarneiro at gmail.com
Thu May 9 09:55:27 PDT 2013


 corrigi o meu texto 'bem pra caramba' ... mals!


2013/5/9 Andre Carneiro <andregarciacarneiro at gmail.com>

>
> Se o site tá em ASP.NET não esqueça de incluir o token gigantesco na
> requisição, que os sites feitos em ASP.NET normalmente geram
> automaticamente através de componentes .NET. Para facilitar utilize algum
> sniffer de http como Burp, wireshark ou mesmo o bom e velho Data Tamper(nem
> sei se existe isso ainda). Com isso poderás ver tudo o que está rolando na
> requisição desde cabeçalhos http até as variáveis que deverão ser incluídas
> na requisição(acho mais prático).
>
> Não sei se dá para fazer  isso automaticamente com WWW::Mechanize,
> acredito que não. De qualquer forma, você sempre pode escolher o 'caminho
> mais dolorido', abrindo o código da página, e checar as variáveis com 'os
> zóio'. Eu não recomendo, pois se tiver Javascript envolvido com
> requisição(o que não é difícil hoje em dia), vai ter mais trabalho para
> montar a requisição com tudo o que ela precisa.
>
> Sinceramente recomendo que você analise tudo com um sniffer ou algo
> parecido para só por desencargo...
>
>
>
> Cheers!
>
>
> 2013/5/9 Stanislaw Pusep <creaktive at gmail.com>
>
>> <jabá>
>> use LWP::Protocol::Net::Curl;
>> use WWW::Mechanize;
>>
>> # pronto: WWW::Mechanize usará libcurl por baixo dos panos :)
>> </jabá>
>>
>>
>> ABS()
>>
>>
>> 2013/5/9 Eduardo Almeida <eduardo at web2solutions.com.br>
>>
>>>  Esqueceram de mencionar o curl
>>>
>>>
>>> On 09/05/2013 13:04, Marcio - Google wrote:
>>>
>>>  Stan,
>>>
>>>  Em lote. A sequencia é assim:
>>> 1. Entrar usuário e senha e conferir se autenticou;
>>> 2. Entrar com uma palavra chave em um campo especifico, pois o site só
>>> aceita o método post;
>>> 3. Submeter o form;
>>> 4. Capturar vários dados;
>>>  5. Acionar o botão próximo;
>>> 6. Capturar mais dados até não ter mais o botão próximo.
>>>
>>>  Com esses dados, vou entrar em outra parte do site e fazer a mesma
>>> coisa:
>>>  1. Entrar usuário e senha e conferir se autenticou;
>>> 2. Entrar com uma palavra chave em um campo especifico, pois o site só
>>> aceita o método post. Essa palavra-chave é o resultado da captura anterior;
>>> 3. Submeter o form;
>>>  4. Entrar em um link;
>>>  5. Capturar vários dados;
>>> 6. Repetir a partir do 2.
>>>
>>>
>>>  [...]'s
>>>
>>> Marcio
>>>
>>>  ========================================
>>> ########### Campanha Ajude o Marcio! ###########
>>> http://sosmarcio.blogspot.com.br/
>>> http://www.vakinha.com.br/VaquinhaP.aspx?e=195793
>>>  ========================================
>>>
>>>
>>> Em 9 de maio de 2013 11:47, Stanislaw Pusep <creaktive at gmail.com>escreveu:
>>>
>>>> Depende! Você precisa fazer isso "on-fly"? Ou em lote? Se for em lote,
>>>> você quer percorrer o site todo? Ou tem uma lista de palavras-chaves?
>>>>
>>>>
>>>> ABS()
>>>>
>>>>
>>>>  2013/5/9 Marcio - Google <marciorp at gmail.com>
>>>>
>>>>>   Mestres,
>>>>>
>>>>>  Estou procurando uma forma de fazer um aplicativo que navegue em um
>>>>> determinado site, capture algumas informações e grave em BD.
>>>>>
>>>>>  Pra ficar mais fácil de entender, vai um exemplo.
>>>>> Entrar no site telelistas.net, preencher uma determinada
>>>>> palavra-chave para busca, acionar o botão buscar e pegar os nomes e
>>>>> telefones para salvar no BD. Isso sem interação/intervenção do usuário.
>>>>>
>>>>>  Alguma ideia? Módulo? Mágica?
>>>>>
>>>>>  Ah, o site alvo é Asp.Net.
>>>>>
>>>>>  Abs,
>>>>>
>>>>>
>>>>> Marcio
>>>>>
>>>>>  ========================================
>>>>> ########### Campanha Ajude o Marcio! ###########
>>>>> http://sosmarcio.blogspot.com.br/
>>>>>  http://www.vakinha.com.br/VaquinhaP.aspx?e=195793
>>>>>  ========================================
>>>>>
>>>>>  =begin disclaimer
>>>>>    Sao Paulo Perl Mongers: http://sao-paulo.pm.org/
>>>>>  SaoPaulo-pm mailing list: SaoPaulo-pm at pm.org
>>>>>  L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
>>>>> =end disclaimer
>>>>>
>>>>>
>>>>
>>>> =begin disclaimer
>>>>    Sao Paulo Perl Mongers: http://sao-paulo.pm.org/
>>>>  SaoPaulo-pm mailing list: SaoPaulo-pm at pm.org
>>>>  L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
>>>> =end disclaimer
>>>>
>>>>
>>>
>>>
>>> =begin disclaimer
>>>    Sao Paulo Perl Mongers: http://sao-paulo.pm.org/
>>>  SaoPaulo-pm mailing list: SaoPaulo-pm at pm.org
>>>  L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> <http://mail.pm.org/mailman/listinfo/saopaulo-pm>
>>> =end disclaimer
>>>
>>>
>>>
>>> --
>>> Eduardo Almeida - Software Engineer
>>> eduardo at web2solutions.com.br - 27 3021-2430 / 27 9839 3755
>>>
>>> *WEB2 Solutions* - Inovando, sempre!
>>>
>>> =begin disclaimer
>>>    Sao Paulo Perl Mongers: http://sao-paulo.pm.org/
>>>  SaoPaulo-pm mailing list: SaoPaulo-pm at pm.org
>>>  L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
>>> =end disclaimer
>>>
>>>
>>
>> =begin disclaimer
>>    Sao Paulo Perl Mongers: http://sao-paulo.pm.org/
>>  SaoPaulo-pm mailing list: SaoPaulo-pm at pm.org
>>  L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
>> =end disclaimer
>>
>>
>
>
> --
> André Garcia Carneiro
> Software Engineer
> (11)982907780
>



-- 
André Garcia Carneiro
Software Engineer
(11)982907780
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://mail.pm.org/pipermail/saopaulo-pm/attachments/20130509/d210841c/attachment-0001.html>


More information about the SaoPaulo-pm mailing list