[Rio-pm] [HELP] Download

Daniel Vinciguerra dan.vinciguerra em gmail.com
Quarta Novembro 5 19:04:18 PST 2014


Com o comando wget para pegar somente o conteudo do site ficaria assim:

wget -q -O -
http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview&format=text

e para pegar o resultado com o perl:

 perl -E 'say qx{wget -q -O -
http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview&format=text
}'

O problema é que este texto é carregado sempre dinamicamente através de um
javascript. Se você não tiver o link para acesso direto a este conteúdo vai
ficar complicado de baixar.

Abraço,



*Daniel Vinciguerra (@dvinciguerra)*
Web solution architect, perl dev, vegetarian, geek and co-founder at *Bivee*
bivee.com.br  -  github.com/Bivee

2014-11-05 23:57 GMT-02:00 Aureliano Guedes <guedes_1000 em hotmail.com>:

> Ola Monges,
>
> tenho uma dúvida que talvez seja um pouco específica, provavelmente
> voltada para bioinformatas.
>
> Bom precisava fazer o download desse arquivo (
> http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview).
>
> Só que não posso fazer de qualquer forma, precisava que fosse um script
> executando o wget ou ftp.
>
> O problema é fazer o download através do wget que estou com dificuldade.
>
> Seria basicamente um 'system 'wget .....'' só não estou sabendo como fazer.
>
> Alguém aqui poderia me ajudar com o wget?
>
> No final, só preciso gerar um arquivo no formato fasta.
>
> Ex:
> >gi|444893469|emb|AL123456.3| Mycobacterium tuberculosis H37Rv complete
> genome
> TTGACCGATGACCCCGGTTCAGGCTTCACCACAGTGTGGAACGCGGTCGTCTCCGAACTTAACGGCGACC
> CTAAGGTTGACGACGGACCCAGCAGTGATGCTAATCTCAGCGCTCCGCTGACCCCTCAGCAAAGGGCTTG
> GCTCAATCTCGTCCAGCCATTGACCATCGTCGAGGGGTTTGCTCTGTTATCCGTGCCGAGCAGCTTTGTC
> CAAAACGAAATCGAGCGCCATCTGCGGGCCCCGATTACCGACGCTCTCAGCCGCCGACTCGGACATCAGA
>
>
>
> _______________________________________________
> Rio-pm mailing list
> Rio-pm em pm.org
> http://mail.pm.org/mailman/listinfo/rio-pm
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20141106/0b0b6e6d/attachment.html>


Mais detalhes sobre a lista de discussão Rio-pm