<div dir="ltr"><div><div><div><div>Com o comando wget para pegar somente o conteudo do site ficaria assim:<br><br></div>wget -q -O - <a href="http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview&format=text">http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview&format=text</a><br><br></div>e para pegar o resultado com o perl:<br><br> perl -E 'say qx{wget -q -O - <a href="http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview&format=text">http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview&format=text</a>}'<br><br></div>O problema é que este texto é carregado sempre dinamicamente através de um javascript. Se você não tiver o link para acesso direto a este conteúdo vai ficar complicado de baixar.<br><br></div>Abraço,<br><div><br></div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature"><div dir="ltr"><b><br>Daniel Vinciguerra (@dvinciguerra)</b><br>Web solution architect, perl dev, vegetarian, geek and co-founder at <span style="background-color:rgb(255,255,255)"><b>Bivee</b></span><br><span style="font-family:arial,sans-serif;font-size:13px;border-collapse:collapse"><a href="http://bivee.com.br" style="color:rgb(28,81,168)" target="_blank">bivee.com.br</a>  -  <a href="https://github.com/Bivee" target="_blank">github.com/Bivee</a><br></span><span style="font-family:arial,sans-serif;font-size:13px;border-collapse:collapse"></span></div></div></div>
<br><div class="gmail_quote">2014-11-05 23:57 GMT-02:00 Aureliano Guedes <span dir="ltr"><<a href="mailto:guedes_1000@hotmail.com" target="_blank">guedes_1000@hotmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">


<div><div dir="ltr">Ola Monges,<br><br>tenho uma dúvida que talvez seja um pouco específica, provavelmente voltada para bioinformatas.<br><br>Bom precisava fazer o download desse arquivo (<a href="http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview" target="_blank">http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview</a>).<br><br>Só que não posso fazer de qualquer forma, precisava que fosse um script executando o wget ou ftp.<br><br>O problema é fazer o download através do wget que estou com dificuldade. <br><br>Seria basicamente um 'system 'wget .....'' só não estou sabendo como fazer.<br><br>Alguém aqui poderia me ajudar com o wget?<br><br>No final, só preciso gerar um arquivo no formato fasta.<br><br>Ex:<br>>gi|444893469|emb|AL123456.3| Mycobacterium tuberculosis H37Rv complete genome
<span>TTGACCGATGACCCCGGTTCAGGCTTCACCACAGTGTGGAACGCGGTCGTCTCCGAACTTAACGGCGACC</span>
<span>CTAAGGTTGACGACGGACCCAGCAGTGATGCTAATCTCAGCGCTCCGCTGACCCCTCAGCAAAGGGCTTG</span>
<span>GCTCAATCTCGTCCAGCCATTGACCATCGTCGAGGGGTTTGCTCTGTTATCCGTGCCGAGCAGCTTTGTC</span>
<span>CAAAACGAAATCGAGCGCCATCTGCGGGCCCCGATTACCGACGCTCTCAGCCGCCGACTCGGACATCAGA</span><br><br><br>                                     </div></div>
<br>_______________________________________________<br>
Rio-pm mailing list<br>
<a href="mailto:Rio-pm@pm.org">Rio-pm@pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/rio-pm" target="_blank">http://mail.pm.org/mailman/listinfo/rio-pm</a><br></blockquote></div><br></div>