<!DOCTYPE html>
<html>
<head>
<title></title>
</head>
<body><div><span style="">Oi Aureliano,</span><br></div>
<div> </div>
<div><span style="">
      Não sei se você já ouviu falar do NCBI </span><span style=""><span style="">Entrez Direct</span> ou se já o utilizou alguma vez,
      ams nesse caso acredito que ele possa ser mais útil. O </span><span style=""><span style="">Entrez Direct</span> é um conjunto de
      scripts bash e Perl que o NCBI forneceu para que quisesse realizar
      algum tipo de acesso mais "avançado" aos seus bancos de dados, e
      de forma programática.</span><br></div>
<div> </div>
<div><span style="">
      veja aqui mais informações sobre o </span><span style="">
      
      Entrez Direct: <a class="moz-txt-link-freetext" href="http://www.ncbi.nlm.nih.gov/books/NBK179288/">http://www.ncbi.nlm.nih.gov/books/NBK179288/</a></span><br></div>
<div> </div>
<div><span style="">
      Bom, vamos ao seu problema agora; O que você está querendo fazer é
      baixar pelo terminal uma sequencia do banco de nucleotídeos certo?
      De acordo com a documentação do Entrez Direct você vai precisar
      usar o seguinte comando:</span><br></div>
<div> </div>
<div><span style="">
      ./esearch -db nucleotide -query "AL123456 [ACN]" | ./efetch
      -format fasta</span><br></div>
<div> </div>
<div><span style="">
      O eDirect funciona encadeando os scripts, nesse caso eu estou
      usando 2 deles, o esearch para a busca e o efetch para o download.
      Você pode ver na página do livro (o link que passei acima) todos
      os parâmetros que existem, da pra fazer muita coisa com esses
      scripts deles.</span><br></div>
<div> </div>
<div><span style="">
      Então, para salvar em um arquivo a sequencia do genoma basta
      direcionar o comando acima:</span><br></div>
<div> </div>
<div><span style="">
      ./esearch -db nucleotide -query "AL123456 [ACN]" | ./efetch
      -format fasta > genome.fa</span><br></div>
<div> </div>
<div><span style="">
      e pronto, seu genoma foi baixado e salvo.</span><br></div>
<div> </div>
<div><span style="">
      Espero que dessa forma você consiga contornar o problema que lhe
      impedia de usar o wget ou o ftp para o download.</span><br></div>
<div> </div>
<div><span style="">
      abraços</span><br></div>
<div> </div>
<div> </div>
<div> </div>
<div class="moz-cite-prefix">On 05-11-2014 23:57, Aureliano Guedes
      wrote:<br></div>
<blockquote cite="mid:BLU182-W36746E52E8B243E6A28E0294840@phx.gbl" type="cite"><div dir="ltr">Ola Monges,<br></div>
<div dir="ltr"> </div>
<div dir="ltr">
        tenho uma dúvida que talvez seja um pouco específica,
        provavelmente voltada para bioinformatas.<br></div>
<div dir="ltr"> </div>
<div dir="ltr">
        Bom precisava fazer o download desse arquivo
(<a class="moz-txt-link-freetext" href="http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview">http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview</a>).<br></div>
<div dir="ltr"> </div>
<div dir="ltr">
        Só que não posso fazer de qualquer forma, precisava que fosse um
        script executando o wget ou ftp.<br></div>
<div dir="ltr"> </div>
<div dir="ltr">
        O problema é fazer o download através do wget que estou com
        dificuldade. <br></div>
<div dir="ltr"> </div>
<div dir="ltr">
        Seria basicamente um 'system 'wget .....'' só não estou sabendo
        como fazer.<br></div>
<div dir="ltr"> </div>
<div dir="ltr">
        Alguém aqui poderia me ajudar com o wget?<br></div>
<div dir="ltr"> </div>
<div dir="ltr">
        No final, só preciso gerar um arquivo no formato fasta.<br></div>
<div dir="ltr"> </div>
<div dir="ltr">
        Ex:<br></div>
<div dir="ltr">
        >gi|444893469|emb|AL123456.3| Mycobacterium tuberculosis
        H37Rv complete genome
        <span class="ff_line" id="gi_444893469_1">TTGACCGATGACCCCGGTTCAGGCTTCACCACAGTGTGGAACGCGGTCGTCTCCGAACTTAACGGCGACC</span> <span class="ff_line" id="gi_444893469_71">CTAAGGTTGACGACGGACCCAGCAGTGATGCTAATCTCAGCGCTCCGCTGACCCCTCAGCAAAGGGCTTG</span> <span class="ff_line" id="gi_444893469_141">GCTCAATCTCGTCCAGCCATTGACCATCGTCGAGGGGTTTGCTCTGTTATCCGTGCCGAGCAGCTTTGTC</span> <span class="ff_line" id="gi_444893469_211">CAAAACGAAATCGAGCGCCATCTGCGGGCCCCGATTACCGACGCTCTCAGCCGCCGACTCGGACATCAGA</span><br></div>
<div dir="ltr"> </div>
<div dir="ltr"> </div>
<div> </div>
<div> </div>
<pre>_______________________________________________
Rio-pm mailing list
<a class="moz-txt-link-abbreviated" href="mailto:Rio-pm@pm.org">Rio-pm@pm.org</a> <a class="moz-txt-link-freetext" href="http://mail.pm.org/mailman/listinfo/rio-pm">http://mail.pm.org/mailman/listinfo/rio-pm</a><br></pre></blockquote><div> </div>
<pre class="moz-signature">-- 
Felipe da Veiga Leprevost, PhD.
<a class="moz-txt-link-abbreviated" href="http://www.leprevost.com.br">www.leprevost.com.br</a>
Laboratory for Proteomics and Protein Engineering.
Fiocruz, Brazil.<br></pre><div>--<br></div><div>Felipe<br></div><div><br></div>
</body>
</html>