<!DOCTYPE html>

<html>

<head>

<title></title>

</head>

<body><div><span style="">Oi Aureliano,</span><br></div>

<div> </div>

<div><span style="">

      Não sei se você já ouviu falar do NCBI </span><span style=""><span style="">Entrez Direct</span> ou se já o utilizou alguma vez,

      ams nesse caso acredito que ele possa ser mais útil. O </span><span style=""><span style="">Entrez Direct</span> é um conjunto de

      scripts bash e Perl que o NCBI forneceu para que quisesse realizar

      algum tipo de acesso mais "avançado" aos seus bancos de dados, e

      de forma programática.</span><br></div>

<div> </div>

<div><span style="">

      veja aqui mais informações sobre o </span><span style="">

      Entrez Direct: <a class="moz-txt-link-freetext" href="http://www.ncbi.nlm.nih.gov/books/NBK179288/">http://www.ncbi.nlm.nih.gov/books/NBK179288/</a></span><br></div>

<div> </div>

<div><span style="">

      Bom, vamos ao seu problema agora; O que você está querendo fazer é

      baixar pelo terminal uma sequencia do banco de nucleotídeos certo?

      De acordo com a documentação do Entrez Direct você vai precisar

      usar o seguinte comando:</span><br></div>

<div> </div>

<div><span style="">

      ./esearch -db nucleotide -query "AL123456 [ACN]" | ./efetch

      -format fasta</span><br></div>

<div> </div>

<div><span style="">

      O eDirect funciona encadeando os scripts, nesse caso eu estou

      usando 2 deles, o esearch para a busca e o efetch para o download.

      Você pode ver na página do livro (o link que passei acima) todos

      os parâmetros que existem, da pra fazer muita coisa com esses

      scripts deles.</span><br></div>

<div> </div>

<div><span style="">

      Então, para salvar em um arquivo a sequencia do genoma basta

      direcionar o comando acima:</span><br></div>

<div> </div>

<div><span style="">

      ./esearch -db nucleotide -query "AL123456 [ACN]" | ./efetch

      -format fasta > genome.fa</span><br></div>

<div> </div>

<div><span style="">

      e pronto, seu genoma foi baixado e salvo.</span><br></div>

<div> </div>

<div><span style="">

      Espero que dessa forma você consiga contornar o problema que lhe

      impedia de usar o wget ou o ftp para o download.</span><br></div>

<div> </div>

<div><span style="">

      abraços</span><br></div>

<div> </div>

<div> </div>

<div> </div>

<div class="moz-cite-prefix">On 05-11-2014 23:57, Aureliano Guedes

      wrote:<br></div>

<blockquote cite="mid:BLU182-W36746E52E8B243E6A28E0294840@phx.gbl" type="cite"><div dir="ltr">Ola Monges,<br></div>

<div dir="ltr"> </div>

<div dir="ltr">

        tenho uma dúvida que talvez seja um pouco específica,

        provavelmente voltada para bioinformatas.<br></div>

<div dir="ltr"> </div>

<div dir="ltr">

        Bom precisava fazer o download desse arquivo

(<a class="moz-txt-link-freetext" href="http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview">http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview</a>).<br></div>

<div dir="ltr"> </div>

<div dir="ltr">

        Só que não posso fazer de qualquer forma, precisava que fosse um

        script executando o wget ou ftp.<br></div>

<div dir="ltr"> </div>

<div dir="ltr">

        O problema é fazer o download através do wget que estou com

        dificuldade. <br></div>

<div dir="ltr"> </div>

<div dir="ltr">

        Seria basicamente um 'system 'wget .....'' só não estou sabendo

        como fazer.<br></div>

<div dir="ltr"> </div>

<div dir="ltr">

        Alguém aqui poderia me ajudar com o wget?<br></div>

<div dir="ltr"> </div>

<div dir="ltr">

        No final, só preciso gerar um arquivo no formato fasta.<br></div>

<div dir="ltr"> </div>

<div dir="ltr">

        Ex:<br></div>

<div dir="ltr">

        >gi|444893469|emb|AL123456.3| Mycobacterium tuberculosis

        H37Rv complete genome

        <span class="ff_line" id="gi_444893469_1">TTGACCGATGACCCCGGTTCAGGCTTCACCACAGTGTGGAACGCGGTCGTCTCCGAACTTAACGGCGACC</span> <span class="ff_line" id="gi_444893469_71">CTAAGGTTGACGACGGACCCAGCAGTGATGCTAATCTCAGCGCTCCGCTGACCCCTCAGCAAAGGGCTTG</span> <span class="ff_line" id="gi_444893469_141">GCTCAATCTCGTCCAGCCATTGACCATCGTCGAGGGGTTTGCTCTGTTATCCGTGCCGAGCAGCTTTGTC</span> <span class="ff_line" id="gi_444893469_211">CAAAACGAAATCGAGCGCCATCTGCGGGCCCCGATTACCGACGCTCTCAGCCGCCGACTCGGACATCAGA</span><br></div>

<div dir="ltr"> </div>

<div dir="ltr"> </div>

<div> </div>

<div> </div>

<pre>_______________________________________________

Rio-pm mailing list

<a class="moz-txt-link-abbreviated" href="mailto:Rio-pm@pm.org">Rio-pm@pm.org</a> <a class="moz-txt-link-freetext" href="http://mail.pm.org/mailman/listinfo/rio-pm">http://mail.pm.org/mailman/listinfo/rio-pm</a><br></pre></blockquote><div> </div>

<pre class="moz-signature">-- 

Felipe da Veiga Leprevost, PhD.

<a class="moz-txt-link-abbreviated" href="http://www.leprevost.com.br">www.leprevost.com.br</a>

Laboratory for Proteomics and Protein Engineering.

Fiocruz, Brazil.<br></pre><div>--<br></div><div>Felipe<br></div><div><br></div>

</body>

</html>