[Rio-pm] [HELP] Download

Felipe da Veiga Leprevost leprevostfv em gmail.com
Quinta Novembro 6 02:27:54 PST 2014


Oi Aureliano,


      Não sei se você já ouviu falar do NCBI Entrez Direct ou se já o
      utilizou alguma vez, ams nesse caso acredito que ele possa ser
      mais útil. O Entrez Direct é um conjunto de scripts bash e Perl
      que o NCBI forneceu para que quisesse realizar algum tipo de
      acesso mais "avançado" aos seus bancos de dados, e de forma
      programática.


      veja aqui mais informações sobre o

      Entrez Direct: http://www.ncbi.nlm.nih.gov/books/NBK179288/


      Bom, vamos ao seu problema agora; O que você está querendo fazer é
      baixar pelo terminal uma sequencia do banco de nucleotídeos certo?
      De acordo com a documentação do Entrez Direct você vai precisar
      usar o seguinte comando:


      ./esearch -db nucleotide -query "AL123456 [ACN]" | ./efetch
      -format fasta


      O eDirect funciona encadeando os scripts, nesse caso eu estou
      usando 2 deles, o esearch para a busca e o efetch para o download.
      Você pode ver na página do livro (o link que passei acima) todos
      os parâmetros que existem, da pra fazer muita coisa com esses
      scripts deles.


      Então, para salvar em um arquivo a sequencia do genoma basta
      direcionar o comando acima:


      ./esearch -db nucleotide -query "AL123456 [ACN]" | ./efetch
      -format fasta > genome.fa


      e pronto, seu genoma foi baixado e salvo.


      Espero que dessa forma você consiga contornar o problema que lhe
      impedia de usar o wget ou o ftp para o download.


      abraços



On 05-11-2014 23:57, Aureliano Guedes wrote:
> Ola Monges,
>
>
        tenho uma dúvida que talvez seja um pouco específica,
        provavelmente voltada para bioinformatas.
>
>
        Bom precisava fazer o download desse arquivo
        (http://www.ncbi.nlm.nih.gov/nuccore/AL123456.3?report=fasta&log$=seqview).
>
>
        Só que não posso fazer de qualquer forma, precisava que fosse um
        script executando o wget ou ftp.
>
>
        O problema é fazer o download através do wget que estou com
        dificuldade.
>
>
        Seria basicamente um 'system 'wget .....'' só não estou sabendo
        como fazer.
>
>
        Alguém aqui poderia me ajudar com o wget?
>
>
        No final, só preciso gerar um arquivo no formato fasta.
>
>
        Ex:
>
>gi|444893469|emb|AL123456.3| Mycobacterium tuberculosis
        H37Rv complete genome
        TTGACCGATGACCCCGGTTCAGGCTTCACCACAGTGTGGAACGCGGTCGTCTCCGAACTTAACGGCGACC
        CTAAGGTTGACGACGGACCCAGCAGTGATGCTAATCTCAGCGCTCCGCTGACCCCTCAGCAAAGGGCTTG
        GCTCAATCTCGTCCAGCCATTGACCATCGTCGAGGGGTTTGCTCTGTTATCCGTGCCGAGCAGCTTTGTC
        CAAAACGAAATCGAGCGCCATCTGCGGGCCCCGATTACCGACGCTCTCAGCCGCCGACTCGGACATCAGA
>
>
>
>
> _______________________________________________
Rio-pm mailing list
> Rio-pm em pm.org http://mail.pm.org/mailman/listinfo/rio-pm

--
Felipe da Veiga Leprevost, PhD. www.leprevost.com.br Laboratory for
Proteomics and Protein Engineering. Fiocruz, Brazil.
--
Felipe

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20141106/79309738/attachment.html>


Mais detalhes sobre a lista de discussão Rio-pm