[SP-pm] Biotecnologia, BioPerl, Casos de Sucesso [Was: Boas vindas ao Wagner Arbex]

Nelson Ferraz nferraz at gmail.com
Thu Dec 4 06:27:09 PST 2008


>> Eu achei particularmente interessante a forma como isto foi feito:
>> comecou com uma discussão aqui na lista e terminou publicado no wiki.
>
> Tomara que isso sirva como inspiração para outras pessoas que ficam tão
> tímidas quanto eu, quando o assunto é publicar alguma coisa...rsrs!!

Tomara! :)

Bom... depois de tudo isso que você escreveu, acho que já temos a
semente do artigo.

Minha única sugestão é usar a terceira pessoa ("eles", ao invés de
"nós/eu"). Por exemplo:

---

Um projeto no ESALQ (Escola Superior de Agricultura Luis de
Queiroz)/USP, no departamento de fitopatologia, no laboratório de
genética molecular, tinha como objetivo encontrar genes comparando
duas bactérias,  leifsonya xyli xyli, e leifsonya xyli cynodontis,
para tentar encontrar genes que pudessem ajudar a resolver uma doença
em cana-de-açúcar.

André Garcia Carneiro, então pesquisador do ESALQ, conta: "Nós
usávamos um pacote de um sistema pronto para a montagem das
sequências, que se chamava Phred/Phrap/Consed, que fazia uma
pré-organização dos arquivos em formato FASTA(depois eu procuro
referências sobre isso), e tinha um modo gráfico(Consed) que ajudava a
visualizar essas montagens, para analizar quais outras sequencias
colocaríamos para fechar os chamados 'gaps'. Para isso, utilizávamos
um sistema de banco de dados de genomas público(GeneBank), onde
submetíamos parte da sequência para que ele nos retornassem outros
arquivos FASTA, para completar as sequencias(não necessariamente dos
mesmos organismos). Inicialmente, fazia isso de forma manual,
utilizando o site, através de um sistema chamado BLAST. O Blast,
basicamente recebia a sequência que eu passava para ele e retornava
arquivos FASTA que possivelmente poderiam ser úteis. Para medir isso,
existem vários parâmetros de 'erro' e porcentagens de 'match', que
tinha que observar para completar a montagens das sequências.
Inicialmente eu fazia isso utilizando ferramentas públicas de pesquisa
no próprio site do Gene Bank e em outros sites, mas isso era
trabalhoso, e tedioso, até que descobri o BioPerl."

O BioPerl é um projeto que reúne inúmeras ferramentas úteis para quem
trabalha com bioinformática, sendo que uma delas é o módulo para
tratar arquivos FASTA, e para se comunicar com bancos de dados que tem
interface com o BLAST. "Isto facilitou muito a minha vida e permitiu
que eu conseguisse fazer diversas ferramentas de monitoramento das
montagens que os pesquisadores me pediam" conta André. "Como perl tem
um motor excelente para tratar expressões regulares, e diversos
parsers disponíveis, e uma imensidão de módulos no CPAN, utiliza-se
perl nesse meio para praticamente tudo. Desde o processamento de
sequências, até visualização de imagens, banco de dados, documentação
com LATEX, enfim... muita coisa !"

---

Algo assim. :)


More information about the SaoPaulo-pm mailing list