[SP-pm] Biotecnologia, BioPerl, Casos de Sucesso [Was: Boas vindas ao Wagner Arbex]

Andre Carneiro andregarciacarneiro at gmail.com
Thu Dec 4 06:08:15 PST 2008


2008/12/4 Nelson Ferraz <nferraz at gmail.com>

> 2008/12/4 Andre Carneiro <andregarciacarneiro at gmail.com>:
> > Opa, eu tô!!
> >
> > Do que exatamente você precisa para publicar esses 'casos de sucesso'?
>
> Oi André,
>
> Em primeiro lugar, obrigado pelo último artigo que você publicou
> (sobre parsing de HTML com HTML::TreeBuilder).
>

Eu é que agradeço a oportunidade de contribuir...


>
> Eu achei particularmente interessante a forma como isto foi feito:
> comecou com uma discussão aqui na lista e terminou publicado no wiki.
>

Tomara que isso sirva como inspiração para outras pessoas que ficam tão
tímidas quanto eu, quando o assunto é publicar alguma coisa...rsrs!!


>
> Sendo assim, se você quiser comecar novamente na lista, pode comecar
> nos contando o seguinte:
>
> 1) Qual foi a organizacão com que você teve essa experiência de Perl e
> bioinformática?
>

ESALQ(Escola Superior de Agricultura Luis de Queiroz)/USP, no departamento
de fitopatologia, no laboratório de genética molecular.


>
> 2) Qual era o problema que vocês procuravam resolver?


O projeto que eu tinha mais contato era um projeto de genoma comparativo
entre as bactérias leifsonya xyli xyli, e leifsonya xyli cynodontis. A
primeira na verdade era o alvo de investigação, já que causava uma doença em
cana-de-açúcar. O objetivo era encontrar genes comparando as duas bactérias,
para tentar encontrar genes que pudessem ajudar a resolver o problema com a
cana-de-açúcar.

Nós usávamos um pacote de um sistema pronto para a montagem das sequências,
que se chamava Phred/Phrap/Consed, que fazia uma pré-organização dos
arquivos em formato FASTA(depois eu procuro referências sobre isso), e tinha
um modo gráfico(Consed) que ajudava a visualizar essas montagens, para
analizar quais outras sequencias colocaríamos para fechar os chamados
'gaps'. Para isso, utilizávamos um sistema de banco de dados de genomas
público(GeneBank), onde submetíamos parte da sequência para que ele nos
retornassem outros arquivos FASTA, para completar as sequencias(não
necessariamente dos mesmos organismos). Inicialmente, fazia isso de forma
manual, utilizando o site, através de um sistema chamado BLAST. O Blast,
basicamente recebia a sequência que eu passava para ele e retornava arquivos
FASTA que possivelmente poderiam ser úteis. Para medir isso, existem vários
parâmetros de 'erro' e porcentagens de 'match', que tinha que observar para
completar a montagens das sequências. Inicialmente eu fazia isso utilizando
ferramentas públicas de pesquisa no próprio site do Gene Bank e em outros
sites, mas isso era trabalhoso, e tedioso, até que descobri o BioPerl.

Mas antes de BioPerl, eu já utilizava perl para produzir ferramentas de
visualização e monitoramento das montagens, e pesquisa de sequências, de
maneira bem simples, porque estava começando a aprender perl(não que tenha
terminado de aprender rrsrs).

O BioPerl é um projeto que reúne inúmeras ferramentas úteis para quem
trabalha com bioinformática, sendo que uma delas é o módulo para tratar
arquivos FASTA, e para se comunicar com bancos de dados que tem interface
com o BLAST. Isto facilitou muito a minha vida e permitiu que eu conseguisse
fazer diversas ferramentas de monitoramento das montagens que os
pesquisadores me pediam. Infelizmente eu não tenho como mostrá-las pois isso
fica(ou costumava ficar) em uma extranet que não tenho mais acesso.


>
> 3) Como Perl entrou nessa história? Por que vocês escolheram Perl?
> Quantas pessoas estiveram envolvidas?
>

Bom, tradicionalmente se utiliza perl para tratar questões de
bioinformática, principalmente porque perl é 'famoso' por ser bom em tratar
dados em formato texto, e por facilitar a vida quando se trata de produzir
aplicativos para a web(lembre-se, que estávamos em meados de 2002, a maioria
das aplicações web feitas em perl era CGI).


>
> 4) O projeto terminou? Qual foi o resultado?
>

O projeto terminou sim, mas com outro pesquisador, pois a minha orientadora
deixou o projeto para trabalhar fora do país. Eu ainda não sei o resultado
para dizer a verdade, pois quando eu saí do estágio, o projeto ainda estava
em andamento. Mas vou procurar saber para postar.


>
> 5) O que você pode nos contar mais, sobre a utilizacão de Perl neste
> segmento?
>

Bom, eu posso contar baseado na minha vivência daquela época. Como perl tem
um motor excelente para tratar expressões regulares, e diversos parsers
disponíveis, e uma imensidão de módulos no CPAN, utiliza-se perl nesse meio
para praticamente tudo. Desde o processamento de sequências, até
visualização de imagens, banco de dados, documentação com LATEX, enfim...
muita coisa !


>
> []s
>
> Nelson
> _______________________________________________
> SaoPaulo-pm mailing list
> SaoPaulo-pm at pm.org
> http://mail.pm.org/mailman/listinfo/saopaulo-pm
>



-- 
André Garcia Carneiro
Analista/Desenvolvedor Perl
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://mail.pm.org/pipermail/saopaulo-pm/attachments/20081204/adb48cc8/attachment-0001.html>


More information about the SaoPaulo-pm mailing list