[SP-pm] Boas Vindas ao Fabio Navarro

Fábio C. P. Navarro fabiocpn at gmail.com
Fri Mar 5 05:39:29 PST 2010


Nelson e Alexei,


> Percebo que este é o objetivo imediato -- mas qual o objetivo final,
> pelo qual é feito este sequenciamento? Quais são os objetivos da
> pesquisa?
>

Não tão imediatos assim, o sequenciamento e estudo de um genoma completo (
que é onde estamos trabalhando agora ) demora meses/anos, parece trivial,
mas te garanto, não é :)
O nosso objetivo final é compreender melhor a genética do câncer, como ele
surge, pra onde ele vai e como vai. Posso dar mais detalhes biológicos dos
projetos, mas acho pertinente ser pessoalmente já que isso foge um pouco do
foco da lista.

Fábio, fiquei curioso: as sequências de DNA são armazenadas como um arquivo
> texto, simples? Daí é só rodar uma regex em cima? Ou são usados arquivos
> DB, gdbm ou algum outro tipo de armazenamento mais específico para esse
> tipo de sistema?
>

Alexei, existem várias formar de atacar o problema, portanto nem todo mundo
usa a abordagem descrita. "Classicamente" equipamentos sequenciadores de DNA
tem como saida 2 arquivos: Um com a sequência de nucleotídeos (ACTG) ( no
formato fasta[1]) e outro com a qualidade dos reads.
Então, a principio sim. Sequências de DNA/RNA são armazenadas como arquivo
texto simples. Isso pode parecer "estupido", mas tem justificativa: Como o
processo de sequenciamento está longe de ser perfeito é necessário fazer uma
triagem do que realmente pode ser utilizado para extração da informação. Não
sei se valeria a pena usar DB pra essa tarefa, usamos DB posteiormente
quando os dados passam a ser informação e o volume diminui bastante (na
ordem dos Gbs) .

Abraços,
Fábio Navarro


[1] http://en.wikipedia.org/wiki/FASTA_format

2010/3/5 Alexei Znamensky <russoz at gmail.com>

> 2010/3/5 Fábio C. P. Navarro <fabiocpn at gmail.com>
>
> Nelson,
>>
>> Formalmente perl não é utilizado nas matérias do currículo. Os professores
>> dão maior enfase em C,C++ e Java, (passando por algumas linguagens
>> funcionais e lógicas). Porém não sei te dizer se alguma disciplina opcional
>> usa perl como linguagem de programação. Posso estar enganado, mas acredito
>> que nenhum professor seja especialista em perl.
>>
>
> Pois é, estamos tentando mudar isso, mas é um processo bem lento. E
> doloroso. :-)
>
>
>> Quanto aos meus projetos atuais, trabalhamos com sequenciamento de DNA e
>> RNA de linhagens e tecidos celulares normais e tumorais. Mais
>> especificamente, sob uma perspetiva mais bioinformata, o que fazemos é
>> processar uma quantidade grande de dados (na casa de centenas de gigas)
>> procurando por caracteristicas desejadas. Perl me parece ser uma boa escolha
>> nestes casos pelas facilidades de uso de regex e pelas suas estruturas de
>> dados (hashes são uma ao na roda!).
>>
>
> Fábio, fiquei curioso: as sequências de DNA são armazenadas como um arquivo
> texto, simples? Daí é só rodar uma regex em cima? Ou são usados arquivos DB,
> gdbm ou algum outro tipo de armazenamento mais específico para esse tipo de
> sistema?
>
> []s,
> Russo
>
> --
> Alexei Znamensky [russoz_gmail_com] [russoz.wordpress.com] [
> www.flickr.com/photos/alexeiz]
> "Though we live in trying times, we're the ones who have to try"
>
> _______________________________________________
> SaoPaulo-pm mailing list
> SaoPaulo-pm at pm.org
> http://mail.pm.org/mailman/listinfo/saopaulo-pm
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://mail.pm.org/pipermail/saopaulo-pm/attachments/20100305/8732841f/attachment.html>


More information about the SaoPaulo-pm mailing list