<div>Nelson e Alexei, <br> <br></div><blockquote style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;" class="gmail_quote">Percebo que este é o objetivo imediato -- mas qual o objetivo final,<br>



pelo qual é feito este sequenciamento? Quais são os objetivos da<br>
pesquisa?<br></blockquote><div> </div>Não tão imediatos assim, o sequenciamento e estudo de um genoma completo ( que é onde estamos trabalhando agora ) demora meses/anos, parece trivial, mas te garanto, não é :)<br>O nosso objetivo final é compreender melhor a genética do câncer, como ele surge, pra onde ele vai e como vai. Posso dar mais detalhes biológicos dos projetos, mas acho pertinente ser pessoalmente já que isso foge um pouco do foco da lista.<br>


<br><blockquote style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;" class="gmail_quote">Fábio, fiquei curioso: as
sequências de DNA são armazenadas como um arquivo texto, simples? Daí é
só rodar uma <span style="background: yellow none repeat scroll 0% 0%; -moz-background-clip: border; -moz-background-origin: padding; -moz-background-inline-policy: continuous;">regex</span> em cima? Ou são usados arquivos <span style="background: yellow none repeat scroll 0% 0%; -moz-background-clip: border; -moz-background-origin: padding; -moz-background-inline-policy: continuous;">DB</span>, <span style="background: yellow none repeat scroll 0% 0%; -moz-background-clip: border; -moz-background-origin: padding; -moz-background-inline-policy: continuous;">gdbm</span> ou algum
outro tipo de armazenamento mais específico para esse tipo de sistema?<br></blockquote><br>Alexei, existem várias formar de atacar o problema, portanto nem todo mundo usa a abordagem descrita. &quot;Classicamente&quot; equipamentos sequenciadores de DNA tem como saida 2 arquivos: Um com a sequência de nucleotídeos (ACTG) ( no formato fasta[1]) e outro com a qualidade dos reads. <br>


Então, a principio sim. Sequências de DNA/RNA são armazenadas como arquivo texto simples. Isso pode parecer &quot;estupido&quot;, mas tem justificativa: Como o processo de sequenciamento está longe de ser perfeito é necessário fazer uma triagem do que realmente pode ser utilizado para extração da informação. Não sei se valeria a pena usar DB pra essa tarefa, usamos DB posteiormente quando os dados passam a ser informação e o volume diminui bastante (na ordem dos Gbs) .<br>


<br>Abraços,<br>Fábio Navarro<br><br><br>[1] <a href="http://en.wikipedia.org/wiki/FASTA_format" target="_blank">http://en.wikipedia.org/wiki/FASTA_format</a><br><div class="gmail_quote">
<br>2010/3/5 Alexei Znamensky <span dir="ltr">&lt;<a href="mailto:russoz@gmail.com" target="_blank">russoz@gmail.com</a>&gt;</span><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">


<div class="gmail_quote">2010/3/5 Fábio C. P. Navarro <span dir="ltr">&lt;<a href="mailto:fabiocpn@gmail.com" target="_blank">fabiocpn@gmail.com</a>&gt;</span><div><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">




Nelson, <br><br>Formalmente perl não é utilizado nas matérias do currículo. Os professores dão maior enfase em C,C++ e Java, (passando por algumas linguagens funcionais e lógicas). Porém não sei te dizer se alguma disciplina opcional usa perl como linguagem de programação. Posso estar enganado, mas acredito que nenhum professor seja especialista em perl.<br>




</blockquote><div><br></div></div><div>Pois é, estamos tentando mudar isso, mas é um processo bem lento. E doloroso. :-)</div><div><div> </div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">




Quanto aos meus projetos atuais, trabalhamos com sequenciamento de DNA e RNA de linhagens e tecidos celulares normais e tumorais. Mais especificamente, sob uma perspetiva mais bioinformata, o que fazemos é processar uma quantidade grande de dados (na casa de centenas de gigas) procurando por caracteristicas desejadas. Perl me parece ser uma boa escolha nestes casos pelas facilidades de uso de regex e pelas suas estruturas de dados (hashes são uma ao na roda!).<br>




</blockquote><div><br></div></div><div>Fábio, fiquei curioso: as sequências de DNA são armazenadas como um arquivo texto, simples? Daí é só rodar uma regex em cima? Ou são usados arquivos DB, gdbm ou algum outro tipo de armazenamento mais específico para esse tipo de sistema?</div>




<div><br></div><div>[]s,</div><div>Russo</div><div><br></div></div><font color="#888888">-- <br></font><div><div></div><div>Alexei Znamensky [russoz_gmail_com] [<a href="http://russoz.wordpress.com" target="_blank">russoz.wordpress.com</a>] [<a href="http://www.flickr.com/photos/alexeiz" target="_blank">www.flickr.com/photos/alexeiz</a>]<br>




&quot;Though we live in trying times, we&#39;re the ones who have to try&quot;<br>
</div></div><br>_______________________________________________<br>
SaoPaulo-pm mailing list<br>
<a href="mailto:SaoPaulo-pm@pm.org" target="_blank">SaoPaulo-pm@pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a><br></blockquote></div><br>