Basicamente temos dados de projetos de sequenciamento de genomas que são compostos das quatro letras referentes aos nucleotídeos: A,T,G ou C dispostos em ordem não-aleatórias. Essas sequencias formam estruturas gênicas. Os genes são sequencias do DNA que codificam uma proteína (uma proteína é uma sequência de aminoácidos). Cada sequencia de 3 nucleotídeos codifica um determinado aminoácido.<div>

Temos 4 nucleotídeos e 20 aminoácidos. Se pegarmos esses 4 aminoácidos e fizermos todas as combinações possíveis de 3 em tres (códons) teriamos 64 possiveis combinações (4X4X4, ex: ATC, TAC, AAT, CCC, CCA), dessa forma para o mesmo aminoácido temos mais de um possivel códon que o codifica e já são todos conhecidos:</div>

<div><a href="http://www.biomania.com.br/bio/imagens/50112/tab.gif">http://www.biomania.com.br/bio/imagens/50112/tab.gif</a> (Nessa tabela o U substitui o nucleotídeo T, já que quando o gene é transcrito em RNA mensageiro o T-timina é trocado pelo U-uracila). </div>

<div>Para o mecanismo da celula reconhecer a região onde a proteina tem q parar de ser codificada existem os STOP códons formados pelos códons TAA TAG e TGA. Ou seja, sempre que aparecer esses nucleotídeos o gene acaba. A maioria (99,9%) dos genes começa com o aminoácido Metionina codificado pelo códon ATG</div>

<div><br></div><div><br></div><div>Mas o genoma não é só composto de genes. Entre os genes existem as regiões intergênicas. Uma aplicação básica da bioinformática é encontrar o maior numero de genes num determinado genoma. Em organismos mais simples podemos procurar por genes buscando um ATG e procurando o próximo códon de terminação. Se essa sequencia for suficientemente longa &gt;200 nucleotídeos podemos considerar como um gene hipotético. Isso por que nas regiões intergênicas (que são praticamente aleatórias) temos uma frequencia de 1 stop códon a cada 50 nucleotídeos.</div>

<div><br></div><div>Os genomas estão armazenados em arquivos no formato fasta que é muito simples, temos uma linha cabeçalho que começa com um sinal de maior &quot;&gt;&quot; seguido da descrição da sequencia (pode ser qualquer coisa) e abaixo segue a sequencia de nucleotídeos, abaixo um exemplo:</div>

<div><br></div><div>&gt;sequencia1 bla bla bla</div><div>AGCGACTAGCAGCGACTACGAGCATCAGCATCGACATCAGCT</div><div>GCATGCTACGACTGAGCATCGACTAGCATCAGTGCACTGATC</div><div>CGAGCGACTACGATCAGCATCGACT</div><div>&gt;sequencia 2 bla bla bla</div>

<div>GCATCAGCATCGACGTACGATCAGCATGCACTGACATCTAGCGTA</div><div>GCATCAGCTACGATCGATGCATGCTGATGCATGCTGTCTTCTCGAT</div><div><br></div><div>Então o perl é muito útil para manipular arquivos desse tipo e desenvolver scripts para procurar padrões (expressões regulares).</div>

<div><br></div><div>Bom, essa é uma das aplicações entre várias. 90% dos programas que os bioinformatas utilizam são feitos em perl. </div><div>Além de buscar genes, existem programas para encontrar sobreposição entre sequencias, calcular rearranjos, etc etc.</div>

<div>E todos eles usam outputs fáceis de parsear com expressões regulares.</div><div><br></div><div><br></div><div><br></div><div><br></div><div><br><div><br></div><div><br clear="all">Ramon Vidal<br><br>Laboratório de Genômica e Expressão - LGE<br>

Universidade Estadual de Campinas - UNICAMP<br><br><br>
<br><br><div class="gmail_quote">2010/3/5 Nelson Ferraz <span dir="ltr">&lt;<a href="mailto:nferraz@gmail.com">nferraz@gmail.com</a>&gt;</span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

2010/3/4 Ramon Vidal &lt;<a href="mailto:ramon.vidal@gmail.com">ramon.vidal@gmail.com</a>&gt;:<br>
<div class="im">&gt; Opa, falai pessoal, eu trabalho com bioinformática aqui na Unicamp e utilizo<br>
&gt; perl no meu dia a dia para manipulação de sequencias de DNA, proteina<br>
&gt; contruir pipelines, parsear arquivos, interface com banco de dados mysql e o<br>
&gt; que vier.<br>
<br>
</div>Aqui na comunidade tem muito leigo em biologia... você pode nos contar<br>
um pouco da aplicacão prática de tudo isso? (manipulação de sequencias<br>
de DNA, etc)<br>
<br>
Em que projetos você está envolvido? Qual a importância de Perl na sua área?<br>
<div><div></div><div class="h5">_______________________________________________<br>
SaoPaulo-pm mailing list<br>
<a href="mailto:SaoPaulo-pm@pm.org">SaoPaulo-pm@pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a><br>
</div></div></blockquote></div><br></div></div>