<br><div class="gmail_quote">2011/7/28 Bruno Buss <span dir="ltr"><<a href="mailto:bruno.buss@gmail.com" target="_blank">bruno.buss@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">


<div class="gmail_quote"><div><div><br></div></div><div>Só de curiosidade, como vocês fazem a contagem de overlaps após terem as sequências ordenadas?</div><div>(Eu não trabalho nem nunca estudei isso em específico, então desculpa se for uma pergunta besta :)</div>


</div></blockquote><div><br> Bem existem várias maneiras de fazer isso.<br>Já vi gente indo na força bruta. Ao invés de fazer o sort no arquivo de alinhamento, eles criam um arquivo<br>para cada cromossomo com cada coordenada repetida e fazem o sort nesse arquivo.<br>

<br>Por exemplo, o arquivo de alinhamento é assim:<br>#chromossomo #start #end<br>chr1 1 5<br>chr1 3 8<br><br>Esse arquivo pode ser representado graficamente assim:<br><br>chr1: <br>linha1: -----<br>linha2:   -----<br><br>

Eles criam um arquivo chr1.txt com uma coluna com todas as posições que o arquivo de alinhamento mostra:<br>chr1.txt:<br># 1 até 5 <br>1<br>2<br>3<br>4<br>5<br># 3 até 8<br>3<br>4<br>5<br>6<br>7<br>8<br><br>Fazendo o sort desse arquivo temos:<br>

chr1.txt.sorted<br>1<br>2<br>3<br>3<br>4<br>4<br>5<br>5<br>6<br>7<br>8<br><br><br>Parseando chr1.txt.sorted com um script em perl e contanto o que é repetida podemos fazer a cobertura de cada posição:<br><br>1 -> 1<br>

2 -> 1<br>3 -> 2<br>4 -> 2<br>5 -> 2<br>6 -> 1<br>7 -> 1<br>8 -> 1<br><br>Eu uso uma estratégia diferente. Vou explicar num outro e-mail, pois tenho que sair agora.<br><br>[ ]'s<br><br></div></div>

<br clear="all">    /    Thiago Yukio Kikuchi Oliveira<br>(=\  <br>  \=) Faculdade de Medicina de Ribeirão Preto<br>   /   Laboratório de Genética Molecular e Bioinformática<br>  /=) -----------------------------------------------------------------<br>


(=/   Centro de Terapia Celular/CEPID/FAPESP - Hemocentro de Rib. Preto<br>  /    Rua Tenente Catão Roxo, 2501 CEP 14151-140<br>(=\   Ribeirão Preto - São Paulo<br>  \=) Fone: 55 16 2101-9300   Ramal: 9603<br>   /   E-mail: <a href="mailto:stratus@lgmb.fmrp.usp.br" target="_blank">stratus@lgmb.fmrp.usp.br</a><br>


  /=)            <a href="mailto:stratust@gmail.com" target="_blank">stratust@gmail.com</a><br>(=/  <br>  /    Bioinformatic Team - BiT: <a href="http://lgmb.fmrp.usp.br" target="_blank">http://lgmb.fmrp.usp.br</a><br>(=\   Hemocentro de Ribeirão Preto: <a href="http://pegasus.fmrp.usp.br" target="_blank">http://pegasus.fmrp.usp.br</a><br>


  \=)<br>   /  -----------------------------------------------------------------<br>
<br><br>