Acho que a ordenação nesse caso não é em cima dos arquivos de sequência em DNA, RNA, mas provavelmente<br>nas listas de arquivos FASTA e outros formatos. Normalmente são milhares ou até milhões de arquivos, dependendo do 'bicho', ou da 'salada'... uhauahauahauaha!!<br>
<br>Por aqui eu acabei implementando uma solução com o Sort::External mas somente se eu já não tiver a lista de arquivos ordenada por data, como eu precisava.<br><br>Para manter isso, o processo que cuida de gravar esses arquivos, também mantém um arquivo a parte, que é uma lista com os arquivos que são gravados. Essa lista segue exatamente a ordem de gravação dos arquivos, portanto a lista está ordenada pela data. A utilização do Sort::External só ocorre agora se, e somente se alguma coisa 'ruim' acontecer com essa lista.<br>
<br>A única coisa que eu fiz, foi adicionar o 'stat' do perl nos arquivos que eu comparo para ordenar e trocar o operador '<=>' para 'cmp' e 'badabim, badabum!'(Beakman)<br><br><br><codigo><br>
       use strict;<br>       use warnings;<br>       #definição de variáveis...<br><br>       <a href="http://pastebin.com/9kwNjgaq">http://pastebin.com/9kwNjgaq</a>       <br></codigo><br><br><br>Ainda preciso ver isso em produção. Mas acho que vai servir.<br>
<br>De qualquer forma, valeu pessoal!<br><br><br>Cheers!<br><br><br><div class="gmail_quote">2011/7/27 Eden Cardim <span dir="ltr"><<a href="mailto:edencardim@gmail.com">edencardim@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<div class="im">>>>>> "Thiago" == Thiago Yukio Kikuchi Oliveira <<a href="mailto:stratust@gmail.com">stratust@gmail.com</a>> writes:<br>
<br>
</div>    Thiago> Fazer o 'sort' de arquivos gigantes está sendo o problema da<br>
    Thiago> bioinformática ultimamente (cada sequencia que eu recebo é<br>
    Thiago> um arquivo texto com 15GB de informação cada).<br>
<br>
Hmm, presumo que você esteja falando de cadeias de DNA/RNA, estou<br>
curioso pra saber qual a relevância científica de se fazer sort numa<br>
sequência de DNA já que você vai sempre acabar com algo parecido com<br>
"AAAAAACCCCCCGGGGGTTTTT".<br>
<div class="im"><br>
--<br>
   Eden Cardim       Need help with your Catalyst or DBIx::Class project?<br>
  Code Monkey                    <a href="http://www.shadowcat.co.uk/catalyst/" target="_blank">http://www.shadowcat.co.uk/catalyst/</a><br>
 Shadowcat Systems Ltd.  Want a managed development or deployment platform?<br>
<a href="http://blog.edencardim.com/" target="_blank">http://blog.edencardim.com/</a>            <a href="http://www.shadowcat.co.uk/servers/" target="_blank">http://www.shadowcat.co.uk/servers/</a><br>
<a href="http://twitter.com/#%21/edenc" target="_blank">http://twitter.com/#!/edenc</a><br>
</div><div><div></div><div class="h5">=begin disclaimer<br>
   Sao Paulo Perl Mongers: <a href="http://sao-paulo.pm.org/" target="_blank">http://sao-paulo.pm.org/</a><br>
 SaoPaulo-pm mailing list: <a href="mailto:SaoPaulo-pm@pm.org">SaoPaulo-pm@pm.org</a><br>
 L<<a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a>><br>
=end disclaimer<br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>André Garcia Carneiro<br>Analista/Desenvolvedor Perl<br>(11)82907780<br>