<div class="gmail_quote">2011/7/26 Thiago Yukio Kikuchi Oliveira <span dir="ltr"><<a href="mailto:stratust@gmail.com">stratust@gmail.com</a>></span><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

Fazer o 'sort' de arquivos gigantes está sendo o problema da bioinformática ultimamente<br>(cada sequencia que eu recebo é um arquivo texto com 15GB de informação cada).<br><br>Perl não dá conta de fazer o sort pois faz tudo em memória.<br>


</blockquote><br>
Errado, não é o "Perl que faz tudo em memória". É a função se sort nativa do Perl que faz tudo em memória.<br><br>É perfeitamente possível realizar uma implementação do link que mandei acima... ou então tentar utilizar algum módulo pronto:<br>

<a href="http://search.cpan.org/~creamyg/Sort-External-0.18/lib/Sort/External.pm">http://search.cpan.org/~creamyg/Sort-External-0.18/lib/Sort/External.pm</a><br><a href="http://search.cpan.org/~creamyg/Sort-External-0.18/lib/Sort/External/Cookbook.pod">http://search.cpan.org/~creamyg/Sort-External-0.18/lib/Sort/External/Cookbook.pod</a><br>

<a href="http://search.cpan.org/~cnandor/File-Sort-1.01/Sort.pm">http://search.cpan.org/~cnandor/File-Sort-1.01/Sort.pm</a><br><br>2011/7/26 Thiago Yukio Kikuchi Oliveira <span dir="ltr"><<a href="mailto:stratust@gmail.com">stratust@gmail.com</a>></span><br>

<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Ultimamente estou usando mais multi-threads (temos 32 cores no servidor) do que processamento em paralelo (MPI).</blockquote>

<div><br>Creio que você queria dizer, processamento distribuído... pois paralelo você já está fazendo ao utilizar os 32 cores do seu servidor :) <br><br>[ ]'s<br></div></div>-- <br>Bruno C. Buss<br><a href="http://brunobuss.wordpress.com/">http://brunobuss.wordpress.com/</a><br>

<a href="http://www.dcc.ufrj.br/~brunobuss/">http://www.dcc.ufrj.br/~brunobuss/</a><br>