<br><div class="gmail_quote">2011/7/26 Bruno Buss <span dir="ltr"><<a href="mailto:bruno.buss@gmail.com">bruno.buss@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

<div><div class="im">2011/7/26 Thiago Yukio Kikuchi Oliveira <span dir="ltr"><<a href="mailto:stratust@gmail.com" target="_blank">stratust@gmail.com</a>></span><br><blockquote class="gmail_quote" style="border-left:1px solid rgb(204, 204, 204);margin:0pt 0pt 0pt 0.8ex;padding-left:1ex">



Fazer o 'sort' de arquivos gigantes está sendo o problema da bioinformática ultimamente<br>(cada sequencia que eu recebo é um arquivo texto com 15GB de informação cada).<br><br>Perl não dá conta de fazer o sort pois faz tudo em memória.<br>




</blockquote><br></div>
Errado, não é o "Perl que faz tudo em memória". É a função se sort nativa do Perl que faz tudo em memória.<br></div></blockquote><div><br>Se a função nativa não é o "Perl" então eu não sei o que é.<br>

 </div><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;"><div><br>É perfeitamente possível realizar uma implementação do link que mandei acima... ou então tentar utilizar algum módulo pronto:<br>

</div></blockquote><div> </div><div>Implementar o sort externo pode ser feito em qualquer linguagem, e como você demonstrou já existe em Perl. <br>
Porém, acredito que linguagens de mais baixo nivel, C por exemplo, são 
melhores quando você quer realizar uma tarefa específica que exige 
processamento intesivo.<br>
<br>
Por exemplo, estou utilizando o nsort que é feito em C e utiliza threads para o sorting. Ele ordena 1TB em 33 minutos em um PC comum com multicore.<br> </div><br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">

<div class="gmail_quote"><div>Creio que você queria dizer, processamento distribuído... pois paralelo você já está fazendo ao utilizar os 32 cores do seu servidor :) <br></div></div></blockquote></div><br>Ops, erro meu, quis dizer processamento distribuido utilizando MPI<br>