[SP-pm] ordenando arquivos.

Thiago Yukio Kikuchi Oliveira stratust at gmail.com
Tue Jul 26 12:55:16 PDT 2011


2011/7/26 Bruno Buss <bruno.buss em gmail.com>

> 2011/7/26 Thiago Yukio Kikuchi Oliveira <stratust em gmail.com>
>
>> Fazer o 'sort' de arquivos gigantes está sendo o problema da
>> bioinformática ultimamente
>> (cada sequencia que eu recebo é um arquivo texto com 15GB de informação
>> cada).
>>
>> Perl não dá conta de fazer o sort pois faz tudo em memória.
>>
>
> Errado, não é o "Perl que faz tudo em memória". É a função se sort nativa
> do Perl que faz tudo em memória.
>

Se a função nativa não é o "Perl" então eu não sei o que é.


>
> É perfeitamente possível realizar uma implementação do link que mandei
> acima... ou então tentar utilizar algum módulo pronto:
>

Implementar o sort externo pode ser feito em qualquer linguagem, e como você
demonstrou já existe em Perl.
Porém, acredito que linguagens de mais baixo nivel, C por exemplo, são
melhores quando você quer realizar uma tarefa específica que exige
processamento intesivo.

Por exemplo, estou utilizando o nsort que é feito em C e utiliza threads
para o sorting. Ele ordena 1TB em 33 minutos em um PC comum com multicore.


Creio que você queria dizer, processamento distribuído... pois paralelo você
> já está fazendo ao utilizar os 32 cores do seu servidor :)
>

Ops, erro meu, quis dizer processamento distribuido utilizando MPI
-------------- Pr?xima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/saopaulo-pm/attachments/20110726/ae84a52a/attachment.html>


More information about the SaoPaulo-pm mailing list