[SP-pm] Map Reduce

Alexei Znamensky russoz at gmail.com
Wed Jan 12 04:45:09 PST 2011


2011/1/12 Douglas Campos <douglas em theros.info>

> > Acho que não.
> > Logo, é algo que serve muito bem para quem tem esse filesystem.
> Linux-only,
> > provavelmente. Em 2011? Sorry, não vai decolar...
>
> Alexei, desliga o preconceito e dá uma olhada. O hadoop é bem legal
> (apesar de ser complicado pra caramba):
>

Não entendi. Qual preconceito?


> TL;DR
>

?


> O hadoop é uma plataforma de processamento distribuído, com um fs
> replicado distribuido tolerante à falhas (HDFS), implementado em
> userpace (o hdfs está em nível de aplicação, então funciona onde o
> java funcionar)
>

Ok, pode me chamar de velho, old-school, o que for. Mas na minha época,
file-system era algo que tinha alguma coisa a ver com o kernel do sistema
operacional. Mesmo com o uso cada vez menos incomum de "user space" file
systems hoje, sempre há um gancho no kernel. Por exemplo, sou um feliz
usuário de sshfs [1], mas ele precisa que o fuse [2] faça o gancho dentro do
kernel do Linux.

Dei uma lida rápida no começo da documentação do HDFS. Ok, entendi (em
linahs gerais) o que o cara quis fazer. Eu mudaria o nome de "filesystem"
para algo como "JVM-based filesystem" ou algo assim, para evitar
ambiguidades. But hey, that's just me.

Pessoalmente eu não sei se usaria algo em Java (+ pesado) para lidar com
algo que pode ter requerimentos de performance como I/O de dados. Algo em
Java dificilmente irá se aproveitar de coisas como tamanho do bloco no disco
físico para melhorar o desempenho. Em escala menor, isso não importa, mas se
falarmos de massas de dados gigantes, esse tipo de detalhe pode fazer
diferença. O HDFS será tão bom com os arquivos quanto for a implementação de
Java utilizada para rodá-lo. Espero *muito* que estejam usando java.nio.* -
não faria sentido se não usassem. Eu pensaria em algo feito em C/C++ para
implementar esse "file system", e que provesse essa funcionalidade
"genérica" em todas as plataformas onde fosse compilado, mas que pudesse se
proveitar de coisas como o FUSE no Linux para ser acessado diretamente como
um "real file system" (mesmo que em user-space), sem que isso tenha um custo
de performance tão alto.

yet another $0.02


> Usei ele pra IA, funciona que é uma beleza pra processar massas de
> dados estúpidas.
>
> >>> a mesma coisa alguns séculos atrás: dividir e conquistar.
> exatamente!
>
> []'z
> =begin disclaimer
>   Sao Paulo Perl Mongers: http://sao-paulo.pm.org/
>  SaoPaulo-pm mailing list: SaoPaulo-pm em pm.org
>  L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
> =end disclaimer
>



-- 
Alexei Znamensky [russoz_gmail_com] [russoz.wordpress.com] [
www.flickr.com/photos/alexeiz]
«Only love / Can bring the rain / That makes you yearn to the sky»
-------------- Pr�xima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/saopaulo-pm/attachments/20110112/16e3bda8/attachment.html>


More information about the SaoPaulo-pm mailing list