[Madrid-pm] Nueva herramienta para procesar la ingente cantidad de textos de la web

Roberto Henriquez roberto en freekeylabs.com
Mie Dic 3 00:12:58 PST 2014


On 12/03/2014 06:25 AM, Alex Muntada wrote:
> Para más inri está escrito en python, casi parece una broma...
>
> Lo de que sea más rápido en java parece ser por el modo de ejecución de
> hadoop para lenguajes no java.
>

Eso es lo que yo entiendo, según el readme: «Even though Hadoop 
Streaming is a very useful tool, important degradations in the 
performance were detected using Hadoop Streaming with respect to Hadoop 
Java codes.»

Parece que el problema viene de algún overhead de Hadoop Streaming.

saludos!
-- 
Roberto Henríquez
roberto en freekeylabs.com


Más información sobre la lista de distribución Madrid-pm