[Madrid-pm] Nueva herramienta para procesar la ingente cantidad de textos de la web
Roberto Henriquez
roberto en freekeylabs.com
Mie Dic 3 00:12:58 PST 2014
On 12/03/2014 06:25 AM, Alex Muntada wrote:
> Para más inri está escrito en python, casi parece una broma...
>
> Lo de que sea más rápido en java parece ser por el modo de ejecución de
> hadoop para lenguajes no java.
>
Eso es lo que yo entiendo, según el readme: «Even though Hadoop
Streaming is a very useful tool, important degradations in the
performance were detected using Hadoop Streaming with respect to Hadoop
Java codes.»
Parece que el problema viene de algún overhead de Hadoop Streaming.
saludos!
--
Roberto Henríquez
roberto en freekeylabs.com
Más información sobre la lista de distribución Madrid-pm