[Moscow.pm] Идеальный Map-ер и Reduce-ер

Ruslan Zakirov ruslan.zakirov на gmail.com
Пн Янв 19 05:40:41 PST 2009


2009/1/19 Михаил Монашёв <postmaster на softsearch.ru>:
> Здравствуйте.
>
> Вот  думаю  перейти с написания скриптов, обрабатывающих например всех
> юзеров,   к   написанию   функций   для  MapReduce.  А  потому,  хотел
> поинтересоваться, как народ в компаниях вроде Яндекса, Рамблера, Супа,
> Мыла и других реализует гугловский MapReduce?
>
> На  спане  нашёл http://search.cpan.org/dist/Parallel-MapReduce/ , что
> весьма любопытно.
>
> Как   например  решается  проблема  перекачки  и  накопления  большого
> количества данных между фазами Map и Reduce и между одним MapReduce-ом
> и другим MapReduce-ом?

Если использовать Memcached для шаринга, то можно на каждом воркере
иметь его и соответственно для reduce передавать работу согласно
алгоритму партишининга MemCached, чтобы результат маппинга сразу
оказывался на локальной машинке.

Хотя что-то MemCached не кажется удачным решением. Что интересно
делается в Parallel-MapReduce при переполнении кеша.

>
> --
>
> С уважением,
> Михаил Монашёв, SoftSearch.ru
> mailto:postmaster на softsearch.ru
> ICQ# 166233339
> http://michael.mindmix.ru/
> Без бэкапа по жизни.
>
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>



-- 
Best regards, Ruslan.


Подробная информация о списке рассылки Moscow-pm