[Moscow.pm] Идеальный Map-ер и Reduce-ер
Монашёв Михаил
postmaster на softsearch.ru
Пн Янв 19 05:57:34 PST 2009
Здравствуйте, Руслан.
> Если использовать Memcached для шаринга, то можно на каждом воркере
> иметь его и соответственно для reduce передавать работу согласно
> алгоритму партишининга MemCached, чтобы результат маппинга сразу
> оказывался на локальной машинке.
> Хотя что-то MemCached не кажется удачным решением. Что интересно
> делается в Parallel-MapReduce при переполнении кеша.
Ничего не делается :-)
Мемкашед тут совсем не к месту. У него например ограничение в 1М на
размер ответа. И данные потерять можно...
Вместо него лучше http://memcachedb.org/ использовать, запускаемый у
всех редьюсеров.
Parallel-MapReduce - это игрушка. Для обработки большого количества
данных не подходит.
--
С уважением,
Монашёв Михаил, SoftSearch.ru
mailto:postmaster на softsearch.ru
ICQ# 166233339
http://michael.mindmix.ru/
Без бэкапа по жизни.
Подробная информация о списке рассылки Moscow-pm