[Moscow.pm] Идеальный Map-ер и Reduce-ер
Михаил Монашёв
postmaster на softsearch.ru
Вт Янв 20 14:20:56 PST 2009
Здравствуйте, Павел.
ПТ> Здравствуйте, Михаил.
ПТ> А вот это сильно.
ПТ> Сорри за оффтоп.
В каком смысле "сильно"? Грибы у меня забористые или идея понравилась?
Можно поняснить.
Я просто тут пытаюсь людей спровоцировать на диалог. Тема, видимо не
всем понятна, а потому любое обсуждение ИМХО полезно.
Есть например большой вопрос об эффективности использовании ssh как
транспорта. Но при этом Disco и Parallel::MapReduce их используют. Мы
же не MapReduce-ботнет делаем. А во внутренней сетке всё это
запускаем. Шифрование там лишнее ИМХО.
Также есть мысль, что перед мапером должен запускаться какой-то
итератор, который поставляет маперу данные в формате хэша. Также
должно быть какое-то хранилище, чтобы складывать результаты работы
маперов, потом агркгировать их по ключам и раздавать редьюсерам.
Ещё есть ощущение, что редьюсеры особенно лично мне и не нужны. И
потому MapReduce вырождается просто в запускалку в параллель на
нескольких серверах каких-то скриптов. Хотя возможно просто не хватает
практики, чтобы понять всю мощь MapReduce и начать использовать его.
--
С уважением,
Михаил Монашёв, SoftSearch.ru
mailto:postmaster на softsearch.ru
ICQ# 166233339
http://michael.mindmix.ru/
Без бэкапа по жизни.
Подробная информация о списке рассылки Moscow-pm