[Moscow.pm] Идеальный Map-ер и Reduce-ер
Монашёв Михаил
postmaster на softsearch.ru
Вт Янв 20 08:33:38 PST 2009
Здравствуйте, Александр.
Выходит, что мастер-процесс, раскидывающий задачи по маперам, должен
знать какой тип данных им передаётся и где данные этого типа
хранятся...
Приходим к тому, что было неплохо иметь возможность самому писать
алгоритм раскидования задач маперам. Или же скрыть его от программиста
и на каждом мапере игнорировать чтение данных, расположенных на других
хостах, если на тех хостах запущены маперы.
> Кудряво написано.
> Но, если мы знаем где лежат данные, то запустить там же мапперы
> не сложно, а ежли нет - то "ой".
> Соответсвенно, тот же hadoop хранит файлы кусками на кластере и
> его "запускалка мапов" знает где и что лежит.
> 20.01.09, 18:11, "Монашёв Михаил" <postmaster на softsearch.ru>:
>> Здравствуйте, Михаил.
>> Хотел спросить, как бы Вы решали задачу выбора хостов для запусков
>> маперов, чтобы они работали с теми данными, которые хранятся на том же
>> хосте?
--
С уважением,
Монашёв Михаил, SoftSearch.ru
mailto:postmaster на softsearch.ru
ICQ# 166233339
http://michael.mindmix.ru/
Без бэкапа по жизни.
Подробная информация о списке рассылки Moscow-pm