[Moscow.pm] Ау, где докладчики?

Михаил Монашёв postmaster на softsearch.ru
Чт Апр 30 10:09:33 PDT 2009


Здравствуйте, Руслан.

>> RZ> Михаил, может расскажешь про
>> RZ> результаты  MapReduce,  как  получилось,  как  работает  и  на чем
>> RZ> работает?
>>
>> Получилось.   На  боевой  машине только сегодня запустили. Уже даже
>> два  джоба   отработали.   Но   пока  всё  очень  сыро            и
>> рассказывать/выкладывать   рано.    Я    только   инсталлировал   и
>>  собирал  баги  неделю.  Кроме  того, я сегодня пришёл к мысли, что
>> репорте таки нужен :-)

RZ> Выкладывать  не  обязательно,  достаточно  интересная  тема      и
RZ> архитектура.  Как раз во время написания слайдов приведешь мысли в
RZ> порядок и разложишь по полочкам все :)

Я не готов пока выступать.

Архитектура  там  простая  - маперы раскладываю обработанные данные по
сети  по mysql-ям, а редьюсеры потом локально их обрабатывают и кладут
куда  скажешь  -  в  файлы, например. Место mysql-я можно использовать
что-то  ещё,  достаточно заменить один класс. Чтобы не было распухания
перловых  процессов  все входные и промежуточные данные обрабатываются
построчно.

Самое важное ИМХО понять идею MapReduce. Тогда сразу многое становится
очевидным.  Например, нужно  но  ли оно вообще или обычным SELECT-ом к
базе можно обойтись.

>> Короче  надо  там всё допилить до ума. Комментариев в коде понаписать,
>> директории нужные автоматом создавать, а не падать на них...

RZ> Тебя  никто  не  заставляет  выкладывать  код.  У Ивана был доклад
RZ> прикольный   про  обработку  почтовых  логов.  Как  он  их  гоняет
RZ> гигабайтами  туда-сюда  на  ПОЯх.  Было  интересно  послушать  про
RZ> технологию.

Технологии никакой нет. Это как придумывать модное AJAX вместо старого
JavaScript.

У  нас  наоборот,  по  сети  гоняется минимум данных и только во время
работы маперов.

--

С уважением,
Михаил Монашёв, SoftSearch.ru
mailto:postmaster на softsearch.ru
ICQ# 166233339
http://michael.mindmix.ru/
Без бэкапа по жизни.



Подробная информация о списке рассылки Moscow-pm