[Moscow.pm] А плаггер умеет выпарсить из айтемов все ссылки в объект links ?

Vany Serezhkin ivan на serezhkin.com
Пн Янв 19 10:42:55 PST 2009


Привет
Оки, тогда я просто присматриваю за общим дизайном,
А пока сделаю Lingua::Detect С разбором корпуса, определением
по триграммам сверху и снизу. Пока не уверен, что получится понимать
что текст про перл, это более серьёзная задача.


Также, Руслан, а не вести ли нам отдельно authors с многокомного до feeds ?


Ruslan Zakirov wrote:
> Ты можешь сделать Globus::Util и в нем фунцию language_detect, которая
> берет стринг референс? Просто оно понадобиться и для тегов тоже. И еще
> так как у нас все в УТФ, то можно этот факт использовать для детекта.
>
> Я спушил новый список, там есть немецкий, английский и русский.
> Некоторые закоменчены.
>
> Я на днях собираюсь переписать сам парсер фидов, то есть заменить
> Plagger::Plugin::Aggregator::Simple на свой и не использовать в нем
> Plagger::FeedParser, который пока доставляет больше проблем. В поток
> обработки будет все равно вставляться Plagger::Feed и Plagger::Entry,
> или их подклассы если нам понядобится.
>
> 2009/1/19 Vany Serezhkin <ivan на serezhkin.com>:
>   
>> Привет.
>>
>> Мысль сделать автоматическую добавлялку фидов.
>>
>> Также есть Мысля, что мы таки сделаем language detection.
>>
>> Киньте ссылок на блоги, там где про перл на разных языках, мне нужен корпус
>> языков для самообучения,
>> Сдаётся мне, что десяток языков я выделить смогу.
>>
>> --
>> Ivan B. Serezhkin
>> Spamooborona, Yandex. http://so.yandex.ru/
>>
>> --
>> Moscow.pm mailing list
>> moscow-pm на pm.org | http://moscow.pm.org
>>
>>     
>
>   


-- 
Ivan B. Serezhkin
Spamooborona, Yandex. http://so.yandex.ru/



Подробная информация о списке рассылки Moscow-pm