[Moscow.pm] А плаггер умеет выпарсить из айтемов все ссылки в объект links ?

Ruslan Zakirov ruslan.zakirov на gmail.com
Пн Янв 19 14:35:15 PST 2009


Посмотрел в Lingua-StopWords. Они молодцы - возвращают строки с
флагом. Поддерживают достаточно языков и добавить новый не сложно.
Странно, что возвращают хешом, но наверное это для чеков удобнее. Нет
поддержки формата en-us, но в этом ничего страшного, и скорее всего
практически невозможно отличить разные варианты языков.

2009/1/20 Ruslan Zakirov <ruslan.zakirov на gmail.com>:
> А чем ты детектишь? Я просто заглянул в Lingua-Identify-0.23 и
> метадата для русского там в cp1251 и еще в ascii, что вообще странно.
>
> 2009/1/19 Vany Serezhkin <ivan на serezhkin.com>:
>> Привет.
>> Maxim Duyunov wrote:
>>>
>>> Иван подготовил примерный список блогов ещё в день hackmeet.
>>>
>>> http://trac.bessarabov.ru/hackmeet/wiki/TestBlogs
>>
>> Ой вей, ви как то не академически подходите к задаче.
>> Мне ещё нужно:
>> Белорусский: две кирилицы, одна латинитса,
>> Украинский: мова и суржик
>> Немецкий
>> Итальянский
>> Французский
>> Испанский
>> Мексиканский
>> Португальский
>>
>> Каждого языка хочется не меньше трёх авторов, а то я теперь умею находить в
>> интернете свой текст, ибо у меня стилистика =)
>>
>> --
>> Ivan B. Serezhkin
>> Spamooborona, Yandex. http://so.yandex.ru/
>>
>> --
>> Moscow.pm mailing list
>> moscow-pm на pm.org | http://moscow.pm.org
>>
>
>
>
> --
> Best regards, Ruslan.
>



-- 
Best regards, Ruslan.


Подробная информация о списке рассылки Moscow-pm