[Kiev-pm] Алгоритм, реализация или порт Safari Reader, Readability, Evernote Clearly

Анатолий Шарифулин sharifulin на gmail.com
Чт Июн 14 03:00:30 PDT 2012


Да слышал про такой алгоритм, если одна статья или сайт не в базе, то не
работает.

четверг, 14 июня 2012 г. пользователь Alexandr Alexeev писал:

> Алгоритм примерно такой:
> - грузим две страницы с разным контентом (например, две новости)
> - делаем diff
> - все, кроме одинаковых частей - это контент
>
> 14 июня 2012 г., 13:47 пользователь Анатолий Шарифулин <
> sharifulin на gmail.com <javascript:_e({}, 'cvml', 'sharifulin на gmail.com');>>написал:
>
>> Привет!
>>
>> Может кто-нибудь знает алгоритмы или реализации Safari Reader,
>> Readability или Evernote Clearly.
>>
>> На CPAN нашёл только старые реализации:
>>
>> https://metacpan.org/module/HTML::ExtractMain (алгоритм readability.js)
>> https://metacpan.org/module/HTML::ExtractContent
>>
>> Но они не очень.
>>
>> --
>> С уважением,
>>  Анатолий Шарифулин.
>>
>> --
>> Moscow.pm mailing list
>> moscow-pm на pm.org <javascript:_e({}, 'cvml', 'moscow-pm на pm.org');> |
>> http://moscow.pm.org
>>
>>
>
>
> --
> С уважением, Александр
> Личный блог: http://eax.me/
> Мой форум: http://it-talk.org/
> Мой Twitter: http://twitter.com/afiskon
>
>

-- 
С уважением,
 Анатолий Шарифулин.
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/kiev-pm/attachments/20120614/4e2f3b0d/attachment.html>


Подробная информация о списке рассылки Kiev-pm