[Moscow.pm] Алгоритм, реализация или порт Safari Reader, Readability, Evernote Clearly

Alexandr Alexeev afiskon на gmail.com
Чт Июн 14 02:54:27 PDT 2012


Алгоритм примерно такой:
- грузим две страницы с разным контентом (например, две новости)
- делаем diff
- все, кроме одинаковых частей - это контент

14 июня 2012 г., 13:47 пользователь Анатолий Шарифулин <sharifulin на gmail.com
> написал:

> Привет!
>
> Может кто-нибудь знает алгоритмы или реализации Safari Reader, Readability
> или Evernote Clearly.
>
> На CPAN нашёл только старые реализации:
>
> https://metacpan.org/module/HTML::ExtractMain (алгоритм readability.js)
> https://metacpan.org/module/HTML::ExtractContent
>
> Но они не очень.
>
> --
> С уважением,
>  Анатолий Шарифулин.
>
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>
>


-- 
С уважением, Александр
Личный блог: http://eax.me/
Мой форум: http://it-talk.org/
Мой Twitter: http://twitter.com/afiskon
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20120614/5ccaece4/attachment.html>


Подробная информация о списке рассылки Moscow-pm