[Moscow.pm] Посоветуйте модуль для определения поисковых систем по user_agent
Ruslan Zakirov
ruz на bestpractical.com
Чт Июл 28 07:26:19 PDT 2011
2011/7/28 Walery Studennikov <despairr на gmail.com>:
> Hi.
>
> Посоветуйте модуль для определения поисковых систем по user_agent.
>
> HTTP::BrowserDetect не знает Яндекса.
> Чего-то ещё вменяемого на CPAN не нашёл.
Самый обновляемый и самый вменяемый, если игнорировать методы типа
safari, mozilla и прочие, а использовать browser_string.
Добавить? Код конечно в нем наивный и нет простой возможности
расширять, но модуль-то полезный и можно потратить немного времени и
сделать его вкуснее.
http://devaka.ru/articles/list-of-search-bots - список с нашими ботами
http://www.info-highsol.ru/seo_spider.php - еще список
и таких списков много
> Думал выдрать код определения SE из awstats (там хорошая база по
> роботам), но код там просто жесть ;)
Может базу оттуда выдрать?
> Что посоветуете?
Написать наконец-то что-то гибкое, простое и расширяемое своими
исключениями. Выложить на CPAN :)
По мне так все эти модули с accessor'ами для проверки того или иного
свойства просто жуть :(
> Может кто, например, поделиться доморощенными модулями?
>
> --
> Walery Studennikov
> CTO of Domain Name Registrar REG.RU
> http://www.reg.ru/
> +7 495 580-11-11 int. 501
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>
--
Best regards, Ruslan.
Подробная информация о списке рассылки Moscow-pm