[Moscow.pm] Посоветуйте модуль для определения поисковых систем по user_agent

Ruslan Zakirov ruz на bestpractical.com
Чт Июл 28 07:26:19 PDT 2011


2011/7/28 Walery Studennikov <despairr на gmail.com>:
> Hi.
>
> Посоветуйте модуль для определения поисковых систем по user_agent.
>
> HTTP::BrowserDetect не знает Яндекса.
> Чего-то ещё вменяемого на CPAN не нашёл.

Самый обновляемый и самый вменяемый, если игнорировать методы типа
safari, mozilla и прочие, а использовать browser_string.

Добавить? Код конечно в нем наивный и нет простой возможности
расширять, но модуль-то полезный и можно потратить немного времени и
сделать его вкуснее.

http://devaka.ru/articles/list-of-search-bots - список с нашими ботами
http://www.info-highsol.ru/seo_spider.php - еще список
и таких списков много

> Думал выдрать код определения SE из awstats (там хорошая база по
> роботам), но код там просто жесть ;)

Может базу оттуда выдрать?

> Что посоветуете?

Написать наконец-то что-то гибкое, простое и расширяемое своими
исключениями. Выложить на CPAN :)

По мне так все эти модули с accessor'ами для проверки того или иного
свойства просто жуть :(

> Может кто, например, поделиться  доморощенными модулями?
>
> --
> Walery Studennikov
> CTO of Domain Name Registrar REG.RU
> http://www.reg.ru/
> +7 495 580-11-11 int. 501
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>



-- 
Best regards, Ruslan.


Подробная информация о списке рассылки Moscow-pm