[Moscow.pm] исправление слов
Dmitry Karasik
dmitry на karasik.eu.org
Сб Май 23 05:26:01 PDT 2009
Есть еще метод триграмм, на спане соответственно String::Trigram.
Я не использовал, мне сам метод понравился.
/dk
On Sat, May 23, 2009 at 03:52:38PM +0400, Михаил Монашёв wrote:
> Здравствуйте.
>
> Заметил, что пользователи довольно часто ошибаются при регистрации при
> вводе своего мыла. Вместо yandex вводится yahdeks, yandesx, iandax и
> т.д. , вместо mail - mal, meil, masil. Такая же ситуация с rambler,
> gmail, yahoo, hotmail. Люди или не знают как правильно пишется домен
> или совершают опечатки, нажимая на соседние буквы. Конечно можно
> нагенерить заранее все возможные неправильные написания этих трёх
> доменов, отличающиеся от правильных не более чем на 2 символа и потом
> осуществить замену неверных на верные. Но может есть какой-то более
> умный алгоритм нечёткого сравнения двух слов, который бы например
> правильно приводил неверно написанное доменное имя к mail или к gmail?
>
> Т.е. дано слово и надо выяснить, является ли оно неверным написание
> одного из нескольких правильных слов. Всё написано на английском языке
> только буквами, цифрами и точкой.
>
> --
>
> С уважением,
> Михаил Монашёв, SoftSearch.ru
> mailto:postmaster на softsearch.ru
> ICQ# 166233339
> http://michael.mindmix.ru/
> Без бэкапа по жизни.
>
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
--
Sincerely,
Dmitry Karasik
Подробная информация о списке рассылки Moscow-pm