[Moscow.pm] исправление слов

Dmitry Karasik dmitry на karasik.eu.org
Сб Май 23 05:26:01 PDT 2009


Есть еще метод триграмм, на спане соответственно String::Trigram.
Я не использовал, мне сам метод понравился.

/dk

On Sat, May 23, 2009 at 03:52:38PM +0400, Михаил Монашёв wrote:
> Здравствуйте.
> 
> Заметил, что пользователи довольно часто ошибаются при регистрации при
> вводе  своего  мыла. Вместо yandex вводится yahdeks, yandesx, iandax и
> т.д.  ,  вместо  mail - mal, meil, masil. Такая же ситуация с rambler,
> gmail,  yahoo,  hotmail. Люди или не знают как правильно пишется домен
> или  совершают  опечатки,  нажимая  на  соседние  буквы. Конечно можно
> нагенерить  заранее  все  возможные  неправильные  написания этих трёх
> доменов,  отличающиеся от правильных не более чем на 2 символа и потом
> осуществить  замену  неверных  на верные. Но может есть какой-то более
> умный  алгоритм  нечёткого  сравнения  двух  слов, который бы например
> правильно приводил неверно написанное доменное имя к mail или к gmail?
> 
> Т.е.  дано  слово  и надо выяснить, является ли оно неверным написание
> одного из нескольких правильных слов. Всё написано на английском языке
> только буквами, цифрами и точкой.
> 
> --
> 
> С уважением,
> Михаил Монашёв, SoftSearch.ru
> mailto:postmaster на softsearch.ru
> ICQ# 166233339
> http://michael.mindmix.ru/
> Без бэкапа по жизни.
> 
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org

-- 
Sincerely,
	Dmitry Karasik



Подробная информация о списке рассылки Moscow-pm