[Moscow.pm] исправление слов

Alex Kapranoff alex на kapranoff.ru
Сб Май 23 13:26:52 PDT 2009


И ещё есть известный старый алгоритм Soundex, который позволяет сравнивать слова по 
фонетической похожести. Для английского языка он отлажен и нормально работает.

Dmitry Karasik wrote:
> Есть еще метод триграмм, на спане соответственно String::Trigram.
> Я не использовал, мне сам метод понравился.
> 
> /dk
> 
> On Sat, May 23, 2009 at 03:52:38PM +0400, Михаил Монашёв wrote:
>> Здравствуйте.
>>
>> Заметил, что пользователи довольно часто ошибаются при регистрации при
>> вводе  своего  мыла. Вместо yandex вводится yahdeks, yandesx, iandax и
>> т.д.  ,  вместо  mail - mal, meil, masil. Такая же ситуация с rambler,
>> gmail,  yahoo,  hotmail. Люди или не знают как правильно пишется домен
>> или  совершают  опечатки,  нажимая  на  соседние  буквы. Конечно можно
>> нагенерить  заранее  все  возможные  неправильные  написания этих трёх
>> доменов,  отличающиеся от правильных не более чем на 2 символа и потом
>> осуществить  замену  неверных  на верные. Но может есть какой-то более
>> умный  алгоритм  нечёткого  сравнения  двух  слов, который бы например
>> правильно приводил неверно написанное доменное имя к mail или к gmail?
>>
>> Т.е.  дано  слово  и надо выяснить, является ли оно неверным написание
>> одного из нескольких правильных слов. Всё написано на английском языке
>> только буквами, цифрами и точкой.
>>
>> --
>>
>> С уважением,
>> Михаил Монашёв, SoftSearch.ru
>> mailto:postmaster на softsearch.ru
>> ICQ# 166233339
>> http://michael.mindmix.ru/
>> Без бэкапа по жизни.
>>
>> --
>> Moscow.pm mailing list
>> moscow-pm на pm.org | http://moscow.pm.org
> 



Подробная информация о списке рассылки Moscow-pm