[Moscow.pm] исправление слов
Alex Kapranoff
alex на kapranoff.ru
Сб Май 23 13:26:52 PDT 2009
И ещё есть известный старый алгоритм Soundex, который позволяет сравнивать слова по
фонетической похожести. Для английского языка он отлажен и нормально работает.
Dmitry Karasik wrote:
> Есть еще метод триграмм, на спане соответственно String::Trigram.
> Я не использовал, мне сам метод понравился.
>
> /dk
>
> On Sat, May 23, 2009 at 03:52:38PM +0400, Михаил Монашёв wrote:
>> Здравствуйте.
>>
>> Заметил, что пользователи довольно часто ошибаются при регистрации при
>> вводе своего мыла. Вместо yandex вводится yahdeks, yandesx, iandax и
>> т.д. , вместо mail - mal, meil, masil. Такая же ситуация с rambler,
>> gmail, yahoo, hotmail. Люди или не знают как правильно пишется домен
>> или совершают опечатки, нажимая на соседние буквы. Конечно можно
>> нагенерить заранее все возможные неправильные написания этих трёх
>> доменов, отличающиеся от правильных не более чем на 2 символа и потом
>> осуществить замену неверных на верные. Но может есть какой-то более
>> умный алгоритм нечёткого сравнения двух слов, который бы например
>> правильно приводил неверно написанное доменное имя к mail или к gmail?
>>
>> Т.е. дано слово и надо выяснить, является ли оно неверным написание
>> одного из нескольких правильных слов. Всё написано на английском языке
>> только буквами, цифрами и точкой.
>>
>> --
>>
>> С уважением,
>> Михаил Монашёв, SoftSearch.ru
>> mailto:postmaster на softsearch.ru
>> ICQ# 166233339
>> http://michael.mindmix.ru/
>> Без бэкапа по жизни.
>>
>> --
>> Moscow.pm mailing list
>> moscow-pm на pm.org | http://moscow.pm.org
>
Подробная информация о списке рассылки Moscow-pm