[SP-pm] Conceito para fazer busca[ OFF ]

Nelson Ferraz nferraz at gmail.com
Thu Aug 13 06:49:43 PDT 2009


> Além disso, usar coisas como o Text::Soundex não funciona tão bem
> assim pra alguns casos simples... por exemplo:
>
>  nilson - N425
>  nislon - N245
>  milson - M425
>
> Basicamente, um erro nas primeiras 4 letras da palavra tem uma chance
> grande de alterar o valor Soundex pra aquela string (e se você errar a
> primeira letra é um problema maior ainda).

O problema do Soundex é que ele parte de uma simplificacão que não
vale para o português: ele ignora as vogais e compara apenas as
consoantes do início da palavra.

nilson -> NLSN -> N425
nislon -> NSLN -> N245
milson -> MLSN -> M425

Isso não funciona muito bem em português,

mato -> MT -> M300
mata -> MT -> M300
meta -> MT -> M300
mito -> MT -> M300
moita -> MT -> M300

[]s

Nelson


More information about the SaoPaulo-pm mailing list