[SP-pm] Conceito para fazer busca[ OFF ]
Nelson Ferraz
nferraz at gmail.com
Thu Aug 13 06:49:43 PDT 2009
> Além disso, usar coisas como o Text::Soundex não funciona tão bem
> assim pra alguns casos simples... por exemplo:
>
> nilson - N425
> nislon - N245
> milson - M425
>
> Basicamente, um erro nas primeiras 4 letras da palavra tem uma chance
> grande de alterar o valor Soundex pra aquela string (e se você errar a
> primeira letra é um problema maior ainda).
O problema do Soundex é que ele parte de uma simplificacão que não
vale para o português: ele ignora as vogais e compara apenas as
consoantes do início da palavra.
nilson -> NLSN -> N425
nislon -> NSLN -> N245
milson -> MLSN -> M425
Isso não funciona muito bem em português,
mato -> MT -> M300
mata -> MT -> M300
meta -> MT -> M300
mito -> MT -> M300
moita -> MT -> M300
[]s
Nelson
More information about the SaoPaulo-pm
mailing list