[SP-pm] Conceito para fazer busca[ OFF ]
Luis Motta Campos
luismottacampos at yahoo.co.uk
Sat Aug 15 01:28:27 PDT 2009
Nelson Ferraz wrote:
> 2009/8/15 Luis Motta Campos <luismottacampos em yahoo.co.uk>:
>> Eu acabei de escrever um módulo (Text::BuscaBR) que implementa o
>> algorítmo descrito pelo Lucena, mas estou com problemas com a
>> implementação dos meus testes com acentuação. Parece que locale, UTF8 e
>> outros bichos feios do Perl têm de ser domados primeiro.
>
> Tente usar o Text::Unaccent ou o Text::Unidecode!
O Text::Unaccent me colocaria uma dependência estúpida sobre GNU/Linux,
um compilador e a libiconv do projeto GNU (normalmente não disponível em
sistemas Apple ou Microsoft).
O Text::Unidecode fala no próprio manual que ele é a pior e mais
abrangente solução para o problema de transliteração de caracteres. Eu
não preciso de uma solução abrangente, preciso de uma solução boa e
especializada.
A minha idéia é que eu vou rolar a minha própria solução, afinada para
trabalhar com Português do Brazil. Como eu não tenho a intenção de
atingir mais nenhuma língua (o BuscaBR não funciona com mais nenhuma
língua, mesmo), estou seguro e ganho a vantagem competitiva de ter uma
solução afinada suportando a língua que eu estou interessado.
De qualquer forma, obrigado pelas dicas, Nélson.
Putamplexos.
--
Luis Motta Campos is a software engineer,
Perl Programmer, foodie and photographer.
More information about the SaoPaulo-pm
mailing list