[SP-pm] Conceito para fazer busca[ OFF ]

Luis Motta Campos luismottacampos at yahoo.co.uk
Sat Aug 15 01:28:27 PDT 2009


Nelson Ferraz wrote:
> 2009/8/15 Luis Motta Campos <luismottacampos em yahoo.co.uk>:
>> Eu acabei de escrever um módulo (Text::BuscaBR) que implementa o
>> algorítmo descrito pelo Lucena, mas estou com problemas com a
>> implementação dos meus testes com acentuação. Parece que locale, UTF8 e
>> outros bichos feios do Perl têm de ser domados primeiro.
> 
> Tente usar o Text::Unaccent ou o Text::Unidecode!

O Text::Unaccent me colocaria uma dependência estúpida sobre GNU/Linux, 
um compilador e a libiconv do projeto GNU (normalmente não disponível em 
sistemas Apple ou Microsoft).

O Text::Unidecode fala no próprio manual que ele é a pior e mais 
abrangente solução para o problema de transliteração de caracteres. Eu 
não preciso de uma solução abrangente, preciso de uma solução boa e 
especializada.

A minha idéia é que eu vou rolar a minha própria solução, afinada para 
trabalhar com Português do Brazil. Como eu não tenho a intenção de 
atingir mais nenhuma língua (o BuscaBR não funciona com mais nenhuma 
língua, mesmo), estou seguro e ganho a vantagem competitiva de ter uma 
solução afinada suportando a língua que eu estou interessado.

De qualquer forma, obrigado pelas dicas, Nélson.

Putamplexos.
-- 
Luis Motta Campos is a software engineer,
Perl Programmer, foodie and photographer.


More information about the SaoPaulo-pm mailing list