[Cascavel-pm] sistema de busca

breno breno em rio.pm.org
Terça Dezembro 11 10:01:56 PST 2007


Eu tenho alguns problemas e críticas à busca do Google justamente em
relação a coisas desse tipo.

Minha sugestão para contornar esse problema seria fazer a busca
literal ("burra") sempre que:

- a palavra tiver *algum* acento (áàãäâã, ç, etc), pois se o sujeito
botou desse jeito então ele provavelmente sabe escrever o que está
procurando

- quando o sujeito deliberadamente pedir por ela (algum comando
especial como "literal:cao" por exemplo)

E nos demais casos fazer a busca "inteligente", que trata os seus
"cao", "cão" e "ção" da mesma maneira.

Já sobre os limites de palavras, poderia usar wildcards (se for o
caso) para os casos em que o sujeito quer buscar por substrings e
tratar buscas normais pegando apenas palavras que estejam entre
caracteres "não palavra", como o Gabriel citou.

Espero ter entendido sua dúvida! :-)

[]s

-b

On Dec 10, 2007 3:57 PM,  <fernandolouis em terra.com.br> wrote:
> Amigos,
>
> Fiz um sisteminha de busca, e percebi que quando faço a busca pela
> palavra-chave "cão",
> me retorna também, tudo que tem "ção", por exemplo:
>
> - redação
> - ação
> - programação
> etc
>
> Essa minha busca retorna 3698 linhas, e as que tem relmente só "cão", são
> apenas 5 (usando latin1) !!!
>
> Só que tem aquela história, "vai que o usuário-burro digite um palavra-chave
> com erro de português"...
>
> Então se ele buscar por "facil", vai retornar tudo que tem "fácil" (com
> acento) e também o que tem "facilidade".
>
> O que recomendam?
>
> []s,
> Fernando
>
> _______________________________________________
> Cascavel-pm mailing list
> Cascavel-pm em pm.org
> http://mail.pm.org/mailman/listinfo/cascavel-pm
>


Mais detalhes sobre a lista de discussão Cascavel-pm