[Cascavel-pm] sistema de busca
breno
breno em rio.pm.org
Terça Dezembro 11 10:01:56 PST 2007
Eu tenho alguns problemas e críticas à busca do Google justamente em
relação a coisas desse tipo.
Minha sugestão para contornar esse problema seria fazer a busca
literal ("burra") sempre que:
- a palavra tiver *algum* acento (áàãäâã, ç, etc), pois se o sujeito
botou desse jeito então ele provavelmente sabe escrever o que está
procurando
- quando o sujeito deliberadamente pedir por ela (algum comando
especial como "literal:cao" por exemplo)
E nos demais casos fazer a busca "inteligente", que trata os seus
"cao", "cão" e "ção" da mesma maneira.
Já sobre os limites de palavras, poderia usar wildcards (se for o
caso) para os casos em que o sujeito quer buscar por substrings e
tratar buscas normais pegando apenas palavras que estejam entre
caracteres "não palavra", como o Gabriel citou.
Espero ter entendido sua dúvida! :-)
[]s
-b
On Dec 10, 2007 3:57 PM, <fernandolouis em terra.com.br> wrote:
> Amigos,
>
> Fiz um sisteminha de busca, e percebi que quando faço a busca pela
> palavra-chave "cão",
> me retorna também, tudo que tem "ção", por exemplo:
>
> - redação
> - ação
> - programação
> etc
>
> Essa minha busca retorna 3698 linhas, e as que tem relmente só "cão", são
> apenas 5 (usando latin1) !!!
>
> Só que tem aquela história, "vai que o usuário-burro digite um palavra-chave
> com erro de português"...
>
> Então se ele buscar por "facil", vai retornar tudo que tem "fácil" (com
> acento) e também o que tem "facilidade".
>
> O que recomendam?
>
> []s,
> Fernando
>
> _______________________________________________
> Cascavel-pm mailing list
> Cascavel-pm em pm.org
> http://mail.pm.org/mailman/listinfo/cascavel-pm
>
Mais detalhes sobre a lista de discussão Cascavel-pm