[SP-pm] Conceito para fazer busca[ OFF ]

Nilson Santos Figueiredo Jr. acid06 at gmail.com
Wed Aug 12 18:12:21 PDT 2009


2009/8/12 João Gabriel Casteluber Laass <gabriel at joaogabriel.org>:
> Existe uma "jogada" que você compara duas palavras e ve a porcentagem
> de semelhança entre elas. Esse não seria um caminho mais rápido?

Então, mas esse é o ponto todo de fazer as modificações. Com qual
palavra você vai comparar a entrada do usuário se não sabe a priori o
que ele quer?

A idéia é que quando você vai fazendo as modificações, você está
gerando alternativas - quanto mais modificações, menos aquela palavra
se parece com a original. Se você já soubesse o que ele queria era
fácil. ;-)

Além disso, usar coisas como o Text::Soundex não funciona tão bem
assim pra alguns casos simples... por exemplo:

  nilson - N425
  nislon - N245
  milson - M425

Basicamente, um erro nas primeiras 4 letras da palavra tem uma chance
grande de alterar o valor Soundex pra aquela string (e se você errar a
primeira letra é um problema maior ainda).

Por isso o negócio do Google funciona bem, porque não é algo simples
assim. E é uma abordagem que se encaixa perfeitamente na arquitetura
distribuída que eles usam.

-Nilson Santos F. Jr.


More information about the SaoPaulo-pm mailing list