[Cascavel-pm] Comparacao aproximada entre duas strings
Luis Campos de Carvalho
monsieur_champs em yahoo.com.br
Sábado Outubro 15 07:34:54 PDT 2005
Marco Modesto wrote:
> Alguem saberia me indicar um modulo ou função pra comparar se duas
> strings são próximas?
Strings Próximas: uh? Eu perdi alguma coisa? Do que você está falando?
> -> Fazer a função não seria difícil, mas talvez alguém conheça algo pronto.
>
> Por exemplo:
> "WIM: an Information Mine Model for the World Wide Web"
> "WIM: an Information Mining Model for the Web"
> Possuem distância de 0.8. (este valor é apenas ilustrativo).
>
> Mas
> "A Practical Minimal Perfect Hashing Method"
> "WIM: an Information Mining Model for the Web"
> Possuem distância 0, ou seja não há semelhança alguma entre as strings.
>
> Usei o SoftTFIDF em Perl, mas em alguns casos que analisei ele
> retornou uma proximidade muito alta a duas strings completamente
> diferentes:
>
> SoftTFIDF em Java:
> http://secondstring.sourceforge.net/javadoc/com/wcohen/secondstring/SoftTFIDF.html
>
Se construir esta funcionalidade "não seria difícil", meu caro, acho
que vale o trabalho... isso dá um excelente módulo Perl.
Eu tentaria "ensinar" uma rede neural em Perl a fazer isso... e
usaria AI::NeuralNet, possivelmente. Mas não tenho idéia de como
implementar isso.
Com uma especificação mais ou menos detalhada, posso tentar ajudar. :-)
Putamplexos!
--
=======================================================
Luis Campos de Carvalho is BsC in Computer Science,
Certified Oracle DBA, UNIX and Linux lover, Perl
Fanatic and Leader of the Sao Paulo Perl Mongers
http://br.geocities.com/monsieur_champs/
=======================================================
_______________________________________________________
Promoção Yahoo! Acesso Grátis: a cada hora navegada você acumula cupons e concorre a mais de 500 prêmios! Participe! http://yahoo.fbiz.com.br/
Mais detalhes sobre a lista de discussão Cascavel-pm