[Cascavel-pm] Comparacao aproximada entre duas strings

Luis Campos de Carvalho monsieur_champs em yahoo.com.br
Sábado Outubro 15 07:34:54 PDT 2005


Marco Modesto wrote:
> Alguem saberia me indicar um modulo ou função pra comparar se duas
> strings são próximas?

   Strings Próximas: uh? Eu perdi alguma coisa? Do que você está falando?

> -> Fazer a função não seria difícil, mas talvez alguém conheça algo pronto.
> 
> Por exemplo:
> "WIM: an Information Mine Model for the World Wide Web"
> "WIM: an Information Mining Model for the Web"
> Possuem distância de 0.8.  (este valor é apenas ilustrativo).
> 
> Mas
> "A Practical Minimal Perfect Hashing Method"
> "WIM: an Information Mining Model for the Web"
> Possuem distância 0, ou seja não há semelhança alguma entre as strings.
> 
> Usei o SoftTFIDF em Perl, mas em alguns casos que analisei ele
> retornou uma proximidade muito alta a duas strings completamente
> diferentes:
> 
> SoftTFIDF em Java:
> http://secondstring.sourceforge.net/javadoc/com/wcohen/secondstring/SoftTFIDF.html
> 

   Se construir esta funcionalidade "não seria difícil", meu caro, acho 
que vale o trabalho... isso dá um excelente módulo Perl.

   Eu tentaria "ensinar" uma rede neural em Perl a fazer isso... e 
usaria AI::NeuralNet, possivelmente. Mas não tenho idéia de como 
implementar isso.

   Com uma especificação mais ou menos detalhada, posso tentar ajudar. :-)

   Putamplexos!
-- 
=======================================================
   Luis Campos de Carvalho is BsC in Computer Science,
   Certified Oracle DBA, UNIX and Linux lover, Perl
   Fanatic and Leader of the Sao Paulo Perl Mongers
   http://br.geocities.com/monsieur_champs/
=======================================================

	

	
		
_______________________________________________________ 
Promoção Yahoo! Acesso Grátis: a cada hora navegada você acumula cupons e concorre a mais de 500 prêmios! Participe! http://yahoo.fbiz.com.br/


Mais detalhes sobre a lista de discussão Cascavel-pm