[SP-pm] Comparando parágrafos de texto

Nelson Ferraz nferraz em gmail.com
Segunda Setembro 24 02:31:41 PDT 2007


> Uma questão teórica, mas muito interessante.
> Tenho um array de 900 posições, que armazena 1 parágrafo de texto  
> (1 linha) em cada posição.
> Preciso comparar estes textos entre si para saber quais são  
> semelhantes (pois considero que uma diferença de até 3 palavras  
> significa que os textos são iguais).
>
> O algoritmo que utilizo sorteia o array e faz as comparações usando  
> regex e arrays auxiliares.
>
> A pergunta é: existe um meio mais rápido de rodar este tipo de job ?

O sorteio de itens de um array não faz muito sentido para mim.  
Afinal, se você adicionar um sorteio ao algoritmo, vai ter um  
programa que às vezes funciona, às vezes não. Terrível para testar.

De qualquer forma, aqui vai um post que eu respondi, há muito tempo  
atrás, sobre comparação de strings:

	http://mail.pm.org/pipermail/cascavel-pm/2005-October/003997.html

Não sei se ele funcionaria adequadamente para o seu propósito, mas  
pode ser um começo.

[]s

Nelson


Mais detalhes sobre a lista de discussão SaoPaulo-pm