[SP-pm] Comparando parágrafos de texto
Nelson Ferraz
nferraz em gmail.com
Segunda Setembro 24 02:31:41 PDT 2007
> Uma questão teórica, mas muito interessante.
> Tenho um array de 900 posições, que armazena 1 parágrafo de texto
> (1 linha) em cada posição.
> Preciso comparar estes textos entre si para saber quais são
> semelhantes (pois considero que uma diferença de até 3 palavras
> significa que os textos são iguais).
>
> O algoritmo que utilizo sorteia o array e faz as comparações usando
> regex e arrays auxiliares.
>
> A pergunta é: existe um meio mais rápido de rodar este tipo de job ?
O sorteio de itens de um array não faz muito sentido para mim.
Afinal, se você adicionar um sorteio ao algoritmo, vai ter um
programa que às vezes funciona, às vezes não. Terrível para testar.
De qualquer forma, aqui vai um post que eu respondi, há muito tempo
atrás, sobre comparação de strings:
http://mail.pm.org/pipermail/cascavel-pm/2005-October/003997.html
Não sei se ele funcionaria adequadamente para o seu propósito, mas
pode ser um começo.
[]s
Nelson
Mais detalhes sobre a lista de discussão SaoPaulo-pm