Comparando parágrafos de texto

loggos em loggos.com.br loggos em loggos.com.br
Sexta Setembro 21 13:10:16 PDT 2007


Saudações a todos.
Uma questão teórica, mas muito interessante.
Tenho um array de 900 posições, que armazena 1 parágrafo de texto (1 linha) em cada posição.
Preciso comparar estes textos entre si para saber quais são semelhantes (pois considero que uma diferença de até 3 palavras significa que os textos são iguais).

O algoritmo que utilizo sorteia o array e faz as comparações usando regex e arrays auxiliares.

A pergunta é: existe um meio mais rápido de rodar este tipo de job ?

Fiz uma pesquisa sobre Hashes e , segundo alguns autores, eles são mais lentos (internamente ao PERL).
Atualmente estou estudando Pack/Unpack.

Então, o uso de arrays com regex seria o recurso mais veloz ?

Abraço a todos.
Roberto
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: http://mail.pm.org/pipermail/saopaulo-pm/attachments/20070921/dabd0f04/attachment.html 
-------------- Próxima Parte ----------
Um anexo não texto foi limpo...
Nome  : Loggos TI - Roberto Bisotto.vcf
Tipo  : text/x-vcard
Tam   : 415 bytes
Descr.: não disponível
Url   : http://mail.pm.org/pipermail/saopaulo-pm/attachments/20070921/dabd0f04/attachment.vcf 


Mais detalhes sobre a lista de discussão SaoPaulo-pm