<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=windows-1252">
<META content="MSHTML 6.00.6000.16527" name=GENERATOR>
<STYLE></STYLE>
</HEAD>
<BODY bgColor=#ffffff>
<DIV><FONT color=#000080 size=2>Saudações a todos.</FONT></DIV>
<DIV><FONT color=#000080 size=2>Uma questão teórica, mas muito
interessante.</FONT></DIV>
<DIV><FONT color=#000080 size=2>Tenho um array de 900 posições, que armazena 1
parágrafo de texto (1 linha) em cada posição.</FONT></DIV>
<DIV><FONT color=#000080 size=2>Preciso comparar estes textos entre si para
saber quais são semelhantes (pois considero que uma diferença de até 3
palavras significa que os textos são iguais).</FONT></DIV>
<DIV><FONT color=#000080 size=2></FONT> </DIV>
<DIV><FONT color=#000080 size=2>O algoritmo que utilizo sorteia o array e faz as
comparações usando regex e arrays auxiliares.</FONT></DIV>
<DIV><FONT color=#000080 size=2></FONT> </DIV>
<DIV><FONT color=#000080 size=2>A pergunta é: existe um meio mais rápido de
rodar este tipo de job ?</FONT></DIV>
<DIV><FONT color=#000080 size=2></FONT> </DIV>
<DIV><FONT color=#000080 size=2>Fiz uma pesquisa sobre Hashes e , segundo alguns
autores, eles são mais lentos (internamente ao PERL).</FONT></DIV>
<DIV><FONT color=#000080 size=2>Atualmente estou estudando
Pack/Unpack.</FONT></DIV>
<DIV><FONT color=#000080 size=2></FONT> </DIV>
<DIV><FONT color=#000080 size=2>Então, o uso de arrays com regex seria o recurso
mais veloz ?</FONT></DIV>
<DIV><FONT color=#000080 size=2></FONT> </DIV>
<DIV><FONT color=#000080 size=2>Abraço a todos.</FONT></DIV>
<DIV><FONT color=#000080 size=2>Roberto</FONT></DIV>
<DIV><FONT color=#000080 size=2></FONT> </DIV></BODY></HTML>