<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=windows-1252">
<META content="MSHTML 6.00.6000.16527" name=GENERATOR>
<STYLE></STYLE>
</HEAD>
<BODY bgColor=#ffffff>
<DIV><FONT color=#000080 size=2>Saudações a todos.</FONT></DIV>
<DIV><FONT color=#000080 size=2>Uma questão teórica, mas muito 
interessante.</FONT></DIV>
<DIV><FONT color=#000080 size=2>Tenho um array de 900 posições, que armazena 1 
parágrafo de texto (1 linha)&nbsp;em cada posição.</FONT></DIV>
<DIV><FONT color=#000080 size=2>Preciso comparar estes textos entre si para 
saber quais são semelhantes (pois&nbsp;considero que&nbsp;uma diferença de até 3 
palavras significa que os textos são iguais).</FONT></DIV>
<DIV><FONT color=#000080 size=2></FONT>&nbsp;</DIV>
<DIV><FONT color=#000080 size=2>O algoritmo que utilizo sorteia o array e faz as 
comparações usando regex e arrays auxiliares.</FONT></DIV>
<DIV><FONT color=#000080 size=2></FONT>&nbsp;</DIV>
<DIV><FONT color=#000080 size=2>A pergunta é: existe um meio mais rápido de 
rodar este tipo de job ?</FONT></DIV>
<DIV><FONT color=#000080 size=2></FONT>&nbsp;</DIV>
<DIV><FONT color=#000080 size=2>Fiz uma pesquisa sobre Hashes e , segundo alguns 
autores, eles são mais lentos (internamente ao PERL).</FONT></DIV>
<DIV><FONT color=#000080 size=2>Atualmente estou estudando 
Pack/Unpack.</FONT></DIV>
<DIV><FONT color=#000080 size=2></FONT>&nbsp;</DIV>
<DIV><FONT color=#000080 size=2>Então, o uso de arrays com regex seria o recurso 
mais veloz ?</FONT></DIV>
<DIV><FONT color=#000080 size=2></FONT>&nbsp;</DIV>
<DIV><FONT color=#000080 size=2>Abraço a todos.</FONT></DIV>
<DIV><FONT color=#000080 size=2>Roberto</FONT></DIV>
<DIV><FONT color=#000080 size=2></FONT>&nbsp;</DIV></BODY></HTML>