<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">

<HTML><HEAD>

<META http-equiv=Content-Type content="text/html; charset=windows-1252">

<META content="MSHTML 6.00.6000.16527" name=GENERATOR>

<STYLE></STYLE>

</HEAD>

<BODY bgColor=#ffffff>

<DIV><FONT color=#000080 size=2>Saudações a todos.</FONT></DIV>

<DIV><FONT color=#000080 size=2>Uma questão teórica, mas muito 

interessante.</FONT></DIV>

<DIV><FONT color=#000080 size=2>Tenho um array de 900 posições, que armazena 1 

parágrafo de texto (1 linha)&nbsp;em cada posição.</FONT></DIV>

<DIV><FONT color=#000080 size=2>Preciso comparar estes textos entre si para 

saber quais são semelhantes (pois&nbsp;considero que&nbsp;uma diferença de até 3 

palavras significa que os textos são iguais).</FONT></DIV>

<DIV><FONT color=#000080 size=2></FONT>&nbsp;</DIV>

<DIV><FONT color=#000080 size=2>O algoritmo que utilizo sorteia o array e faz as 

comparações usando regex e arrays auxiliares.</FONT></DIV>

<DIV><FONT color=#000080 size=2></FONT>&nbsp;</DIV>

<DIV><FONT color=#000080 size=2>A pergunta é: existe um meio mais rápido de 

rodar este tipo de job ?</FONT></DIV>

<DIV><FONT color=#000080 size=2></FONT>&nbsp;</DIV>

<DIV><FONT color=#000080 size=2>Fiz uma pesquisa sobre Hashes e , segundo alguns 

autores, eles são mais lentos (internamente ao PERL).</FONT></DIV>

<DIV><FONT color=#000080 size=2>Atualmente estou estudando 

Pack/Unpack.</FONT></DIV>

<DIV><FONT color=#000080 size=2></FONT>&nbsp;</DIV>

<DIV><FONT color=#000080 size=2>Então, o uso de arrays com regex seria o recurso 

mais veloz ?</FONT></DIV>

<DIV><FONT color=#000080 size=2></FONT>&nbsp;</DIV>

<DIV><FONT color=#000080 size=2>Abraço a todos.</FONT></DIV>

<DIV><FONT color=#000080 size=2>Roberto</FONT></DIV>

<DIV><FONT color=#000080 size=2></FONT>&nbsp;</DIV></BODY></HTML>