<br><div><span class="gmail_quote">On 9/21/07, <b class="gmail_sendername"><a href="mailto:loggos@loggos.com.br">loggos@loggos.com.br</a></b> &lt;<a href="mailto:loggos@loggos.com.br">loggos@loggos.com.br</a>&gt; wrote:</span>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">





<div bgcolor="#ffffff">
<div><font color="#000080" size="2">
<div><font color="#000080" size="2">Saudações a todos.</font></div>
<div><font color="#000080" size="2">Uma questão teórica, mas muito 
interessante.</font></div>
<div><font color="#000080" size="2">Tenho um array de 900 posições, que armazena 1 
parágrafo de texto (1 linha)&nbsp;em cada posição.</font></div>
<div><font color="#000080" size="2">Preciso comparar estes textos entre si para 
saber quais são semelhantes (pois&nbsp;considero que&nbsp;uma diferença de até 3 
palavras significa que os textos são iguais).</font></div></font></div></div></blockquote><div><br><span style="font-family: courier new,monospace;">Isto parece coisa de professor&nbsp; tentando&nbsp; pegar&nbsp; plágio de aluno nos trabalhos.
</span><br></div><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div bgcolor="#ffffff"><div><font color="#000080" size="2"><div><font color="#000080" size="2">
O algoritmo que utilizo sorteia o array e faz as 
comparações usando regex e arrays auxiliares.</font></div>
<div><font color="#000080" size="2"></font>&nbsp;</div>
<div><font color="#000080" size="2">A pergunta é: existe um meio mais rápido de 
rodar este tipo de job ?</font></div></font></div></div></blockquote><div><br><span style="font-family: courier new,monospace;">Num sei, porquê não sei o quanto rápido o teu sistema está lento ! Existe sim várias maneiras, o MDA lhe passou uma. Você então comparar o método do MDA com o teu via Benchmark, ou senão comprar com módulos de aproximação no CPAN tipo : 
<a href="http://cpan.uwinnipeg.ca/htdocs/Algorithm-Diff/Algorithm/Diff.html">http://cpan.uwinnipeg.ca/htdocs/Algorithm-Diff/Algorithm/Diff.html</a>, <a href="http://cpan.uwinnipeg.ca/htdocs/String-Similarity/String/Similarity.html">
http://cpan.uwinnipeg.ca/htdocs/String-Similarity/String/Similarity.html</a> entre outros.</span><br></div><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div bgcolor="#ffffff"><div><font color="#000080" size="2"><div><font color="#000080" size="2">Fiz uma pesquisa sobre Hashes e , segundo alguns 
autores, eles são mais lentos (internamente ao PERL).</font></div></font></div></div></blockquote><div><br style="font-family: courier new,monospace;"><span style="font-family: courier new,monospace;">Sim, é verdade que o armazenamento e a recuperação de informações em hashes custão mais do que em array, por motivos da própria concepção deste tipo de variável. 
<br><br>Mas também é verdade que existe outras coisas que podem influênciar negativamente a performance da aplicação. Para saber onde exatamente está o problema, eu recomendo fortemente você utilizar as ferramentas do Devel::*, tipo 
<a href="http://cpan.uwinnipeg.ca/htdocs/DProf/Devel/DProf.html">http://cpan.uwinnipeg.ca/htdocs/DProf/Devel/DProf.html</a>, <a href="http://cpan.uwinnipeg.ca/htdocs/Devel-DProfLB/Devel/DProfLB.html">http://cpan.uwinnipeg.ca/htdocs/Devel-DProfLB/Devel/DProfLB.html
</a>, <a href="http://cpan.uwinnipeg.ca/htdocs/GraphViz/Devel/GraphVizProf.html">http://cpan.uwinnipeg.ca/htdocs/GraphViz/Devel/GraphVizProf.html</a> entre vários outros disponível no cpan mais próximo de você :)</span><br style="font-family: courier new,monospace;">
</div><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div bgcolor="#ffffff"><div><font color="#000080" size="2"><div><font color="#000080" size="2">
Atualmente estou estudando 
Pack/Unpack.</font></div>
<div><font color="#000080" size="2"></font>&nbsp;</div>
<div><font color="#000080" size="2">Então, o uso de arrays com regex seria o recurso 
mais veloz ?</font></div></font></div></div></blockquote><div><br><span style="font-family: courier new,monospace;">Use o benchmark e depois nos conte o resultado :)</span> <br></div><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div bgcolor="#ffffff"><div><font color="#000080" size="2"><div><font color="#000080" size="2">Abraço a todos.</font></div>
<div><font color="#000080" size="2">Roberto</font></div></font></div></div>
<br>_______________________________________________<br>SaoPaulo-pm mailing list<br><a onclick="return top.js.OpenExtLink(window,event,this)" href="mailto:SaoPaulo-pm@pm.org">SaoPaulo-pm@pm.org</a><br><a onclick="return top.js.OpenExtLink(window,event,this)" href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">
http://mail.pm.org/mailman/listinfo/saopaulo-pm</a><br><br clear="all"></blockquote></div><br><br clear="all"><br>-- <br>&quot;o animal satisfeito dorme&quot;. - Guimarães Rosa