<div>Data mining é um conceito, não (necessariamente) atrelado a uma linguagem de programação. A questão é que as ferramentas modernas (como Sphinx) já implementam várias funcionalidades que se esperam de uma aplicação de data mining.</div>

<div>Mas, digamos, para clustering, dá para usar SQL "puro": <a href="http://blog.data-miners.com/2008/02/mapreduce-and-k-means-clustering.html">http://blog.data-miners.com/2008/02/mapreduce-and-k-means-clustering.html</a></div>

<div>Ou um utilitário externo, cujo I/O é em CSV: <a href="http://code.google.com/p/bayon/wiki/Tutorial_en">http://code.google.com/p/bayon/wiki/Tutorial_en</a></div><div>Ou um wrapper em Perl para o tal utilitário: <a href="https://metacpan.org/module/Text::Bayon">https://metacpan.org/module/Text::Bayon</a></div>

<div><div><br>ABS()<br><br>
<br><br><div class="gmail_quote">2011/12/20 Diana Rosa <span dir="ltr"><<a href="mailto:diana.g.a.rosa@gmail.com">diana.g.a.rosa@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Obrigada Nuba!<div>entao nao e a toa que o lucy e mais familiar...<div>e pelo jeito pesquisei muito errado sobre o plucene...<div><div class="h5"><br><br><div class="gmail_quote">2011/12/20 Nuba Princigalli <span dir="ltr"><<a href="mailto:nuba@fastmail.fm" target="_blank">nuba@fastmail.fm</a>></span><br>


<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Caros,<br>
<br>
Sobre os engines de busca:<br>
<div><br>
On Tue, Dec 20, 2011, at 08:46 PM, breno wrote:<br>
> Em termos de engines de busca, se você gosta do Lucene pode dar uma<br>
> olhada no Plucene => <a href="https://metacpan.org/module/Plucene" target="_blank">https://metacpan.org/module/Plucene</a> ou nas APIs<br>
</div>(...)<br>
<div>> Outro bastante popular é o KinoSearch =><br>
> <a href="https://metacpan.org/module/KinoSearch" target="_blank">https://metacpan.org/module/KinoSearch</a><br>
</div>(...)<br>
<div>> Também tem wrapper pro Lucy da Apache<br>
> (<a href="https://metacpan.org/module/Lucy" target="_blank">https://metacpan.org/module/Lucy</a>)<br>
<br>
</div>De forma bastante resumida, o KinoSearch foi um esforço de rewrite do<br>
Plucene, que estava cheio de problemas e largado, usando uma versão mais<br>
recente do Lucene (na época) como referência. O Lucy é o sucessor do<br>
KinoSearch, com as mesmas pessoas, e o que o caracteriza, em relação ao<br>
o KinoSearch, é que o core dele foi pro C e as interfaces pra usar esse<br>
core do perl ou de outras linguagens é via bindings, com isso "evitando<br>
retrabalho e trazendo alegria para toda a família" :D<br>
<br>
Enfim, se você gosta do Lucene ou do KinoSearch, vá pro Lucy --<br>
#lucy_dev na rede freenode ;)<br>
<br>
Abraço,<br>
<br>
Nuba<br>
<font color="#888888">--<br>
Nuba R. Princigalli  <a href="mailto:nuba@pauleira.com" target="_blank">nuba@pauleira.com</a>  <a href="http://pauleira.com" target="_blank">http://pauleira.com</a>  @nprincigalli<br>
Discipline is not an end in itself, just a means to an end. - King Crimson<br>
</font><div><div></div><div><br>
_______________________________________________<br>
Rio-pm mailing list<br>
<a href="mailto:Rio-pm@pm.org" target="_blank">Rio-pm@pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/rio-pm" target="_blank">http://mail.pm.org/mailman/listinfo/rio-pm</a><br>
</div></div></blockquote></div><br></div></div></div></div>
<br>_______________________________________________<br>
Rio-pm mailing list<br>
<a href="mailto:Rio-pm@pm.org">Rio-pm@pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/rio-pm" target="_blank">http://mail.pm.org/mailman/listinfo/rio-pm</a><br></blockquote></div><br></div></div>