[Rio-pm] Data Mining & Perl

Stanislaw Pusep creaktive em gmail.com
Quarta Dezembro 21 04:19:08 PST 2011


Data mining é um conceito, não (necessariamente) atrelado a uma linguagem
de programação. A questão é que as ferramentas modernas (como Sphinx) já
implementam várias funcionalidades que se esperam de uma aplicação de data
mining.
Mas, digamos, para clustering, dá para usar SQL "puro":
http://blog.data-miners.com/2008/02/mapreduce-and-k-means-clustering.html
Ou um utilitário externo, cujo I/O é em CSV:
http://code.google.com/p/bayon/wiki/Tutorial_en
Ou um wrapper em Perl para o tal utilitário:
https://metacpan.org/module/Text::Bayon

ABS()



2011/12/20 Diana Rosa <diana.g.a.rosa em gmail.com>

> Obrigada Nuba!
> entao nao e a toa que o lucy e mais familiar...
> e pelo jeito pesquisei muito errado sobre o plucene...
>
>
> 2011/12/20 Nuba Princigalli <nuba em fastmail.fm>
>
>> Caros,
>>
>> Sobre os engines de busca:
>>
>> On Tue, Dec 20, 2011, at 08:46 PM, breno wrote:
>> > Em termos de engines de busca, se você gosta do Lucene pode dar uma
>> > olhada no Plucene => https://metacpan.org/module/Plucene ou nas APIs
>> (...)
>> > Outro bastante popular é o KinoSearch =>
>> > https://metacpan.org/module/KinoSearch
>> (...)
>> > Também tem wrapper pro Lucy da Apache
>> > (https://metacpan.org/module/Lucy)
>>
>> De forma bastante resumida, o KinoSearch foi um esforço de rewrite do
>> Plucene, que estava cheio de problemas e largado, usando uma versão mais
>> recente do Lucene (na época) como referência. O Lucy é o sucessor do
>> KinoSearch, com as mesmas pessoas, e o que o caracteriza, em relação ao
>> o KinoSearch, é que o core dele foi pro C e as interfaces pra usar esse
>> core do perl ou de outras linguagens é via bindings, com isso "evitando
>> retrabalho e trazendo alegria para toda a família" :D
>>
>> Enfim, se você gosta do Lucene ou do KinoSearch, vá pro Lucy --
>> #lucy_dev na rede freenode ;)
>>
>> Abraço,
>>
>> Nuba
>> --
>> Nuba R. Princigalli  nuba em pauleira.com  http://pauleira.com @nprincigalli
>> Discipline is not an end in itself, just a means to an end. - King Crimson
>>
>> _______________________________________________
>> Rio-pm mailing list
>> Rio-pm em pm.org
>> http://mail.pm.org/mailman/listinfo/rio-pm
>>
>
>
> _______________________________________________
> Rio-pm mailing list
> Rio-pm em pm.org
> http://mail.pm.org/mailman/listinfo/rio-pm
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20111221/f5ee4c6b/attachment-0001.html>


Mais detalhes sobre a lista de discussão Rio-pm