<div dir="ltr"><div class="gmail_extra">2015-03-30 19:04 GMT-03:00 Marcio Ferreira <span dir="ltr"><<a href="mailto:marciodesouzaferreira@gmail.com" target="_blank">marciodesouzaferreira@gmail.com</a>></span>:<br></div><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div dir="ltr"><div class="gmail_extra"><div class="gmail_quote"><span class=""><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex"><div dir="ltr">Existem mesmo, vários métodos dentro de Cluster Analysis,se você quiser definir os grupos manualmente para todos as notícias que forem escritas, você pode usar Web Semantica.</div></blockquote><div><br></div></span><div>(Estou respondendo porque essa dúvida pode ser a de muitos).<br><br></div><div>Relacionar Web Semantica à trabalho manual, é como dizer que fazemos um Sistema Operacional do zero porque precisamos usar um <i>device</i>. Não criamos ontologias do zero, normalmente reaproveitamos as milhares de bases abertas que existem, exemplo é dbpedia e freebase.<br></div><div class="gmail_extra"> <br></div><div class="gmail_extra">A customização vem do ponto do seu negócio, o que é absolutamente normal. Quando instalo minha distro, preciso instalar mais programas que utilizo e configurá-los, ou ainda quando instalo meu database preciso configura-lo, criar tabelas, inserir registros, etc. Você pode estar se confundindo um pouco porque o paradigma não é convencional, pensar em grafos não é convencional.<br></div></div></div></div></blockquote><div><br></div><div><div class="gmail_extra"><br></div><div class="gmail_extra">A *única coisa* que Semantic Web resolve, é o fato de inserir metainformação para descrever atributo(s). Mas isso não resolve o problema de *separar notícias pelo mesmo assunto*.  Semantic Web não pode resolver o problema de agrupar notícias pelo mesmo assunto por causa da segunda lei da termodinâmica, entropia. Chega a ser absurda a simples comparação entre Cluster Analysis e Semantic Web, seria como comparar asteroides e shampoos para caspa. Se você quiser saber o nome de todas as pessoas numa determinada notícia, Semantic Web seria como uma luva.</div><div class="gmail_extra"><br></div><div class="gmail_extra"><br></div><div class="gmail_extra">Enquanto Cluster Analysis não precisa se preocupar com semântica das palavras (porque não importa), além de um esforço extra de engenharia de software e vai funcionar perfeitamente para *QUALQUER IDIOMA*.</div></div><div class="gmail_extra"><br></div><div class="gmail_extra"><div class="gmail_extra">1. What is Clustering?</div><div class="gmail_extra">A loose definition of clustering could be “the process of organizing objects into groups</div><div class="gmail_extra">whose members are similar in some way”.</div></div><div class="gmail_extra"><a href="https://www.cs.duke.edu/courses/fall03/cps260/notes/lecture18.pdf">https://www.cs.duke.edu/courses/fall03/cps260/notes/lecture18.pdf</a><br></div><div class="gmail_extra"><br></div><div>É a segunda vez que você fala de grafos como um pombo enxadrista. Só porque uma solução FOO usa grafos, não significa que uma solução BAR que usa grafos resolve o mesmo problema. Você não usa o Google Maps para indexar o seu banco de dados, não é mesmo ? (Red-Black Tree e Google Maps, ambos usam grafos)</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div dir="ltr"><div class="gmail_extra"><div class="gmail_quote"><div class="gmail_extra"><br></div><div class="gmail_extra"><i>Unsupervised learning</i> normalmente se emprega com uso de números, mas você consegue fazer de textos. Há muitos algoritmos e técnicas pra classificar texto, inclusive redes neurais.<br></div></div></div></div></blockquote><div><br></div><div><br></div><div>Unsupervised learning machine não, não se emprega a "números normalmente" (Seja lá o que isso signifique). Não existe relação nenhuma com o que você está dizendo "normalmente se emprega com números, mas você consegue fazer de textos". Em estatística os tipos das variáveis são discretas ou continuas.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div dir="ltr"><div class="gmail_extra"><div class="gmail_quote"><div class="gmail_extra"><br></div><div class="gmail_extra">Machine Learn é um campo extenso, cuidado com o martelo de Thor. Recomendo entender os diversos campos e aplicações antes de dar martela em tudo com unsupervised learning.<br></div></div></div></div></blockquote><div><br></div><div><br></div><div>O termo não é martelo de Thor, é golden hammer <a href="http://en.wikipedia.org/wiki/Law_of_the_instrument">http://en.wikipedia.org/wiki/Law_of_the_instrument</a> </div><div>Ninguém está falando em aplicar Cluster Analysis em tudo, e sim aplicar nesse problema específico.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div dir="ltr"><div class="gmail_extra"><div class="gmail_quote"><div class="gmail_extra"></div><div><div class="h5"><div class="gmail_extra"><div class="gmail_quote"><br><div><div><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex"><div dir="ltr">Márcio,<div><br><div>Você está certo. Existem vários métodos de agrupamento. A utilização de cliques em grafos é apenas mais um exemplo.</div><div>A aplicação de cálculos de distância do cosseno, similaridades, entropia da informação, entre outros métodos que utilizam as palavras (algumas delas) do conteúdo de um documento são apenas mais alguns dos vários exemplos de métodos existentes de agrupamento.</div><div><br></div><div>Abs,</div></div></div><div class="gmail_extra"><br><div class="gmail_quote">2015-03-30 15:09 GMT-03:00 Lucas Moraes <span dir="ltr"><<a href="mailto:lucastiagodemoraes@gmail.com" target="_blank">lucastiagodemoraes@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex"><span><div dir="ltr"><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex">Vale a pena ver de novo: "London-pm" ...</blockquote></div><br></div></div>
<br></span><span>=begin disclaimer<br>
   Sao Paulo Perl Mongers: <a href="http://sao-paulo.pm.org/" target="_blank">http://sao-paulo.pm.org/</a><br>
 SaoPaulo-pm mailing list: <a href="mailto:SaoPaulo-pm@pm.org" target="_blank">SaoPaulo-pm@pm.org</a><br>
 L<<a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a>><br>
=end disclaimer<br>
<br></span></blockquote></div><span><font color="#888888"><br><br clear="all"><div><br></div>-- <br><div><div dir="ltr">Wesley Seidel Carvalho<div>11-9-8169-1163</div><div><a href="http://www.ime.usp.br/~wesleys" target="_blank">www.ime.usp.br/~wesleys</a></div><div><a href="http://ltasks.com/" target="_blank">www.ltasks.com</a><br>@wseidel<br><br></div></div></div>
</font></span></div>
<br>=begin disclaimer<br>
   Sao Paulo Perl Mongers: <a href="http://sao-paulo.pm.org/" target="_blank">http://sao-paulo.pm.org/</a><br>
 SaoPaulo-pm mailing list: <a href="mailto:SaoPaulo-pm@pm.org" target="_blank">SaoPaulo-pm@pm.org</a><br>
 L<<a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a>><br>
=end disclaimer<br>
<br></blockquote></div></div></div><br><br clear="all"><div><br></div>-- <br><span><div><br>-dom<br><br>--<br><br>Daniel de Oliveira Mantovani<br>Business Analytic Specialist<br>Perl Evangelist /Astrophysics hobbyist. <br>+55 11 9 8538-9897<br>XOXO</div>
</span></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex">
<br>=begin disclaimer<br>
   Sao Paulo Perl Mongers: <a href="http://sao-paulo.pm.org/" target="_blank">http://sao-paulo.pm.org/</a><br>
 SaoPaulo-pm mailing list: <a href="mailto:SaoPaulo-pm@pm.org" target="_blank">SaoPaulo-pm@pm.org</a><br>
 L<<a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a>><br>
=end disclaimer<br>
<br></blockquote></div></div></div><br></div></div>
<br>=begin disclaimer<br>
   Sao Paulo Perl Mongers: <a href="http://sao-paulo.pm.org/" target="_blank">http://sao-paulo.pm.org/</a><br>
 SaoPaulo-pm mailing list: <a href="mailto:SaoPaulo-pm@pm.org">SaoPaulo-pm@pm.org</a><br>
 L<<a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a>><br>
=end disclaimer<br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature"><br>-dom<br><br>--<br><br>Daniel de Oliveira Mantovani<br>Business Analytic Specialist<br>Perl Evangelist /Astrophysics hobbyist. <br>+55 11 9 8538-9897<br>XOXO</div>
</div></div>