On Thu, Jul 28, 2011 at 5:04 AM, Daniel de Oliveira Mantovani <<a href="mailto:daniel.oliveira.mantovani@gmail.com">daniel.oliveira.mantovani@gmail.com</a>> wrote:<br>> Olá pessoal, vocês já ouviram falar de algum algoritmo que separe o<br>

> sujeito, predicado e objeto de uma frase ? De frases simples, como<br>> títulos de notícias.<br>><br><br>Oi Daniel :-)<br><br>Primeiramente isto não é análise semântica, e sim sintática. Os algorítmos indicado baseiam-se no conjunto de técnicas conhecidas como <b>Part-of-Speech Tagging</b> (esse é o nome que vc deve buscar no google ehehehe).<br>

<br>Você vai precisar de um léxico da língua (acho que português)... o sucesso de QUALQUER algoritmo depende exclusivamente de ter um léxico, um corpus anotado como casos de aplicação, e tempo de treinamento. O algoritmo em si varia pouco!!<br>

<br>Eu costumava usar Python e <a href="http://www.nltk.org/">NLTK</a> pra isso, principalmente porquê ele já trás excelente suporte a nossa lingua: <a href="http://nltk.googlecode.com/svn/trunk/doc/howto/portuguese_en.html">http://nltk.googlecode.com/svn/trunk/doc/howto/portuguese_en.html</a><br>

<br>Deve haver soluções boas e tools (nivel NLTK) em Perl tb! Mas considere usar os léxicos e corpus disponíveis no NLTK, caso opte por usar outra tool Perl: my two cents! ;-)<br><br>Outras opções de toolboxes e Libs: <a href="http://en.wikipedia.org/wiki/List_of_natural_language_processing_toolkits">http://en.wikipedia.org/wiki/List_of_natural_language_processing_toolkits</a><br>

<br>Espero ter ajudado. Boa sorte,<br>Carlos.<br>