[SP-pm] Analise Semântica

Carlos Costa crncosta at gmail.com
Thu Jul 28 04:23:17 PDT 2011


On Thu, Jul 28, 2011 at 5:04 AM, Daniel de Oliveira Mantovani <
daniel.oliveira.mantovani at gmail.com> wrote:
> Olá pessoal, vocês já ouviram falar de algum algoritmo que separe o
> sujeito, predicado e objeto de uma frase ? De frases simples, como
> títulos de notícias.
>

Oi Daniel :-)

Primeiramente isto não é análise semântica, e sim sintática. Os algorítmos
indicado baseiam-se no conjunto de técnicas conhecidas como *Part-of-Speech
Tagging* (esse é o nome que vc deve buscar no google ehehehe).

Você vai precisar de um léxico da língua (acho que português)... o sucesso
de QUALQUER algoritmo depende exclusivamente de ter um léxico, um corpus
anotado como casos de aplicação, e tempo de treinamento. O algoritmo em si
varia pouco!!

Eu costumava usar Python e NLTK <http://www.nltk.org/> pra isso,
principalmente porquê ele já trás excelente suporte a nossa lingua:
http://nltk.googlecode.com/svn/trunk/doc/howto/portuguese_en.html

Deve haver soluções boas e tools (nivel NLTK) em Perl tb! Mas considere usar
os léxicos e corpus disponíveis no NLTK, caso opte por usar outra tool Perl:
my two cents! ;-)

Outras opções de toolboxes e Libs:
http://en.wikipedia.org/wiki/List_of_natural_language_processing_toolkits

Espero ter ajudado. Boa sorte,
Carlos.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://mail.pm.org/pipermail/saopaulo-pm/attachments/20110728/8076b53c/attachment.html>


More information about the SaoPaulo-pm mailing list