[Madrid-pm] Recursos lingüísticos

JJ Merelo jjmerelo en gmail.com
Sab Dic 14 04:59:16 PST 2013


Vosotros que sabéis de este tema (sobre todo Joaquín y Enrique), si
queremos usar tesauros o diccionarios de sinónimos, antónimos, hipérnimos y
todo eso, ¿cuál es la mejor opción?

Por lo pronto, me he encontrado
* FreeLing, un señor programa que ayuda a lematizar y a analizar partes del
discurso, pero no proporciona ningún otro recurso linguístico. Es una
librería en C++ pero se puede usar desde línea de órdenes.
* Lema.rae.es antes era fácil de usar y scrapear, pero ahora no parece
trivial: usa un hash para cada palabra que igual es un MC5 o algo igual de
fácil, pero a saber.
* Parser::Wiktionary por lo pronto es lo más asequible que he encontrado,
lo que ocurre es que no es tan completo como Wordnet y va bastante escaso
en hipérnimos e hipónimos, por ejemplo
* Hay un wordnet en español, pero no tengo ni idea de si es igual que el
WordNet en inglés. Me da la impresión de que es un intento de traducción
parcial de WordNet, pero son un mogollón de ficheros en XML cuyo formato no
es compatible con el WordNet inglés y, por tanto, no se puede usar co
Lingua::Wordnet (que, dicho sea de paso, está totalmente abandonado)
* Tesauro para OpenOffice, que se ofrece en un fichero dump de MySQL,
aparte de otros formatos para diversos programas. Este no lo he probado,
pero igual sería lo más fácil de usar.

¿Alguna otra idea?

-- 
JJ
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://mail.pm.org/pipermail/madrid-pm/attachments/20131214/57d699a3/attachment.html>


Más información sobre la lista de distribución Madrid-pm