[Dresden-pm] perl
ddpm at liscovius.de
ddpm at liscovius.de
Mi Mär 18 16:02:19 PDT 2015
Am 18.03.2015 23:17, schrieb Toni Stadler:
> Das stimmt, bei 4.000 Texten ist das eine ziemlich komplexe Aufgabe.
Naja, eigentlich egal ob 1, 4000 oder 4000000 Texte wennsn Script
macht. :-)
> Das Ganze ist für eine Arbeit für die Uni. Es geht weniger um das
> Endergebnis als um das Programmieren und die Verarbeitung von Texten
> selbst. Das heißt, solange ich am Ende ein ausführbares Script habe,
> das die gegebenen Texte entsprechend verarbeitet, ist das völlig
> ausreichend.
Also ich würde mit dem gegebenen XML arbeiten, das ist ja dann schon
teilstrukturiert und somit
fallen ein paar mögliche Fehler bei der Interpretation der Texte weg.
Naja, und die Texte selbst .. mit regulären Ausdrücken sind Suchwörter
leicht zu finden und zu zählen.
Aber mit dem Verständnis des Textes hat das halt erstmal nicht viel zu
tun und dann wirds schnell superkomplex.
( Grammatik, Tipp- und Rechtschreibfehler, welche Sprache, welcher
Dialekt, Szenebegriffe für bestimmte Drogen/Medikamente, Zeitraum des
Textes,
Ironie!?, Verneinung (und doppelte - in deutsch?, in englisch?), ..)
APIs zu Siri/Apple, Google, oder Watson/IBM nutzen und schauen was
deren KI so liefert? ;-)
Mehr Informationen über die Mailingliste Dresden-pm