[Dresden-pm] perl

ddpm at liscovius.de ddpm at liscovius.de
Mi Mär 18 16:02:19 PDT 2015


Am 18.03.2015 23:17, schrieb Toni Stadler:
> Das stimmt, bei 4.000 Texten ist das eine ziemlich komplexe Aufgabe.

Naja, eigentlich egal ob 1, 4000 oder 4000000 Texte wennsn Script 
macht. :-)

> Das Ganze ist für eine Arbeit für die Uni. Es geht weniger um das
> Endergebnis als um das Programmieren und die Verarbeitung von Texten
> selbst.  Das heißt, solange ich am Ende ein ausführbares Script habe,
> das die gegebenen Texte entsprechend verarbeitet, ist das völlig
> ausreichend.

Also ich würde mit dem gegebenen XML arbeiten, das ist ja dann schon 
teilstrukturiert und somit
fallen ein paar mögliche Fehler bei der Interpretation der Texte weg.

Naja, und die Texte selbst .. mit regulären Ausdrücken sind Suchwörter 
leicht zu finden und zu zählen.




Aber mit dem Verständnis des Textes hat das halt erstmal nicht viel zu 
tun und dann wirds schnell superkomplex.
( Grammatik, Tipp- und Rechtschreibfehler, welche Sprache, welcher 
Dialekt, Szenebegriffe für bestimmte Drogen/Medikamente, Zeitraum des 
Textes,
  Ironie!?, Verneinung (und doppelte - in deutsch?, in englisch?), ..)

APIs zu Siri/Apple, Google, oder Watson/IBM nutzen und schauen was 
deren KI so liefert? ;-)



Mehr Informationen über die Mailingliste Dresden-pm