From dominic at s5g.de Tue Mar 3 13:01:31 2015 From: dominic at s5g.de (Dominic Sonntag) Date: Tue, 03 Mar 2015 22:01:31 +0100 Subject: [Dresden-pm] =?windows-1252?q?_Dresden_Perl_Mongers_Treffen_M=E4r?= =?windows-1252?q?z_2015?= In-Reply-To: <547D78C0.5060104@s5g.de> References: <547D78C0.5060104@s5g.de> Message-ID: <54F6212B.20705@s5g.de> Am Donnerstag treffen sich wieder die Dresden Perl Mongers. Neben den allgemeinen Themen wird es wieder um die Vorbereitung des German Perl Workshop gehen, der vom 6. bis 8. Mai 2015 in Dresden stattfinden wird! Donnerstag, 05. März 2015 2o.oo Uhr Newtown Bar Helgolandstraße 9 b / Ecke Fritz-Reuter-Str. 01097 Dresden http://goo.gl/maps/jwyiv http://newtownbar.de Aktuelle Infos hier: * http://dresden-pm.org/PM/TermineTreffen Allgemein: Wir reden und hacken üblicherweise an unserem eigenen Kram rum und bieten ernsthaften Support rund um Perl-Einstiegsthemen wie * Code-Reviews * erstes CPAN-Modul bauen * Updates zu Perl[56], Parrot, Rakudo, Perlworkshop, YAPC und für Fortgeschrittene * Trost * Folklore * misc & etc Jeder ist eingeladen. Grüße, Dominic From joerg.westphal at ionix.de Wed Mar 4 11:12:04 2015 From: joerg.westphal at ionix.de (=?UTF-8?Q?J=C3=B6rg_Westphal?=) Date: Wed, 4 Mar 2015 20:12:04 +0100 (CET) Subject: [Dresden-pm] =?utf-8?q?Dresden_Perl_Mongers_Treffen_M=C3=A4rz_201?= =?utf-8?q?5?= In-Reply-To: <54F6212B.20705@s5g.de> References: <547D78C0.5060104@s5g.de> <54F6212B.20705@s5g.de> Message-ID: <1919515895.2205961.1425496324469.JavaMail.open-xchange@ptangptang.store> > Dominic Sonntag hat am 3. März 2015 um 22:01 geschrieben: > > Donnerstag, 05. März 2015 > 2o.oo Uhr Ich melde schon mal Teilnahme an. Gruß Jörg From dominic at s5g.de Wed Mar 4 11:20:40 2015 From: dominic at s5g.de (Dominic Sonntag) Date: Wed, 04 Mar 2015 20:20:40 +0100 Subject: [Dresden-pm] =?windows-1252?q?Dresden_Perl_Mongers_Treffen_M=E4rz?= =?windows-1252?q?_2015?= In-Reply-To: <1919515895.2205961.1425496324469.JavaMail.open-xchange@ptangptang.store> References: <547D78C0.5060104@s5g.de> <54F6212B.20705@s5g.de> <1919515895.2205961.1425496324469.JavaMail.open-xchange@ptangptang.store> Message-ID: <54F75B08.6020202@s5g.de> Ich kann diesmal leider nicht kommen. Am 04.03.2015 um 20:12 schrieb Jörg Westphal: > >> Dominic Sonntag hat am 3. März 2015 um 22:01 geschrieben: >> >> Donnerstag, 05. März 2015 >> 2o.oo Uhr > > > Ich melde schon mal Teilnahme an. > > Gruß Jörg > _______________________________________________ > Dresden-pm mailing list > Dresden-pm at pm.org > http://mail.pm.org/mailman/listinfo/dresden-pm > From ss5 at renormalist.net Wed Mar 4 12:37:07 2015 From: ss5 at renormalist.net (Steffen Schwigon) Date: Wed, 04 Mar 2015 21:37:07 +0100 Subject: [Dresden-pm] =?utf-8?q?Dresden_Perl_Mongers_Treffen_M=C3=A4rz__20?= =?utf-8?q?15?= In-Reply-To: <1919515895.2205961.1425496324469.JavaMail.open-xchange@ptangptang.store> (=?utf-8?Q?=22J=C3=B6rg?= Westphal"'s message of "Wed, 4 Mar 2015 20:12:04 +0100 (CET)") References: <547D78C0.5060104@s5g.de> <54F6212B.20705@s5g.de> <1919515895.2205961.1425496324469.JavaMail.open-xchange@ptangptang.store> Message-ID: <87egp4v6rw.fsf@renormalist.net> Jörg Westphal writes: >> Dominic Sonntag hat am 3. März 2015 um 22:01 geschrieben: >> >> Donnerstag, 05. März 2015 >> 2o.oo Uhr > > Ich melde schon mal Teilnahme an. Ich auch. Steffen -- Steffen Schwigon From joerg.westphal at ionix.de Sat Mar 14 05:56:58 2015 From: joerg.westphal at ionix.de (=?UTF-8?B?SsO2cmcgV2VzdHBoYWw=?=) Date: Sat, 14 Mar 2015 13:56:58 +0100 Subject: [Dresden-pm] Fwd: User Group News 03/15 In-Reply-To: <20150312121803EEF6B24824$75E3E7F18B@AZUBI> References: <20150312121803EEF6B24824$75E3E7F18B@AZUBI> Message-ID: <5504301A.80902@ionix.de> -------- Weitergeleitete Nachricht -------- Betreff: User Group News 03/15 Datum: Thu, 12 Mar 2015 12:18:03 +0100 Von: O'Reilly Verlag Antwort an: ug at oreilly.de An: User Group News 03/15 O'Reilly Tarsier O'REILLY Homepage | Blog | Facebook | Google+ | Twitter * - bitte weiterleiten - **Liebe User-Group-Mitglieder*, heute haben wir wieder für Euch die Übersicht zu unseren deutsch- und englischsprachigen Neuerscheinungen der letzten Wochen: *Fürs Business und E-Commerce* Technisches SEO Lean Enterprise Blockchain *Für Programmierer* Entwurfsmuster von Kopf bis Fuß, 2. Auflage Cython Building Microservices Metaprogramming Elixir *Für Webprogrammierer und -entwickler *JavaScript Cookbook, 2nd Edition Enyo: Up and Running, 2nd Edition The Uncertain Web Elasticsearch: The Definitive Guide *Für Maker* Raspberry Pi für Einsteiger, 2. Auflage Arduino: A Quick-Start Guide, 2nd Edition *Für Netzwerkspezialisten* Getting Started with OpenBTS Bei Rezensionswünschen (Print oder PDF/EPUB) genügt eine kurze Mail. Gerne stellen wir auch einzelne Titel zu Verlosungszwecken zur Verfügung. Wir freuen uns auf die Einschätzung der Community! Herzliche Grüße aus Köln, Eure O'Reillys PS: Im oreillyblog haben wir Euch schon mal eine Übersicht zu Veranstaltungen zusammengestellt, bei denen wir 2015 vertreten sein werden (mindestens mit Büchern vor Ort): http://community.oreilly.de/blog/2015/02/20/da-simmer-dabei-2015/ Vielleicht seid Ihr auch dort oder habt eigene Veranstaltungen, bei denen wir Euch unterstützen können? Meldet Euch gerne bei uns :) ------------------------------------------------------------------------ Ihr erhaltet diesen Newsletter, weil ihr beim O'Reilly User-Group-Programm angemeldet seid, in der Vergangenheit Bücher von uns angefordert bzw. anderweitig Interesse an unserem Verlag gezeigt habt. Wenn Ihr diesen Verteiler verlassen möchtet - eine kurze Mail an ug at oreilly.de genügt. ------------------------------------------------------------------------ Computerbücher von O'Reilly - http://www.oreilly.de O'Reilly Verlag GmbH & Co.KG Balthasarstraße 81 50670 Köln Germany anfragen at oreilly.de 0049-221-973160-0 Registergericht Köln, HRA 13894. Geschäftsführer: Timothy O'Reilly, Elke Hansel -------------- nächster Teil -------------- Ein Dateianhang mit HTML-Daten wurde abgetrennt... URL: From Toni.Stadler at mailbox.tu-dresden.de Wed Mar 18 11:39:07 2015 From: Toni.Stadler at mailbox.tu-dresden.de (Toni Stadler) Date: Wed, 18 Mar 2015 18:39:07 +0000 Subject: [Dresden-pm] perl Message-ID: <20150318183907.Horde.LdpDjI51VYT6Olh7aEkJng1@mail.zih.tu-dresden.de> Hallo! Vielleicht kann mir jemand von euch mit meinem Perl-Projekt helfen. Es geht um die Wirkung von Medikamenten bzw. die Effekte bei Mischkonsum von verschiedenen Medikamenten. Zunächst brauche ich erstmal eine Funktion, die eine Sammlung von Einzeltexten öffnet. In diesen Texten wird die Wirkung der Substanzen von Endverbrauchern beschrieben. Ziel ist es herauszufinden, ob in den Beschreibungen bestimmter Medikamente einige Wörter besonders häufig auftreten. Diese Texte sind im xml-Format und befinden sich in einem Unterordner in Dokumente -> Texte_alles -> xml_raw. Zu Beginn jedes dieser Einzeltexte gibt es eine Kopfzeile in der steht um welche(s) Medikament(e) es sich jeweils in dem Text handelt. Das sieht in jedem Einzeltext etwa so aus: Aspirin oder Mischkonsum von Aspirin und Alkohol Um herauszufinden welche Wörter häufig in der Beschreibung zu bestimmten Medikamenten benutzt werden, brauche ich eine Funktion, die alle 4.000 Einzeltexte nach Medikamenten sortiert und dann die absolute Häufigkeit jedes Wortes in allen Texten zu genau diesem Medikament auflistet. Wenn es also z.B. 38 Texte über den Mischkonsum von Aspirin und Alkohol gibt, dann sollte die Funktion jeden dieser Texte nacheinander durchgehen und mir eine Liste mit den am häufigsten gebrauchten Wörtern ausgeben, etwa so: 27x "übel" 19x "schlecht" 16x "schwindelig" usw. Natürlich werden auch Wörter wie "und" oder "der" usw. ausgegeben, aber die Analyse wird dann später "per Hand" gemacht. Ich hoffe ich habe das verständlich ausgedrückt. Ich würde mich riesig freuen wenn mir jemand damit helfen kann, zumindest ein paar Denkanstößen. Danke im Vorraus Toni From ddpm at liscovius.de Wed Mar 18 14:43:58 2015 From: ddpm at liscovius.de (ddpm at liscovius.de) Date: Wed, 18 Mar 2015 22:43:58 +0100 Subject: [Dresden-pm] perl In-Reply-To: <20150318183907.Horde.LdpDjI51VYT6Olh7aEkJng1@mail.zih.tu-dresden.de> References: <20150318183907.Horde.LdpDjI51VYT6Olh7aEkJng1@mail.zih.tu-dresden.de> Message-ID: <72392646698f2f4db46411426e2e155a@confixx.service-log.in> Am 18.03.2015 19:39, schrieb Toni Stadler: > Medikament auflistet. Wenn es also z.B. 38 Texte über den Mischkonsum > von Aspirin und Alkohol gibt, dann sollte die Funktion jeden dieser > Texte nacheinander durchgehen und mir eine Liste mit den am > häufigsten > gebrauchten Wörtern ausgeben, etwa so: > 27x "übel" > 19x "schlecht" > 16x "schwindelig" usw. Und wenn jemand schreibt: Koffein und Alkohol Also ClubMate-Wodka ist garni ma so übel. Mir ist überhaupt ni schlecht gewordn und hab die Weiber schwindlig getanzt. Klingt für mich nach einer recht komplexen Aufgabe die maschinelles Sprachverständnis benötigt. Was soll denn rauskommen und für wen? From Toni.Stadler at mailbox.tu-dresden.de Wed Mar 18 15:17:42 2015 From: Toni.Stadler at mailbox.tu-dresden.de (Toni Stadler) Date: Wed, 18 Mar 2015 22:17:42 +0000 Subject: [Dresden-pm] perl In-Reply-To: <72392646698f2f4db46411426e2e155a@confixx.service-log.in> References: <20150318183907.Horde.LdpDjI51VYT6Olh7aEkJng1@mail.zih.tu-dresden.de> <72392646698f2f4db46411426e2e155a@confixx.service-log.in> Message-ID: <20150318221742.Horde.v73Y9P0OZm2rS1ZXxTXaBw1@mail.zih.tu-dresden.de> Danke für die Antwort! Das stimmt, bei 4.000 Texten ist das eine ziemlich komplexe Aufgabe. Vielleicht war ich da etwas zu optimistisch. Es würde zunächst auch ausreichen, wenn ich mir ein einziges Medikament (bzw. Mischkonsum-Kombination) auswähle und die dazugehörigen Texte auswerte. Alternativ wäre es auch möglich zu schauen wie oft ein bestimmtes Wort pro Substanz auftaucht. Zum Beispiel: Wie oft taucht das Wort "bunt" in Berichten über LSD (die Texte beinhalten auch Drogenerfahrungsberichte) auf und wie oft in Berichten über eine beliebige andere Substanz. Das Ganze ist für eine Arbeit für die Uni. Es geht weniger um das Endergebnis als um das Programmieren und die Verarbeitung von Texten selbst. Das heißt, solange ich am Ende ein ausführbares Script habe, das die gegebenen Texte entsprechend verarbeitet, ist das völlig ausreichend. Ich habe übrigens das Ganze nochmal als Textdatei (.txt) bekommen, in der alle 4.000 Einzeltexte in einer einzigen Datei untereinander stehen. So wäre es also nicht nötig mit .xml zu arbeiten. Liebe Grüße Zitat von ddpm at liscovius.de: > Am 18.03.2015 19:39, schrieb Toni Stadler: >> Medikament auflistet. Wenn es also z.B. 38 Texte über den Mischkonsum >> von Aspirin und Alkohol gibt, dann sollte die Funktion jeden dieser >> Texte nacheinander durchgehen und mir eine Liste mit den am häufigsten >> gebrauchten Wörtern ausgeben, etwa so: >> 27x "übel" >> 19x "schlecht" >> 16x "schwindelig" usw. > > Und wenn jemand schreibt: > Koffein und Alkohol > Also ClubMate-Wodka ist garni ma so übel. Mir ist überhaupt ni > schlecht gewordn und hab die Weiber schwindlig getanzt. > > Klingt für mich nach einer recht komplexen Aufgabe die maschinelles > Sprachverständnis benötigt. Was soll denn rauskommen und für wen? > > _______________________________________________ > Dresden-pm mailing list > Dresden-pm at pm.org > http://mail.pm.org/mailman/listinfo/dresden-pm From ddpm at liscovius.de Wed Mar 18 16:02:19 2015 From: ddpm at liscovius.de (ddpm at liscovius.de) Date: Thu, 19 Mar 2015 00:02:19 +0100 Subject: [Dresden-pm] perl In-Reply-To: <20150318221742.Horde.v73Y9P0OZm2rS1ZXxTXaBw1@mail.zih.tu-dresden.de> References: <20150318183907.Horde.LdpDjI51VYT6Olh7aEkJng1@mail.zih.tu-dresden.de> <72392646698f2f4db46411426e2e155a@confixx.service-log.in> <20150318221742.Horde.v73Y9P0OZm2rS1ZXxTXaBw1@mail.zih.tu-dresden.de> Message-ID: <200844b7ba1d581643b94a306e851924@confixx.service-log.in> Am 18.03.2015 23:17, schrieb Toni Stadler: > Das stimmt, bei 4.000 Texten ist das eine ziemlich komplexe Aufgabe. Naja, eigentlich egal ob 1, 4000 oder 4000000 Texte wennsn Script macht. :-) > Das Ganze ist für eine Arbeit für die Uni. Es geht weniger um das > Endergebnis als um das Programmieren und die Verarbeitung von Texten > selbst. Das heißt, solange ich am Ende ein ausführbares Script habe, > das die gegebenen Texte entsprechend verarbeitet, ist das völlig > ausreichend. Also ich würde mit dem gegebenen XML arbeiten, das ist ja dann schon teilstrukturiert und somit fallen ein paar mögliche Fehler bei der Interpretation der Texte weg. Naja, und die Texte selbst .. mit regulären Ausdrücken sind Suchwörter leicht zu finden und zu zählen. Aber mit dem Verständnis des Textes hat das halt erstmal nicht viel zu tun und dann wirds schnell superkomplex. ( Grammatik, Tipp- und Rechtschreibfehler, welche Sprache, welcher Dialekt, Szenebegriffe für bestimmte Drogen/Medikamente, Zeitraum des Textes, Ironie!?, Verneinung (und doppelte - in deutsch?, in englisch?), ..) APIs zu Siri/Apple, Google, oder Watson/IBM nutzen und schauen was deren KI so liefert? ;-) From steffen at steffen-winkler.de Fri Mar 20 01:01:04 2015 From: steffen at steffen-winkler.de (Steffen Winkler) Date: Fri, 20 Mar 2015 09:01:04 +0100 Subject: [Dresden-pm] Fwd: Re: [Erlangen-pm] perl - die Frage von Toni Stadler In-Reply-To: References: Message-ID: <550BD3C0.2060207@steffen-winkler.de> Hier die Antwort vom Helmut (Erlangen.pm) auch zum Mitlesen für Dresden.pm, weil die Antwort doch recht interessant ist. Hi, da gibt es prinzipiell 3 Möglichkeiten: - ein halbswegs passendes Paket benutzen, Stichwort Textindizierung und Relevanz, ist Teil von Suchmaschinen z.B. SOLR, ElasticSearch - einmal ordentlich Publikationen zu dem Thema durchackern, Ausgangspunkt z.B. Ted Pedersen https://metacpan.org/author/TPEDERSE - selber herumbasteln, weils Spass macht und/oder Existenzberechtigung generiert Zum Basteln: Grundfrage ist schon mal, was ein Wort ist. Der String: ein, eines, eine, einer sind dann 4 verschiedene Wörter, aber der selbe Stamm. Der Sinn (Bedeutung, Semantik): Alkohol, Äthanol, z.T. Bier, Wein, Schnaps, alkoholhältiges Getränk; Alkoholkonsum, Konsum von Alkohol ? Die Wörter eines Textes zählen funktioniert mal grundsätzlich so: #!perl use strict; use warnings; use utf8; binmode(STDIN, ':utf8'); binmode(STDOUT,':utf8'); my $words = {}; my $stopwords; $stopwords->{$_} = () for qw( in die von und ich eine es der dann ); while (my $line = ) { chomp($line); my @tokens = grep { !exists $stopwords->{$_} } # ist kein stopword grep { $_ !~ /\d/ } # Worte ohne Ziffern map {lc} # lowercase $line =~ /(\w{2,})/g; # tokens - alphanumerisch, mind. 2 Zeichen for my $token (@tokens) { $words->{$token}++; } } # sort descending (highest value first) my @keys = sort { $words->{$b} <=> $words->{$a} } keys(%$words); for my $key ( @keys ) { printf "%-20s %6d\n", $key, $words->{$key}; } Da kommt dann auf den Text dieser Originalmail angewandt etwa folgendes raus: drug 4 medikamenten 4 mischkonsum 3 funktion 3 aspirin 3 texte 3 wörter 3 einzeltexte 2 helfen 2 alkohol 2 ... HTH Helmut Wollmersdorfer Am 18.03.2015 um 19:44 schrieb Steffen Winkler : > Helmut, da kennst Du Dich sicher gut mit aus. > Grüße von Steffen Winkler. From roberto.schaefer86 at googlemail.com Mon Mar 30 22:47:50 2015 From: roberto.schaefer86 at googlemail.com (=?UTF-8?Q?Roberto_Sch=C3=A4fer?=) Date: Tue, 31 Mar 2015 07:47:50 +0200 Subject: [Dresden-pm] German Perl Workshop in Dresden / May 6th to May 8th 2015 Message-ID: You programm in Perl or teach the use of Perl? You have new ideas, a great project or a thrilling story to tell about the use of Perl? You want to get to know new ideas and concepts in Perl programming? Then you're right at the German Perl Workshop 2015! The German Perl Workshop is the largest German speaking event about Perl. It is the right platform for your idea, your project or your story. In 2015 the German Perl Workshop will take place from May 6th to May 8th at the "Volkshaus" in Dresden. About 130 attendees where at the 2014 workshop. We are searching for: Your idea. Your project. Your story. We are looking for challenging presentations for our program. Those might be Lightning Talks 5min), short presentations (20 minutes) or long lectures (40 min). If you search for suggestions for lecture topics, try looking through the FAQ (german). Please submit your paper proposals on the website as soon as possible. The official deadline March 31st, but we are still searching for some more presentations! The presentations and participants are the heart of our workshop. We are looking forward to seeing you - as a participant and as a speaker. You can also attend the workshop by registering on our website: http://act.yapc.eu/gpw2015/ If you have any questions, feel free to contact us at info at gpw2015.de -------------- nächster Teil -------------- Ein Dateianhang mit HTML-Daten wurde abgetrennt... URL: