[Vienna-pm] Speichervariablen in Regulaeren Ausdruecken

Christian 'arc' Schoeller c_p_s at gmx.net
Thu Jun 10 13:54:24 CDT 2004


Ich moechte mit einem Perl-Skript einzelne Teile der Ueberschrift
eines HTML-Dokuments in unterschiedliche Variablen speichern.

Hier die gewuenschte Arbeitsweise des Skripts:
- Verbindung zu "example.html" aufbauen
- "example.html" in einer while-Schleife zeilenweise einlesen
- Jede Zeile mit einem Regulaeren Ausdruck vergleichen:
    - Uebereinstimmung:       - Einzelne Teile in Speichervariablen
                                uebernehmen
                              - Schleife verlassen
    - keine Uebereinstimmung: - Naechste Zeile einlesen
- Verbindung beenden
- Speichervariablen ausgeben

Mein Skript sieht so aus:

,----[ extract.pl ]----
|
| #!/usr/bin/perl
|
| open EXAMPLE, "example.html";
| while (<EXAMPLE>) {     
|   last if $_ =~ /<h1>\[(.+)\/(.+)\] (.+)<\/h1>/;
|   }
| close EXAMPLE;
| print "$1, $2, $3";
|
 \_____________________

Es soll aus HTML-Dokumenten mit folgendem Aufbau extrahieren (auf
relevante Zeile beschraenkt):

,----[ example.html ]----
|
| <h1>Text fuer $1/Text fuer $2 Text fuer $3</h1>
|
 \_______________________

Mein Problem ist, dass $1, $2 und $3 leer bleiben. Das Muster findet
Uebereinstimmung, die Schleife wird an der richtigen Stelle verlassen,
nur sind die Speichervariablen immer ohne Inhalt.

Was mache ich falsch?

TIA,
    C.
-- 
Christian 'arc' Schoeller         | There is no justice. 
HTTP {http://cps.shellmaster.de}  | There is just me.
ICQ  {199627353}                  | --Death
MAIL {c_p_s at gmx.net}              | --Terry Pratchett
-------------- next part --------------
A non-text attachment was scrubbed...
Name: not available
Type: application/pgp-signature
Size: 186 bytes
Desc: not available
Url : http://mail.pm.org/pipermail/vienna-pm/attachments/20040610/54e87efc/attachment.bin


More information about the Vienna-pm mailing list