die listen haben es in sich.... ich denke, die muster, die ich dir jetzt notiere, mssten stimmen: jede datei hat einen header und einen footer. in den beispiel-files (endung *.lst), siehst du NUR den header, und 10-100 beispiel zeilen, den rest habe ich weggeschnibbt. jede datei ist im original eine unix-datei (LF versus CR) im einzelnen: das wichtigste, was das bindeglied ist, ist der movie-titel. also ist das die wichtigste liste: die movie-liste ;-) die ansetzung MUSS berall korrekt sein. sie ist der verknpfer.... aus movies.lst: 1 és a semmi (2004) 2004 ~~~~~~~~~~~~~~~~~~~ENDE dazwischen tabs? ~~~~wiederholung des jahres von vorne??? 1% One Percenters: Search for a Screenplay (2005) (TV) 2005 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ENDE~~(TV) ist ?wichtiger? zusatz!? aus actresses.lst: hier findest du im header: rules ;-) sehr informativ. z.b. Aabarg, Annika Leif (1987) [Journalist #6] <54> ~~~~~~~~~~~~~~Name ~~~~~~~~~~~ das ist der Titelansatz von oben! Er stimmt berein zu 100% er muá es! sonst keine Verknpfung Aabel, Per (II) Ordeal in the Arctic (1993) (TV) <9> ~~~ ich denke, daá dieser zusatz ?nicht? wichtig ist, oder doch? Tote von Amelung, Die (1995) (TV) [Constanze] Twenty Bucks (1993) [Rich Woman] <32> DAS HAUPTPROBLEM: Aadland, Beverly Cuban Rebel Girls (1959) [Beverly Woods] <1> Cuban Story (1959) (uncredited) [Herself] Death of a Salesman (1951) [Girl] Marjorie Morningstar (1958) (uncredited) South Pacific (1958) (as Beverly Adland) [Nurse in Th¯ Too Much, Too Soon (1958) (uncredited) [Extra] "You Bet Your Life" (1950) in allen listen, ausser(?) movies, werden die ERSTeintr„ge NICHT wiederholt. "Aadland, Beverly" MUSS in jeder zeile stehen, (im export) die aka-Liste enth„lt titelverweisungen (aka: also known as) auch hier wieder das hauptproblem: "$10,000 Pyramid, The" (1973) (aka "$100,000 Pyramid, The" (1991)) (USA) (syndication title) (aka "$20,000 Pyramid, The" (1976)) (USA) (new title) (aka "$25,000 Pyramid, The" (1974)) (USA) (syndication title) (aka "$50,000 Pyramid, The" (1981)) (USA) (new syndication title) (aka "New $100,000 Pyramid, The" (1985)) (USA) (new syndication title) (aka "New $25,000 Pyramid" (1982)) (USA) (new title) achtung, die " am anfang und am ende , geh”ren zum echten titel. also muss "$10,000 Pyramid, The" (1973) beim export in JEDER zeile stehen es hat bereits jemand, wer?, einige rexxzeilen gebastelt: /* REXX */ parse arg name1 name2 /* alles bis einschließlich erster Überschriftzeile überspringen */ do while lines(name1) ibuf = linein(name1) if (pos("MOVIES LIST",ibuf)=1) then leave end /* eine Leerzeile überspringen */ ibuf = linein(name1) /* eine Leerzeile überspringen */ ibuf = linein(name1) /* Zieldatei erzeugen */ call lineout name2 /* alle Datensätze kopieren */ do while lines(name1) ibuf = linein(name1) if (pos("----------------------------------------------------------------------------",ibuf)=1) then leave call lineout name2, ibuf end return und hier einige perl-zeilen: #rem bergers einzeiler #rem perl -000 -p -e "{} while s/^([^\t]+)\t+(.*)\n\t+([^\n]+)/$1\t$2\n$1\t$3/s" prod.lst > prod.neu #rem pause #!perl -w use strict; $/ = ""; # im folgenden absatzweise einlesen while ( <> ) { # Fuer jeden "Absatz" while ( # ersetze solange ersetzbar ist. Naemlich: s/^([^\t]+) # Anfang des Absatzes \t+(.*) # Tabs(+) plus egal \n\t+([^\n]+) # Zeile, die mit Tab begint /$1\t$2\n$1\t$3/sx # durch Anfang Mitte Anfang Rest ) { # nur ersetzen, nichts weiter tun } print; # Ueberarbeitete Zeilengruppe ausgeben } ich habe bereits einige batchszeilen zusammengestellt, in der ich die datenbank recode, sie auf dos-basis umstelle (aus dem linux-format), bestimmte zeichen suche und ersetzt (z.b. tab-sammlungen). das hauptproblem ist einen vernnftigen export zu bekommen, der mit wiederholungen arbeitet, UND der vernnftige trenner hat. ich kann z.b. sowas SEHR gut einlesen/weiterverarbeiten: aus: Abbamania: We Say Thank You for the Music (2004) (TV) 2004 wird: #20 Abbamania: We Say Thank You for the Music (2004) (TV)#76 2004 bei mir steht #20LEER fr feldname fr Titel [weiss noch nicht, was mit (TV) geschieht...] #76LEER fr feldname fr Jahr usw.