[Dresden-pm] Charset einer Datei bestimmen
Andreas Kunert
akunert at main-rheiner.de
Mit Okt 1 02:49:39 CDT 2003
Hallo,
habe einen vielleicht recht einfache Frage.
Folgendes Problem.
Ich bekomme eine Exportdatei, die auf einem Mac gebaut wird und auf
einer Linux-Maschine eingelesen werden soll.
Bevor mein Script die Datei verarbeitet, wird sie recodiert von mac in
latin1
/usr/bin/recode mac..latin1 filename
Das klappte auf der alten Maschine (SUN Solaris) problemlos.
Auf meiner neuen Maschine (Debian 3.0) bekomme ich nun ab und zu
Fehlermeldungen dieser Art.:
/usr/bin/recode: /tmp/filename failed: Invalid input in step
`MacCentralEurope..ISO-8859-1'
/usr/bin/recode: /tmp/filename failed: Invalid input in step
`macintosh..ISO-8859-1'
Ich hab mich ein wenig belesen und die Fehlermeldung von recode bedeutet
so ungefähr das der Input den angegebenen Zeichensatz nicht enthält und
daher auch nicht umgewandelt wird. (Lieber nicht als falsch umwandeln
sagt recode)
Ich würde jetzt dieses Problem gern lösen, indem ich rauszufinden
versuche, welchen Zeichensatz die Datei verwendet. Hat jemand ne Idee?
Das Ganze ist natürlich wie immer sehr dringend. :-)
Was mich völlig durcheinander bringt ist, das 4 Tage lang täglich die
exportierte Datei problemlos gelesen und importiert werden konnte.
Gruß Andreas