[Dresden-pm] Charset einer Datei bestimmen

Andreas Kunert akunert at main-rheiner.de
Mit Okt 1 02:49:39 CDT 2003


Hallo,

habe einen vielleicht recht einfache Frage.
Folgendes Problem.
Ich bekomme eine Exportdatei, die auf einem Mac gebaut wird und auf 
einer Linux-Maschine eingelesen werden soll.
Bevor mein Script die Datei verarbeitet, wird sie recodiert von mac in 
latin1
/usr/bin/recode mac..latin1 filename
Das klappte auf der alten Maschine (SUN Solaris) problemlos.
Auf meiner neuen Maschine (Debian 3.0) bekomme ich nun ab und zu 
Fehlermeldungen dieser Art.:

/usr/bin/recode: /tmp/filename failed: Invalid input in step 
`MacCentralEurope..ISO-8859-1'
/usr/bin/recode: /tmp/filename failed: Invalid input in step 
`macintosh..ISO-8859-1'

Ich hab mich ein wenig belesen und die Fehlermeldung von recode bedeutet 
so ungefähr das der Input den angegebenen Zeichensatz nicht enthält und 
daher auch nicht umgewandelt wird. (Lieber nicht als falsch umwandeln 
sagt recode)

Ich würde jetzt dieses Problem gern lösen, indem ich rauszufinden 
versuche, welchen Zeichensatz die Datei verwendet. Hat jemand ne Idee?

Das Ganze ist natürlich wie immer sehr dringend. :-)

Was mich völlig durcheinander bringt ist, das 4 Tage lang täglich die 
exportierte Datei problemlos gelesen und importiert werden konnte.

Gruß Andreas