[Dresden-pm] Perl, utf8 und Umlaute

Mo Jun 7 01:35:50 PDT 2010

Hallo Steffen,

> "Martin Probst (RobHost Support)" <support at robhost.de> writes:
>> Hi Steffen,
>> 
>> um es vorweg zu nehmen, mein Problem hat sich größtenteils schon
>> erledigt. Ich hole mir die Daten jetzt als Latin1 und kodiere diese
>> erst bei der Ausgabe zu UTF-8.  Das behebt die meisten Probleme die
>> ich habe.
> 
> Dann interessiert mich aber trotzdem noch der Rest.
> 
> Ich hab in einem Projekt schon manuell rumtricksen müssen, wenn manche
> Frameworks ihre eigenen Heuristiken haben und wasserbettmäßig immer
> genau das ausgleichen wollen, was man an den Daten grad gefixt
> hat. Damals war das HTML::Mason oder eine Dependency davon.

Das Problem war auch Perl bedingt, allerdings eher durch einen Fehler meinerseits. Ich habe alle entgegengenommen Strings mit

utf8::encode($string) unless utf8::is_utf8;

getestet.

Dabei kamen dann doppelt kodierter Müll raus. Auch war meine erste Idee mit no utf8; $regexen; use utf8; scheinbar keine gute Idee.

Nun ja jetzt klappt es ja, wie gesagt alles via Latin1 und erst bei der Ausgabe in UTF-8 umwandeln.

Danke trotzdem
Maddin