[Dresden-pm] Perl, utf8 und Umlaute
Martin Probst (RobHost Support)
support at robhost.de
Mo Jun 7 01:35:50 PDT 2010
Hallo Steffen,
> "Martin Probst (RobHost Support)" <support at robhost.de> writes:
>> Hi Steffen,
>>
>> um es vorweg zu nehmen, mein Problem hat sich größtenteils schon
>> erledigt. Ich hole mir die Daten jetzt als Latin1 und kodiere diese
>> erst bei der Ausgabe zu UTF-8. Das behebt die meisten Probleme die
>> ich habe.
>
> Dann interessiert mich aber trotzdem noch der Rest.
>
> Ich hab in einem Projekt schon manuell rumtricksen müssen, wenn manche
> Frameworks ihre eigenen Heuristiken haben und wasserbettmäßig immer
> genau das ausgleichen wollen, was man an den Daten grad gefixt
> hat. Damals war das HTML::Mason oder eine Dependency davon.
Das Problem war auch Perl bedingt, allerdings eher durch einen Fehler meinerseits. Ich habe alle entgegengenommen Strings mit
utf8::encode($string) unless utf8::is_utf8;
getestet.
Dabei kamen dann doppelt kodierter Müll raus. Auch war meine erste Idee mit no utf8; $regexen; use utf8; scheinbar keine gute Idee.
Nun ja jetzt klappt es ja, wie gesagt alles via Latin1 und erst bei der Ausgabe in UTF-8 umwandeln.
Danke trotzdem
Maddin
Mehr Informationen über die Mailingliste Dresden-pm