[Vienna-pm] Re: unicode

peter pilsl pilsl at goldfisch.at
Thu Sep 30 10:28:17 CDT 2004


Peter J. Holzer wrote:

> 
> Im ersten Fall ist das intern eben nicht mehr c3 a4, sondern 
> c3 83 c2 a4 (also die UTF-Kodierung von \u00C3 \u00A4.
> 

DANKE !! das war ein theoretischer augenöffner !!

>>
>>use POSIX qw(locale_h);
>>use locale;
>>setlocale(LC_COLLATE, "de_AT");
> 
>                          ^^^^^
> 			 de_AT ist mit hoher Wahrscheinlichkeit falsch.
> Das ist wahrscheinlich eine Locale mit iso-8859-15, nicht mit UTF-8. 
> Probier mal de_AT.utf8. 


Ich habe das locale "de_AT.utf8" schon sehr oft versucht und habe immer 
das gleiche - falsche - Ergebnis erhalten.
Nachdem das aber bei dir funktioniert hat, bin ich auf alle System 
gewandert, die ich so unter den Finger kriegen konnte. Und tatsächlich 
habs einige, wos funktioniert hat und bei anderen nicht.

To make a long story/day short: Mandrake verwendet bei den i18n-locales 
einen anderen Syntax !! Das locale heisst also nicht "de_AT.utf8", 
sondern "de_AT.UTF-8"  (casesensitive !!) !!

JAWOLL !!! die sache läuft. Und zwar ziemlich genauso, wie ich es vom 
Anfang an geplant hatte. Da es aber nie funktioniert hat, hab ich 
soviele pods u mans gelesen bis ich mich dezitiert nicht mehr ausgekannt 
habe und es hat immer noch nicht funktioniert und ich hab die Ursache 
immer in meinem Kopf und im Encoding gesucht.  Auf die idee mit dem 
anderen i18n-syntax bin ich nie gekommen !! Wo ist sowas dokumentiert 
eigentlich? (ist aber keine perl-frage mehr ...)

vielen dank für alle, die mir geholfen haben. Mal sehen, ob das jetzt 
auch in weiteren Tests so lauft, wie es laufen soll.

Derzeit hab ich noch ein kleineres Problem:

m//i funktioniert nicht, was man aber leicht umgehen kann, indem man die 
Variablen vorher lowercased. scheinbar hat m//i hier eine andere 
lc-lösung als lc() selbst ...

Wenn ich das script fertig habe, kann ich das demo hier mit einer kurzen 
erklärung posten, falls das interessiert?

text einlesen, sortieren, lowercase, regexp patternmatch, ausgeben
und das ganze auch in eine datenbank speichern und sort, lowercase u 
patternmatch auch dort ausführen können


danke,
peter



-- 
mag. peter pilsl
goldfisch.at
IT-management
tel +43 699 1 3574035
fax +43 699 4 3574035
pilsl at goldfisch.at


More information about the Vienna-pm mailing list