[Vienna-pm] Re: unicode
peter pilsl
pilsl at goldfisch.at
Thu Sep 30 10:28:17 CDT 2004
Peter J. Holzer wrote:
>
> Im ersten Fall ist das intern eben nicht mehr c3 a4, sondern
> c3 83 c2 a4 (also die UTF-Kodierung von \u00C3 \u00A4.
>
DANKE !! das war ein theoretischer augenöffner !!
>>
>>use POSIX qw(locale_h);
>>use locale;
>>setlocale(LC_COLLATE, "de_AT");
>
> ^^^^^
> de_AT ist mit hoher Wahrscheinlichkeit falsch.
> Das ist wahrscheinlich eine Locale mit iso-8859-15, nicht mit UTF-8.
> Probier mal de_AT.utf8.
Ich habe das locale "de_AT.utf8" schon sehr oft versucht und habe immer
das gleiche - falsche - Ergebnis erhalten.
Nachdem das aber bei dir funktioniert hat, bin ich auf alle System
gewandert, die ich so unter den Finger kriegen konnte. Und tatsächlich
habs einige, wos funktioniert hat und bei anderen nicht.
To make a long story/day short: Mandrake verwendet bei den i18n-locales
einen anderen Syntax !! Das locale heisst also nicht "de_AT.utf8",
sondern "de_AT.UTF-8" (casesensitive !!) !!
JAWOLL !!! die sache läuft. Und zwar ziemlich genauso, wie ich es vom
Anfang an geplant hatte. Da es aber nie funktioniert hat, hab ich
soviele pods u mans gelesen bis ich mich dezitiert nicht mehr ausgekannt
habe und es hat immer noch nicht funktioniert und ich hab die Ursache
immer in meinem Kopf und im Encoding gesucht. Auf die idee mit dem
anderen i18n-syntax bin ich nie gekommen !! Wo ist sowas dokumentiert
eigentlich? (ist aber keine perl-frage mehr ...)
vielen dank für alle, die mir geholfen haben. Mal sehen, ob das jetzt
auch in weiteren Tests so lauft, wie es laufen soll.
Derzeit hab ich noch ein kleineres Problem:
m//i funktioniert nicht, was man aber leicht umgehen kann, indem man die
Variablen vorher lowercased. scheinbar hat m//i hier eine andere
lc-lösung als lc() selbst ...
Wenn ich das script fertig habe, kann ich das demo hier mit einer kurzen
erklärung posten, falls das interessiert?
text einlesen, sortieren, lowercase, regexp patternmatch, ausgeben
und das ganze auch in eine datenbank speichern und sort, lowercase u
patternmatch auch dort ausführen können
danke,
peter
--
mag. peter pilsl
goldfisch.at
IT-management
tel +43 699 1 3574035
fax +43 699 4 3574035
pilsl at goldfisch.at
More information about the Vienna-pm
mailing list