Tobi's Blog

Unicode in Perl 5

Erstellt von Tobi am Montag 14. November 2005

Laut IX gibt es Probleme, wenn man in Perl eine aus MySQL gelesene Variable verwendet, ohne sie explizit in UTF8 zu wandeln.

Zitat:

utf8_on setzt das UTF-8-Flag der Variablen: MySQL kennt kein UTF-8 und liefert alles als Latin-1 zurück (oder binär), sodass man Perl an die UTF8-Kodierung des Skalars erinnern muss.

Wie man das macht, hab ich allerdings nicht herausgefunden.

In der URL können UTF-8 Zeichen z.B. als %3C%BC dargetsellt werden. Wenn man das einzeln in Perl dekodiert:
print chr(0x3C) . chr(0xBC);

bekommt man das UTF-8 Zeichen ü heraus. Das Zeichen wird warscheinlich aufgrund von irgendeiner Signatur interpretiert, da nicht alle Zeichen auch als UTF-8 in 4-Byte angegeben werden. Man kann sich also nicht sicher sein, dass der obige Code 1 UTF-8 Zeichen oder 2 ASCII Zeichen enthält. Interessant ist aber, dass man ein korrektes UTF-8 Zeichen so darstellen kann.

Kommentar schreiben

XHTML: Sie können diese Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>