[mailinglist] Re: [Python-de] htmllib und Umlaute
Klaus Meyer
km-news1 at onlinehome.de
Thu May 1 16:59:28 EDT 2003
>> Wie verhalten sich die vielen in Python vorhanden Fkt/Module etc., die
>> irgendwo Strings erwarten?
>
> Die verhalten sich alle richtig...
Hm, Im Prinzip ja, denn da es ja zB für Tkinter, obwohl schon lange in
Python vorhanden, in der Py-Doku immer noch keine richtige Beschreibung
gibt, ist natürlich jedes Verhalten "richtig" ;-)
Bei der Rückgabe von Strings aus Entry und Filedialoge habe ich folgendes
festgestellt:
Es sind Bytestrings, solange die Filenamen oder Tex im Entry ohne Umlaute
sind, sonst sind es Unicode-Strings.
Vermutlich ist das Verhalten so "richtig"?
Beim umgekehrten Weg, Ausgabe mit insert() in Widgets wie Entry oder Text,
habe bisher noch keine Unicode-Errors gesehen, obwohl doch zB Print schnell
einen Unicode-Error wirft. Hm, das Verhalten von Tkinter bleibt hier etwas
unklar. Es scheint mir ein Latin-1-Default zu geben für Bytestrings mit
darin enthaltenen Zeichen > 127.
Zur Erzeugung von Unicode-Strings gibt es zB die folgenden 2 Methoden:
unicode("String", "encode")
u"String"
Im ersten Fall kann man einen Encoder angeben, aber nach welchem System
wird eigentlich bei u"" encodet? Hier muss doch ein Default wirken?
>>> unicode("Götter", "latin-1")
u'G\x94tter'
>>> unicode("Götter", "cp850")
u'G\xf6tter'
>>> a=u"Götter"
>>> a
u'G\x94tter'
--
Mit freundlichen Grüßen
Klaus Meyer :-)
More information about the Python-de
mailing list