[Python-de] UTF-8 Python Datei
Albert Hermeling
Albert.Hermeling at t-online.de
Mon Apr 25 20:05:08 CEST 2005
Guten Abend,
ich habe heute ein kleines Skript geschrieben das aus einer Datei ein Wort
ließt und dieses mit dem gleichen Wort in dem Skript vergleicht. Beide
Dateien (Text und Skript!) sind in UTF-8 gespeichert worden. Die Textdatei
wird mit codecs.open als Unicode Datei geöffnet.
Hier das Skript:
#!/usr/bin/python
#-*- coding: UTF-8 -*-
import codecs
f = codecs.open("text.txt","rb","utf8").read()
print type(f)
print type("Äpfel")
if f == "Äpfel":
print "Das ist Richtig"
Hier die Datei:
Äpfel
Wenn ich das Skript Starte bekomme ich folgende Meldung:
<type 'unicode'> <------- Richtig!!
<type 'str'> <------- Warum ist das ein String???
Traceback (most recent call last):
File "./anfuerungszeichen3.py", line 11, in ?
if f == "Ãpfel":
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 0:
ordinal not in range(128)
Es scheint also so das Python intern das Unicode Skript in ein ASCII Skript
umwandelt wieso?
Mit freundlichen Grüßen
Albert