English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
Die Methode encode() der Zeichenkette verwendet die angegebene Kodierung, um die Zeichenkette zu kodieren. Wenn keine Kodierung angegeben ist, wird UTF-8.
von Python 3.0 beginnt,Zeichenkettewird im Unicode-Format gespeichert, d.h.Zeichenkettejeder Zeichen wird durch einen Codepunkt dargestellt. Daher ist jede Zeichenkette nur eine Sequenz von Unicode-Codepunkten.
Um diese Zeichenketten effektiv zu speichern, wird die Sequenz von Codepunkten in ein Byte-Set umgewandelt. Dieser Prozess wirdKodierung.
Es gibt verschiedene Kodierungen, die unterschiedlich mit Zeichenketten umgehen. Beliebte Kodierungen sindutf-8,asciiu.a.
Mit dem encode()-Verfahren der Zeichenkette können Sie eine nicht kodierte Zeichenkette in jede vom Python unterstützte Kodierung umwandeln. Standardmäßig verwendet Pythonutf-8Kodierung.
Die Syntax der Methode encode() ist:
string.encode(encoding='UTF-8',errors='strict')
Standardmäßig erfordert die Methode encode() keine Parameter.
Es gibt eine Zeichenkette zurück-8Kodierungsversion. Wenn ein Fehler auftritt, wird eine UnicodeDecodeError-Ausnahme ausgelöst.
Aber es benötigt zwei Parameter:
encoding -Die Zeichenkette muss in die Kodierungskategorie kodiert werden
errors-Antwort bei Fehlschlag der Kodierung. Es gibt sechs Arten von Fehlerantworten
strict-Standardantwort, die bei einem Fehler UnicodeDecodeError-Ausnahme auslöst
ignore-Ignorieren Sie nicht kodierbaren Unicode aus dem Ergebnis
replace-Ersetzen Sie nicht kodierbaren Unicode durch ein Fragezeichen?
xmlcharrefreplace-Fügen Sie die XML-Zeichenreferenz ein, anstatt nicht kodierbaren Unicode
Backslash-Ersatz-Fügen Sie die \ uNNNN-Escape-Sequenz ein, anstatt nicht kodierbaren Unicode
namereplace-Fügen Sie die Escape-Sequenz \ N {...} ein, anstatt nicht kodierbaren Unicode
# Unicode-Zeichenkette string = 'pythön!' # Ausgabe Zeichenkette print('Zeichenkette:', string) # Standardkodierung utf-8 string_utf = string.encode() # Ausgabeergebnis print('Kodierungsversion:', string_utf)
Wenn Sie das Programm ausführen, wird ausgegeben:
Zeichenkette: pythön! Kodierungsversion: b'pyth\xc3\xb6n!
# Unicode-Zeichenkette string = 'pythön!' # Ausgabe string print('Zeichenkette:', string) # ignore error print('Kodierter Version (ignore) :', string.encode("ascii", "ignore")) # Fehler durch Ersetzen print('Kodierter Version (replace) :', string.encode("ascii", "replace"))
Wenn Sie das Programm ausführen, wird ausgegeben:
Zeichenkette: pythön! Kodierter Version (ignore) : b'pythn!' Kodierter Version (replace) : b'pyth?n!'
Achtung:Versuchen Sie verschiedene Kodierungs- und Fehlerparameter.