English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Grundlegende Anleitung zu Python

Flow Control in Python

Python Funktion

Python Datentypen

Dateioperationen in Python

Python-Objekte und Klassen

Python-Daten und Zeit

Hochwertiges Wissen über Python

Python-Referenzhandbuch

Verwendung und Beispiel der Methode encode() der Python-Zeichenkette

Python Stringmethoden

Die Methode encode() der Zeichenkette verwendet die angegebene Kodierung, um die Zeichenkette zu kodieren. Wenn keine Kodierung angegeben ist, wird UTF-8.

von Python 3.0 beginnt,Zeichenkettewird im Unicode-Format gespeichert, d.h.Zeichenkettejeder Zeichen wird durch einen Codepunkt dargestellt. Daher ist jede Zeichenkette nur eine Sequenz von Unicode-Codepunkten.

Um diese Zeichenketten effektiv zu speichern, wird die Sequenz von Codepunkten in ein Byte-Set umgewandelt. Dieser Prozess wirdKodierung.

Es gibt verschiedene Kodierungen, die unterschiedlich mit Zeichenketten umgehen. Beliebte Kodierungen sindutf-8,asciiu.a.

Mit dem encode()-Verfahren der Zeichenkette können Sie eine nicht kodierte Zeichenkette in jede vom Python unterstützte Kodierung umwandeln. Standardmäßig verwendet Pythonutf-8Kodierung.

Die Syntax der Methode encode() ist:

string.encode(encoding='UTF-8',errors='strict')

Zeichenkette encode() Parameter

Standardmäßig erfordert die Methode encode() keine Parameter.

Es gibt eine Zeichenkette zurück-8Kodierungsversion. Wenn ein Fehler auftritt, wird eine UnicodeDecodeError-Ausnahme ausgelöst.

Aber es benötigt zwei Parameter:

  • encoding -Die Zeichenkette muss in die Kodierungskategorie kodiert werden

  • errors-Antwort bei Fehlschlag der Kodierung. Es gibt sechs Arten von Fehlerantworten

    • strict-Standardantwort, die bei einem Fehler UnicodeDecodeError-Ausnahme auslöst

    • ignore-Ignorieren Sie nicht kodierbaren Unicode aus dem Ergebnis

    • replace-Ersetzen Sie nicht kodierbaren Unicode durch ein Fragezeichen?

    • xmlcharrefreplace-Fügen Sie die XML-Zeichenreferenz ein, anstatt nicht kodierbaren Unicode

    • Backslash-Ersatz-Fügen Sie die \ uNNNN-Escape-Sequenz ein, anstatt nicht kodierbaren Unicode

    • namereplace-Fügen Sie die Escape-Sequenz \ N {...} ein, anstatt nicht kodierbaren Unicode

Beispiel1: Kodierung ist der Standard Utf-8Kodierung

# Unicode-Zeichenkette
string = 'pythön!'
# Ausgabe Zeichenkette
print('Zeichenkette:', string)
# Standardkodierung utf-8
string_utf = string.encode()
# Ausgabeergebnis
print('Kodierungsversion:', string_utf)

Wenn Sie das Programm ausführen, wird ausgegeben:

Zeichenkette: pythön!
Kodierungsversion: b'pyth\xc3\xb6n!

Beispiel2Verwendung falscher Kodierungsparameter

# Unicode-Zeichenkette
string = 'pythön!'
# Ausgabe string
print('Zeichenkette:', string)
# ignore error
print('Kodierter Version (ignore) :', string.encode("ascii", "ignore"))
# Fehler durch Ersetzen
print('Kodierter Version (replace) :', string.encode("ascii", "replace"))

Wenn Sie das Programm ausführen, wird ausgegeben:

Zeichenkette: pythön!
Kodierter Version (ignore) : b'pythn!'
Kodierter Version (replace) : b'pyth?n!'

Achtung:Versuchen Sie verschiedene Kodierungs- und Fehlerparameter.

Python Stringmethoden