Zeichenkodierungs-Detektor - Textkodierung & Zeichen analysieren

Zeichenkodierung erkennen und Text auf ASCII-Reinheit, UTF-8-Mehrbyte-Zeichen, Emojis, Byte-Anzahl und mehr analysieren

Rechner

Calculator

Anleitung

1Text in das Eingabefeld einfügen oder eintippen
2Analysieren klicken
3Den erkannten Kodierungstyp, die Byte-Anzahl, Zeichenanzahl, Emoji-Erkennung und die Anzahl eindeutiger Zeichen anzeigen

Häufig gestellte Fragen

ASCII ist eine 7-Bit-Kodierung, die 128 Zeichen abdeckt (englische Buchstaben, Ziffern und grundlegende Symbole). UTF-8 ist eine Obermenge von ASCII, die beliebige Unicode-Zeichen mit 1 bis 4 Bytes pro Zeichen kodieren kann.

In UTF-8 benötigen Zeichen außerhalb des grundlegenden ASCII-Bereichs jeweils 2–4 Bytes. Ein Emoji wie 😀 ist beispielsweise 1 Zeichen, benötigt aber 4 Bytes. Reiner ASCII-Text hat gleiche Byte- und Zeichenanzahlen.

Jedes Zeichen mit einem Unicode-Codepunkt über 127 benötigt in der UTF-8-Kodierung mehr als ein Byte. Dazu gehören Buchstaben mit Akzenten (é, ü), CJK-Zeichen (Chinesisch, Japanisch, Koreanisch) und Emojis.

Emojis werden erkannt, indem geprüft wird, ob ein Zeichen in die standardmäßigen Unicode-Emoji-Bereiche fällt, einschließlich Emoticons, Symbolen und Piktogrammen.