Détecteur d'encodage de caractères - Analyser l'encodage et les caractères
Détectez l'encodage des caractères et analysez le texte pour la pureté ASCII, les caractères multi-octets UTF-8, les emojis, le nombre d'octets, et plus encore
Calculatrices
Calculator
Comment utiliser
1Collez ou saisissez votre texte dans la zone de saisie
2Cliquez sur Analyser
3Consultez le type d'encodage détecté, le nombre d'octets, le nombre de caractères, la détection d'emojis et le nombre de caractères uniques
Questions fréquentes
ASCII est un encodage sur 7 bits qui couvre 128 caractères (lettres anglaises, chiffres et symboles de base). UTF-8 est un sur-ensemble d'ASCII qui peut encoder n'importe quel caractère Unicode en utilisant de 1 à 4 octets par caractère.
En UTF-8, les caractères en dehors de la plage ASCII de base nécessitent 2 à 4 octets chacun. Par exemple, un emoji comme 😀 est 1 caractère mais occupe 4 octets. Le texte en ASCII pur a des nombres d'octets et de caractères égaux.
Tout caractère dont le point de code Unicode est supérieur à 127 nécessite plus d'un octet en encodage UTF-8. Cela inclut les lettres accentuées (é, ü), les caractères CJK (chinois, japonais, coréen) et les emojis.
Les emojis sont détectés en vérifiant si un caractère appartient aux plages Unicode standard des emojis, notamment les émoticônes, symboles et pictogrammes.