Zeichensätze
Version vom 13. Dezember 2009, 15:04 Uhr von Wikiadmin (Diskussion | Beiträge)
Zur Darstellung von Zeichen werden Zeichensätze vereinbart. Die wichtigsten sind hier zusammengefasst.
Zeichensatz | Kurzbeschreibung | Erläuterung |
---|---|---|
ASCII | American Standard Code for Information Interchange | Der kleinste gemeinsame Nenner (fast) aller Zeichencodierungen (7-Bit Codierung), darauf aufbauende Codierungen erweitern ASCII z.B. um Umlaute (ISO 8859-1) oder ganz allgemein internationale Zeichen (Unicode) |
ISO 8859 | 8-Bit Codierung von Zeichen, weit verbreitet, jedoch inkompatibel mit UTF-8 | |
UTF-8 | Unicode Transformation Format 8 | Die XML Default-Codierung von Unicode Zeichen, jedes ASCII Dokument ist auch ein UTF-8 Dokument (UTF-8 codiert Zeichen als 1-6 Bytes). Jede XML Software muss UTF-8 unterstützen (siehe auch Allgemeine Erläuterungen zur Benutzung von XML). |
UTF-16 | Unicode Transformation Format 16 | Eine Zeichencodierung, die jedes Unicode Zeichen als 16 oder 32 Bit codiert (alle geläufigen Zeichen werden als 16 Bit codiert). Jede XML Software muss UTF-16 unterstützen. |