UCS-Zeichensatz

Universal Character Set (UCS) ist ein nach ISO 10646 standardisierter Zeichensatz, der 32 Bits, resp. 4 Byte, pro Zeichen hat. Die 4.294.967.296 Möglichkeiten des UCS- Codes bieten hinreichend Platz für die unterschiedlichsten Sprachen, Zeichen und Bildzeichen.

Da der Zeichensatzumfang des USC-Zeichensatzes nicht mehr in einer Codetabelle dargestellt werden kann, ist beim UCS-Zeichensatz die Sprach- und Zeichenzuordnung in 128 Gruppen, 256 Ebenen, 256 Spalten mit 256 Zellen gegliedert. Mit diesem umfangreichen Adressraum können alle Schriftzeichen in allen Sprachen abgebildet werden.

Der UCS-Zeichensatz ist aus dem ASCII- Code und dem Unicode hervorgegangen. Es gibt verschiedene USC-Codes, so den USC-2, bei dem jedes Zeichen durch 2 Bytes codiert ist oder den USC-4, dessen Zeichen aus 4 Bytes bestehen. Mit UCS-2 können alle Unicode-Zeichen dargestellt werden, deren Nummer unter 65.536 liegt. Der USC-4-Code kann insgesamt 128 x 256 x 256 x 256 Zeichen darstellen. Dabei bleibt das erste Bit des ersten Byte ungenutzt, daher die 128.

Deutsch:	UCS-Zeichensatz
Englisch:	universal character set - UCS
Veröffentlicht:	19.02.2011
Wörter:	139
Tags:	Zeichensätze
Links:	uniform chromaticity scale (UCS), Internationale Standardisierungs-Organisation, Zeichensatz, Binäre Einheit, Byte
Übersetzung:	EN
Sharing: