Textkompression

text compression

Die Textkompression ist eine verlustfreie Kompression mit einer Datenreduktion zwischen 20 % und 50 %. Zum Ansatz kommen zwei unterschiedliche Verfahren die auf der Statistik von Buchstaben und Zeichen basieren und den Wörterbuchverfahren. Da Texte Redundanzen in Buchstaben oder Wörtern enthalten, ist das Ziel der Textkompression die Verminderung von Redundanzen. Dies kann sich auf Buchstaben, Ziffern, Zeichen und Binärdaten beziehen wie bei der Lauflängencodierung. Andererseits kann die Codierung auch mit variablen Längen erfolgen. Dabei werden den am häufigsten vorkommenden Buchstaben kurze Bitsequenzen zugeordnet, wie beim alten Morse-Code bei dem der Buchstaben "e" nur durch das kurze Zeichen signalisiert wurde.

Andere Textkompressionsverfahren wie die Huffman-Codierung setzen auf die Häufigkeit der Zeichen und leiten daraus die Substitution ab.

Querverweise von Textkompression nach:

Querverweise nach Textkompression von:

ART@IT - Das Kunstprojekt von ITWissen