Texterkennung

Texterkennung sind Techniken mit denen gedruckte und handgeschriebene Texte erkannt, verarbeitet und korrigiert werden. Bei den Texten kann es sich im solche handeln, die in Formulare eingetragen sind, um korrigierte Druckvorlagen oder auch um handgeschriebene Texte.

Texterkennungssysteme unterscheiden zwischen Groß- und Kleinbuchstaben, sowie zwischen Ziffern und Zeichen. Sie erkennen Texte in den verschiedensten Schriftarten und lassen sich nicht von Schriftgrößen, Fettgraden oder anderen typografischen Charakteristika beeinträchtigen.

Von der Entwicklung her basieren die verschiedenen Texterkennungssysteme, die intelligente Zeichenerkennung (ICR) und die Handschrifterkennung (HCR), auf der optischen Zeichenerkennung (OCR) und damit auf einer Mustererkennung. Für die optische Texterkennung wurden auch spezielle OCR-Schrifttypen entwickelt, die von den automatischen Lesesystemen fehlerfrei erkannt werden. Da diese Schrifttypen nicht in Druckschriften und auch nicht für Handgeschriebenes in Druckbuchstaben verwendet werden können, wurde die intelligente Zeichenerkennung (ICR) entwickelt, die Druckschriften und Handschriften erkennt indem sie mit statistischen Wahrscheinlichkeiten, linguistischen Ausführungen, semantischen Zusammenhängen und Wörterbüchern arbeitet.

Informationen zum Artikel
Deutsch: Texterkennung
Englisch: text recognition
Veröffentlicht: 24.02.2017
Wörter: 157
Tags: Datenverarbeitung
Links: Formular, DGT (digit), Handschrifterkennung, Intelligente Zeichenerkennung, Mustererkennung