ASR (automatic speech recognition)

Automatische Spracherkennung

Die automatische Spracherkennung, Automatic Speech Recognition (ASR) oder Automatic Voice Recognition (AVR), ist die technische Adaption der Sprachanalyse in Form der automatischen Interpretation von menschlicher Sprache. Die automatische Spracherkennung umfasst die Erkennung von Sprache, Schlüsselwörtern und Sätzen und deren Bedeutung ebenso wie die Identifizierung eines Sprechers für sicherheitsrelevante Funktionen, wie die Zugriffsberechtigung oder Autorisierung.

Automatische Spracherkennungssysteme zeichnen sich durch die Anzahl der eingespeicherten Wörter aus, durch das Verstehen von verschiedenen Sprechern, durch die Möglichkeit des Erlernens von Wörtern und durch die Treffsicherheit.

Die menschliche Aussprache ist nicht exakt und von der Sprechgeschwindigkeit, der individuellen Aussprache und dem Redefluss abhängig, der keine eindeutige Trennung zwischen Laut-, Silben- und Wortgrenzen kennt. Bei der automatischen Spracherkennung muss der Computer die Sprache und die Aussprache ansatzweise erkennen. Solche Systeme arbeiten mit der Erkennung von ganzen Wörtern oder einzelnen Phonemen. Bei der Ganzwortmethode werden ganze Wörter vorgesprochen und gespeichert. Bei der Spracheingabe durchsucht der Computer dann den Speicher nach einem entsprechenden Wortmuster.

Die phonemische Spracherkennung ist wesentlich exakter und unterteilt jedes Wort in einzelne Phoneme, das sind die kleinsten lautsprachlichen Einheiten.

Inhalt teilen

Partner