Datenqualität beschreibt die Korrektheit, die Relevanz und die Verlässlichkeit von Daten. Sie beschreibt ihre Konsistenz und ihre Verfügbarkeit auf verschiedenen Rechnersystemen. In der Informationstechnologie ist Datenqualität eines der wichtigsten Kriterien zur Beurteilung eines IT-Systems.
Datenqualität wird nach vielen verschiedenen Kriterien bewertet. Hier die wichtigsten, die sich auf das System, die Darstellung der Daten, deren Nutzung und ihren Inhalt beziehen:
- System: Zugänglichkeit, Bearbeitbarkeit,
- Darstellung: Verständlichkeit, Übersichtlichkeit, Einheitlichkeit, Interpretierbarkeit/ Widerspruchsfreiheit,
- Nutzung: Relevanz, Aktualität, Wertschöpfung, Vollständigkeit, Angemessenheit,
- Inhalt: Richtigkeit/Fehlerfreiheit, Objektivität, Glaubwürdigkeit, Reputation.
Die Deutsche Gesellschaft für Informations- und Datenqualität (DGIQ) hat 2007 eine anwenderbezogene Definition auf Basis der Forschungsergebnisse von Richard Wang und Diane Strong von 1996 veröffentlicht. Grundlage sind die von Wang/Strong ermittelten 15 Dimensionen der Informationsqualität welche in dem Diagramm aufgeführt sind. Nach dieser Studie sehen fast die Hälfte der Unternehmen eine gute Datenqualität als Erfolgs- und Wettbewerbsvorteil und messen diesem Thema eine große Bedeutung zu.
In der Praxis wird als Maß für die Datenqualität verstanden, wie gut die Konsistenz und die Verfügbarkeit gleicher Daten auf verschiedenen Systemen ist. Wie sauber die vorhandenen Daten abgelegt worden sind und wie gut die Darstellung mit den erwarteten Ergebnissen übereinstimmt. Die Datenqualität muss dabei im Erfassungssystem selbst aber auch bei der Übertragung in Zielsysteme (z.B. Data Warehouse Systeme) und alternative Darstellungen (z.B. Auswertungen) überwacht werden. Dazu müssen in jeder Stufe des Datenflussprozesses geeignete Maßnahmen zur Qualitätssicherung umgesetzt werden.