Datenmanagement

Datenmanagement ist die Praxis der Organisation und Aufrechterhaltung von Datenprozessen, um die laufenden Anforderungen des Informationslebenszyklus zu erfüllen. Der Schwerpunkt des Datenmanagements begann mit der elektronischen Ära der Datenverarbeitung. Datenverwaltungsmethoden haben jedoch Wurzeln im Rechnungswesen, in der Statistik, in der logistischen Planung und in anderen Disziplinen, die vor dem Aufkommen des Corporate Computing in der Mitte des 20. Jahrhunderts lagen.

Entwicklung und Vorteile des Datenmanagements

Ab den 1960er Jahren war die Association of Data Processing Service Organizations (ADAPSO) eine der wenigen Gruppen, die Best Practices für das Datenmanagement weiterleiteten, insbesondere in Bezug auf die Schulungen für die Berufsausbildung und die Datenqualitätssicherung. Im Laufe der Zeit wurden Informationen populärer als Daten, um die Ziele des Unternehmens-Computing zu beschreiben – zum Beispiel bei der Umbenennung von ADAPSO als ITAA (Information Technology Association of America) oder als Umbenennung der National Microfilm Association der Verein für Informations- und Image-Management (AIIM) – aber die Praktiken des Datenmanagements haben sich weiterentwickelt.

In den 70er Jahren begann sich das relationale Datenbankmanagementsystem im Zentrum des Datenmanagements zu etablieren. Basierend auf der relationalen Logik stellte die relationale Datenbank verbesserte Mittel bereit, um eine konsistente Datenverarbeitung sicherzustellen und doppelte Daten zu reduzieren oder zu verwalten. Diese Merkmale waren der Schlüssel für Transaktionsanwendungen. Mit dem Aufkommen der relationalen Datenbank wurden die Modellierung relationaler Daten, die Schemaerstellung, die Deduplizierung und andere Techniken zu einem größeren Teil der üblichen Datenverwaltungspraxis.

In den 1980er Jahren wurde die Data Management Association International (DAMA International) gegründet, um die datenbezogene Ausbildung zu verbessern. Die Daten wurden erneut zu einem führenden Begriff, als IT-Experten Data Warehouses mit relationalen Techniken für die Offline-Datenanalytik errichteten, die Geschäftsmanagern einen besseren Überblick über die wichtigsten Trends ihrer Organisation für die Entscheidungsfindung verschaffen. Modellierung, Schema- und Änderungsmanagement erforderten unterschiedliche Behandlungen mit dem Aufkommen von Data Warehousing, das die Sicht der Organisation auf Vorgänge verbesserte.

Arten der Datenverwaltung

DAMA International und andere Gruppen haben daran gearbeitet, das Verständnis verschiedener Ansätze für das Datenmanagement zu verbessern. Ein solcher Ansatz, das Master Data Management (MDM), ist beispielsweise eine umfassende Methode, die es einem Unternehmen ermöglicht, alle kritischen Daten mit einer einzigen Datei (Master-Datei) zu verknüpfen, die einen gemeinsamen Bezugspunkt darstellt. Data Stewardship, Datenqualitätsmanagement, Data Governance, MDM und Datensicherheitsmanagement gehören zu den Komponenten der Datenverwaltungspraktiken vieler Fachleute. DAMA hat neben anderen Gruppen, die Zertifizierungen im Bereich Datenmanagement-Fähigkeiten überwachen, den DAMA-Leitfaden für das Data Management Body of Knowledge (DAMA DMBOK) erstellt, der versucht, eine branchenübliche Ansicht der Datenmanagementfunktionen und -methoden zu definieren.

Die Sicht auf Daten als Unternehmensressourcen und die Sorge um datenbezogene Verantwortlichkeiten haben im Laufe der Zeit zugenommen. Datenverwaltungsfachleute sind mit der Suche nach Möglichkeiten zur Monetarisierung von Unternehmensdaten beauftragt – sei es durch die Rationalisierung von Prozessen, die Verbesserung vorhandener Produkte oder den Verkauf von Daten.

Die effektive Verwaltung von Unternehmensdaten hat an Bedeutung gewonnen, da Unternehmen immer mehr Compliance-Vorschriften unterliegen. Gleichzeitig hat das schiere Datenvolumen, das von Organisationen verwaltet werden muss, so stark zugenommen, dass es manchmal als Big Data bezeichnet wird.

Datenverwaltungsaufgaben

Viele Datenmanager sind für die Datensicherheit und die Haftung des Unternehmens verantwortlich. Strengere Finanzaufzeichnungen und Verbraucherschutzanforderungen werden von Gesetzen oder Verordnungen bestimmt, die die Richtlinien von Basel III, Sarbanes-Oxley Act und PCI-DSS (Payment Card Industry Data Security Standard) einschließen.

Die datenschutzrechtlichen Verantwortlichkeiten für das Datenmanagement haben in den letzten Jahren zugenommen, insbesondere vor dem Hintergrund hochrangiger Daten-Hacks, die 2013 bei dem Einzelhändler Target und 2017 bei Equifax aufgetreten sind. Auch ein europäischer Datenschutzstandard (GDPR) ist bekannt werden zum Fokus der Datenmanagement-Projektplanung in Europa und darüber hinaus.

Mit dem Ausbau der Datentechnologien hat sich auch der Bereich Datenverwaltung erweitert. Zunehmende Datenmengen und Echtzeitverarbeitung der Daten haben Datenframeworks wie Hadoop und Spark eingeläutet. Die Datenvielfalt ist ebenfalls gewachsen. Unstrukturierte Datentypen verfügen über komplizierte Datenmodellierungsverfahren und führen zu einer Reihe von Datenbanken, die kein SQL verwenden, die strukturierte Abfragesprache, die eng mit der Verwendung relationaler Datenbanken verbunden ist. Gemeinsam sind die neuen Technologien unter das Banner von Big Data geraten. Die Analystengruppe Gartner hat In-Database-Analysen, Ereignisstromverarbeitung, Diagrammdatenbanken, Schlüsselspeicher und verteilte Ledger als einige der zu verwaltenden Datenverwaltungstechnologien aufgelistet.

Datenverwaltungshistorie

Die erste Blüte der Disziplin des Datenmanagements wurde maßgeblich von IT-Profis vorangetrieben, die sich auf die Lösung des Problems des Müllabfalls (GIGO) konzentrierten. Dieses Problem wurde bereits bei den ersten Mainframes deutlich, als außergewöhnliche Computer falsche Schlüsse zogen, weil sie ungenaue oder ungenügende Daten enthielten.

Zu den in der Geschichte des Datenmanagements bemerkenswerten Zahlen gehören E.F. “Ted” Codd, der das relationale Modell für das Datenbankmanagement konzipierte. Ralph Kimball, der die Theorie der Dimensionsmodellierung für Data Warehousing entwickelte; Bill Inmon, Autor und Data Warehouse-Technologe; Jim Gray, der geholfen hat, granulare Datenbanken zu sperren; und Michael Stonebraker, der relationale Datenbanken für Computer der frühen Mittelklasse entwickelte, bevor er an der Entwicklung einer Reihe von kolumnaren, strömungsorientierten und objektorientierten Datenbanken mitwirkte.

Ansätze für das Datenmanagement durchdrangen schließlich den sogenannten Datenlebenszyklus, der die Erstellung, Speicherung, Verarbeitung, Archivierung und manchmal auch die Zerstörung von Daten umfasst.