Moderne Unternehmen arbeiten mit Daten, und zwar mit sehr vielen Daten. Ein Data Warehouse bietet einen zentralen Ort, an dem Daten aus allen IT-Systemen zusammengeführt werden, um sie zu analysieren und die Erkenntnisse zu gewinnen, die Sie für Ihre Wettbewerbsfähigkeit benötigen. In diesem Leitfaden zu Data Warehouses wird erklärt, was ein Data Warehouse ist, warum Sie es brauchen, wie es verwendet wird und welche Vorteile Sie damit erzielen können.
Data Warehouse-Definition
Ein "Data Warehouse" ist ein Lager mit historischen Daten, das nach Themen geordnet ist, um die Entscheidungsträger in einem Unternehmen zu unterstützen. Data Warehouses sind Systeme, in denen Daten aus einer oder mehreren unterschiedlichen Quellen an einem zentralen Ort gespeichert werden, von wo aus sie für Berichte und Data Analytics. Die Daten im Data Warehouse können aktuell oder historisch sein und können in ihrer ursprünglichen Rohdatenform oder verarbeitet/zusammengefasst sein.
Die Daten in einem Data Warehouse werden aus Quellsystemen (wie ERP-, CRM- oder Finanzplattformen) importiert und im Warehouse gesammelt, wo sie unternehmensweit zur Erstellung von Analyseberichten und zur Unterstützung der Entscheidungsfindung genutzt werden können. Der allgemeine Prozess zur Aggregation und Transformation von Daten für das Warehousing wird als "Extrahieren, Transformieren und Laden", kurz ETL, bezeichnet. Das bedeutet, dass ein Unternehmen eine Kopie der Daten aus den Quellsystemen entnimmt, wobei die ursprünglichen Daten intakt und vorhanden bleiben, um eine Unterbrechung der laufenden Transaktionsprozesse zu vermeiden.
Sobald die Daten in das Data Warehouse geladen sind, werden sie weiter verfeinert und verarbeitet, um Probleme mit der Datenqualität zu beseitigen, voneinander abhängige Datenquellen zu integrieren und die Daten für eine einfache Nutzung zu organisieren. Data Warehouses enthalten häufig auch vorverarbeitete Zusammenfassungen von Daten und Momentaufnahmen von Daten zu verschiedenen Zeitpunkten, die zur Unterstützung der Analyse verwendet werden. Während transaktionale Systeme vor allem darauf bedacht sind, den aktuellen Stand der Daten aufrechtzuerhalten (und dies durch Überschreiben von Werten bei Datenaktualisierungen tun), wird in Data Warehouses die Historie der Datenänderungen und -entwicklungen eines Unternehmens aufbewahrt. Dies ist besonders wichtig bei der Durchführung von Trendanalysen und anderen Geschäftsanalysen, mit denen die Frage beantwortet werden soll, "warum" etwas in einem Unternehmen passiert ist.
Warum brauchen Unternehmen ein Data Warehouse?
Mit dem Beginn der digitalen Transformation der Geschäftsabläufe in den Unternehmen wird fast jeder Geschäftsprozess von einer Vielzahl von IT-Systemen und den Daten, die diese Systeme Aufzeichnung und verwalten, abhängig. Damit Unternehmen effizient arbeiten und ihre Ziele erreichen können, benötigen Mitarbeiter - von der obersten Führungsebene bis hin zu einzelnen Mitarbeitern - einen effizienten Zugang zu Daten und Analysen, die verwertbare Einblicke in die Betriebsabläufe eines Unternehmens, in Risiko- oder Problembereiche und in Chancen für Wettbewerbsvorteile bieten. Die Informationen, die diese Mitarbeiter benötigen, stammen aus vielen verschiedenen Quellsystemen, aber damit sie für Analysen leicht zugänglich sind, müssen Unternehmen die Daten an einem gemeinsamen Ort zusammenfassen. Das ist ein Data Warehouse.
- Der Bedarf an Informationseinblicken, die mehrere Quellsysteme umfassen.
- Bereitstellung eines Langzeitarchivs für Transaktionsdaten, so dass die Quellsysteme bereinigt werden können, um eine hohe Leistung aufrechtzuerhalten.
- Es soll ein Ort geschaffen werden, an dem Berichte und Analysen erstellt werden können, ohne die betrieblichen Systeme zusätzlich zu belasten.
Der Bedarf an integrierten Informationseinblicken ist bei weitem die größte Triebfeder für Investitionen in Data-Warehouse-Systeme, da er sowohl strategische Geschäftsanforderungen (die zu Wettbewerbsvorteilen führen) als auch taktische/operative Anforderungen zur Unterstützung des täglichen Geschäftsbetriebs darstellt. Data Warehouses sind kostspielige IT-Investitionen, sowohl für die Erstinstallation als auch für den Betrieb. Sie werden daher als langfristige Investition betrachtet und werden im Laufe der Zeit Teil des IT-Ökosystems eines Unternehmens. Die in einem Data Warehouse gespeicherten Daten stammen oft aus dem gesamten Unternehmen und ermöglichen es Benutzern aus unterschiedlichen Geschäftsbereichen, Datenressourcen zu nutzen, die weit über ihren direkten Kontroll- oder Einflussbereich hinausgehen.
Data Warehouse-Konzepte
Es gibt viele verschiedene Varianten von Data Warehouses und verwandten Konzepten, die für jemanden, der neu in diesem Bereich ist, verwirrend sein können. Im Folgenden werden einige der am häufigsten verwandten Data Warehouse-Konzepte vorgestellt, um das Thema Data Warehouse zu entmystifizieren:
- Enterprise Data Warehouse (EDW) - Ein EDW ist ein Data Warehouse, das für ein ganzes Unternehmen und nicht nur für eine einzelne Funktion konzipiert ist. Enterprise Data Warehouses sind in großen Unternehmen weit verbreitet und haben die wichtige Aufgabe, Geschäftseinheiten, Standorte und fragmentierte IT-Systeme miteinander zu verbinden. Selbst wenn Ihr Unternehmen über mehrere Transaktionssysteme verfügt, kann ein EDW verwendet werden, um alle Daten an einem Ort zu sammeln und zentralisierte Analysen und Berichte zu erstellen.
- Operational Data Store (ODS) - Ein Operational Data Store ist der Teil Ihres gesamten Warehouse, der die aggregierten Rohdaten aus Ihren Transaktions- und operativen Systemen enthält, bevor sie übersetzt und zusammengefasst werden. Unternehmen unterhalten oft einen von ihren Data Marts getrennten ODS, um Analysten den Zugriff auf die zugrunde liegenden Daten zu ermöglichen, die zur Erstellung von Berichten verwendet werden.
- Data Mart - Data Marts sind eine vereinfachte Ansicht der Daten in einem Warehouse, die sich auf ein einzelnes Thema oder einen Funktionsbereich konzentriert. Data Marts werden häufig von einer einzelnen Abteilung innerhalb eines Unternehmens erstellt und kontrolliert und können (oder auch nicht) in das Data Warehouse des Unternehmens integriert werden. Unternehmen, die nicht über ein vollwertiges Data Warehouse verfügen, können stattdessen einige Data Marts verwenden. Die in Data Marts gespeicherten Daten werden in der Regel so organisiert und gefiltert, dass sie den spezifischen Anforderungen der unterstützenden Abteilung entsprechen. Die meisten Data Marts werden nachts aus den Quellsystemen aktualisiert, so dass die darin enthaltenen Daten bis zu 24 Stunden alt sein können.
- OLAP - analytische Verarbeitung online sind Spezialsysteme, die zur Unterstützung von Data-Mining-Aktivitäten entwickelt wurden. Sie wenden mehrere Schichten komplexer Algorithmen an, um Rohdaten aufzurollen, aufzuschlüsseln und in Geschäftseinblicke zu verwandeln. OLAP-Systeme werden in der Regel mehrmals am Tag ausgeführt und generieren Analysen, die nur wenige Stunden alt sind (im Vergleich zu Data Marts, die oft eine Latenzzeit von einem ganzen Tag haben).
- Business Intelligence (BI) - Business Intelligence ist ein weit gefasster Begriff, der eine Reihe von Techniken und Werkzeugen für die Erfassung und Umwandlung von Rohdaten in aussagekräftige und nützliche Informationen für die Unternehmensanalyse beschreibt. Data-Warehouses bilden oft den Kern derFunktionen eines Unternehmens, zusätzlich zu Analyse- und Berichtswerkzeugen.
- Data Mining - Data mining ist der Prozess der Entdeckung von Mustern in großen Datensätzen. Modernes data mining beinhaltet oft eine Kombination aus Maschinelles Lernen, künstlicher Intelligenz, Statistik und Data Warehousing. Unternehmen werten Daten aus, um verwertbare Geschäftserkenntnisse zu gewinnen, die zu Wettbewerbsvorteilen führen.
- ETL - Export, Transform, Load oder kurz ETL ist der Prozess, mit dem Daten aus transaktionalen Quellsystemen in das Data Warehouse übertragen werden, wo sie weiter verfeinert und genutzt werden können. Die Art und der Umfang der Datenumwandlung bestimmen häufig das Niveau der Datenqualität im Data Warehouse.
- Datenbereinigung - Datenbereinigung ist die Gesamtheit der Aktivitäten, die unternommen werden, um Qualitätsprobleme in Rohdaten zu beheben. Daten, die aus verschiedenen Quellen kombiniert werden, weisen nicht nur die Qualitätsprobleme der Quelldaten auf (z. B. Ungenauigkeiten, fehlende Daten, unvollständige Datensätze und unterbrochene Beziehungen), sondern enthalten wahrscheinlich auch Lücken, Redundanzen und Konflikte zwischen Datenquellen. Die Datenbereinigung befasst sich mit diesen Problemen, bevor die Daten in das Data Warehouse gelangen.
- Metadaten - Metadaten sind Daten über Ihre Daten, wie Größe, Format, Quelle, Beschreibungen, Beziehungen und Datenklassifizierung. Metadaten sind in einem Data Warehouse wichtig, da sie den Benutzern helfen, Daten, die aus ihrem ursprünglichen Kontext herausgelöst wurden, leicht zu finden und zu verstehen.
- Datenwörterbuch - Das Datenwörterbuch ist ein Satz von Referenzdaten über die in Ihrem Data Warehouse gespeicherten Datenobjekte, Elemente und Attribute. Es bietet den Benutzern ein Mittel, um den Inhalt und den Kontext der Daten über einfache Beschriftungen und Feldbeschreibungen hinaus zu verstehen.
- Data Governance - Data governance ist eine Reihe von Prozessen und Kontrollen, die sicherstellen, dass Daten in Übereinstimmung mit Unternehmensstandards, Richtlinien und Geschäftsregeln erstellt und gepflegt werden und dass bei der Umwandlung von Daten die im Datenmodell definierten Datendefinitionen und Integritätsbeschränkungen eingehalten werden.
Data-Warehouse-Architektur
Es gibt zwei Arten von Architekturen, die für ein Data Warehouse wichtig sind. Die Systemarchitektur der verschiedenen technischen Komponenten, die zusammen die Data-Warehouse-Lösung bilden, und die Datenarchitektur der im Data Warehouse gespeicherten Informationen.
Die Systemarchitektur eines Data Warehouse ist im Allgemeinen auf die Phasen der Umwandlung ausgerichtet, die stattfinden, wenn Rohdaten in verwertbare und verbrauchbare Informationen für die Benutzer umgewandelt werden. Die Umwandlung von Rohstoffen in verbrauchsfähige, fertige Waren mit mehreren Verfeinerungsstufen während des gesamten Prozesses kann man sich wie einen Fertigungsablauf vorstellen.
- Datenquellen - Dies sind die verschiedenen Quellsysteme, die Daten für das Data Warehouse bereitstellen.
- Staging Area oder Daten-Lake - Die Staging Area dient der Speicherung von Rohdaten, die aus den verschiedenen Datenquellen importiert werden, damit sie ohne Leistungseinbußen für die transaktionalen Systeme verarbeitet werden können.
- Integration - Die Integrationsschicht, die dazu dient, die unterschiedlichen Daten aus verschiedenen Quellen miteinander zu verbinden, Schlüsselbeziehungen herzustellen, Duplikate aufzulösen und die Daten in einem operativen Datenspeicher (ODS) zu speichern.
- Warehouse-Datenbank - Die Daten werden aus dem operativen Datenspeicher in die zentrale Warehouse-Datenbank verschoben, wo sie katalogisiert und in hierarchischen Gruppen, den so genannten Dimensionen, sowie in Fakten und aggregierten Fakten angeordnet werden. Diese hierarchische Organisation erleichtert das Auffinden von Daten im Warehouse und verbessert die Verarbeitungsleistung.
- Operational Data Warehouse - Ein Operational Data Warehouse (ODW) befasst sich mit dem Bedarf an operativen Analysen, die die Grundlage bilden für Echtzeitanalysen. Zu den Merkmalen eines ODW gehören Aktualität, High-Performance, die Notwendigkeit, Aktualisierungen effizient zu handhaben und die Flexibilität, On-Premises und in der Cloud bereitgestellt zu werden.
- Data Marts - Data Marts sind Ansichten oder Teilmengen der Daten, die für eine bestimmte Zielgruppe zusammengefasst und aufbereitet werden. Ziel von Data Marts ist es, den Zugriff auf die Daten im Data Warehouse zu vereinfachen und eine Zugriffskontrolle auf die Daten anzuwenden, um sicherzustellen, dass nur die Personen, die dazu berechtigt sind, die Daten nutzen können.
- Benutzer - Dies sind die vielen Personen, Geschäftsprozesse und Systeme, die auf Daten aus dem Data Warehouse zugreifen. Dazu gehören sowohl menschliche Nutzer als auch andere Systeme, wie künstliche Intelligenz (KI) und Entscheidungsunterstützungssysteme.
Die Datenarchitektur eines Data Warehouse bezieht sich darauf, wie die Daten innerhalb des Warehouse organisiert sind. Die Datenarchitektur ist ein komplexeres Thema, da die Transformationen, die innerhalb des Data-Warehouse-Systems stattfinden, oft Änderungen von einer Datenarchitektur zur anderen beinhalten. Die Daten in den meisten Quellsystemen sind als relationale Datenbankschemata organisiert, die einer Reihe von Prinzipien folgen, die als Datennormalisierung bezeichnet werden und 1970 von Edgar Codd eingeführt wurden. Während normalisierte relationale Datenarchitekturen gut für transaktionale Systeme geeignet sind, die sich nur mit aktuellen Daten befassen, wandeln Data Warehouses die relationalen Daten in ein so genanntes Star-Schema um, das Daten auf der Grundlage des Inhalts und der Art und Weise, wie sie konsumiert werden, zusammenfasst. Data Marts (die Ansichten innerhalb eines Data Warehouse, die von den Benutzern genutzt werden) können die Datenarchitektur wiederum in Geschäftsprozess- oder vereinfachte Fachbereichsansichten umwandeln, die sich an der Art und Weise orientieren, wie die Daten für die Entscheidungsfindung genutzt werden.
Was ist ein Data-Warehouse-System?
Das Data Warehouse ist eine stabile, schreibgeschützte Datenbank, die Informationen aus verschiedenen Systemen an einem leicht zugänglichen Ort zusammenfasst. Es ist eine Schicht über anderen Datenbanken, die speziell für die Unterstützung von Analysen konzipiert ist. Der Begriff "Data-Warehouse-System" bezieht sich auf die Gesamtheit der Komponenten, die zusammenarbeiten, um die gesamte Data-Warehouse-Funktionalität für ein Unternehmen bereitzustellen. Viele kommerzielle Softwareanbieter verkaufen Data-Warehouse-Systeme, die sowohl On-Premises als auch als Cloud erhältlich sind. Ein Data-Warehouse-System besteht in der Regel aus einer oder mehreren Datenbanken, Tools für die Durchführung von Extraktion, Transformation und Laden (ETL) aus Quellsystemen, Funktionen für die Verwaltung von Datenschemata und des Datenwörterbuchs sowie Tools für die Veröffentlichung von Daten in Data Marts und konsumierenden Systemen.
Data Warehouse Beispiele
Es gibt viele Beispiele für Unternehmen, die heute Data Warehouses einsetzen. Einige gängige Beispiele sind:
Vertriebs Data Warehouse
Ein spezielles Data Warehouse, das Daten über die Vertriebs- und Marketingaktivitäten eines Unternehmens enthält. Es würde wahrscheinlich Inhalte wie Kundendaten, Verkaufstransaktionen, Marketingkampagnen, Kundenstimmen/Feedback und Daten über die Konkurrenz enthalten. Vertriebs- und Marketingteams nutzen ein Vertriebs-Data-Warehouse direkt für die Lead-Generierung und die Kundenansprache sowie für andere Geschäftsfunktionen, z. B. für das Produktmanagement, das neue Angebote entwickelt, und für Finanzteams, die Umsatzwachstumsprognosen erstellen.
Data Warehouse für die Fertigung
Unternehmen, die komplexe Fertigungsprozesse, logistische Abläufe und outgesourct Lieferketten verwalten , verfügen häufig über ein spezielles Data Warehouse, um alle Daten ihrer Fertigungsprozesse an einem gemeinsamen Ort für die Berichterstattung zusammenzufassen. Auf diese Weise sind sie in der Lage, robuste Analysen durchzuführen und beispielsweise nach Qualitätsproblemen und Möglichkeiten zur Leistungsverbesserung zu suchen, ohne die Fertigungsprozesse zu unterbrechen, die mit transaktionalen Systemen arbeiten müssen. Unternehmen mit outgesourct Lieferketten nutzen ein Data Warehouse für die Fertigung auch häufig als Ort, an dem sie Daten von mehreren Lieferanten zusammenführen können, ohne zahlreiche Punkt-zu-Punkt-Integrationen zwischen ERP-Systemen entwickeln zu müssen.
Enterprise Data Warehouse
Große Unternehmen entscheiden sich häufig dafür, ihre Datenarchive in einem einzigen Unternehmens-Data-Warehouse zu zentralisieren, das Daten aus IT-Systemen und Prozessen aus dem gesamten Unternehmen enthält. Obwohl der Aufbau und Betrieb von Unternehmens-Data-Warehouses teuer sein kann, bieten sie die größte Chance, verwertbare Geschäftserkenntnisse zu ermitteln, die sich über Geschäftsfunktionen und Organisationsgrenzen hinweg erstrecken. Ein Enterprise Data Warehouse kann ein Unternehmen auch in die Lage versetzen, Daten langfristig aufzubewahren, was für die Einhaltung gesetzlicher Vorschriften erforderlich sein kann. Daten können im EDW auch dann noch gespeichert werden, wenn die Quellsysteme bereits stillgelegt sind.
Data Warehouse vs. Datenbank
Datenbanken sind ein wichtiger Bestandteil Ihres Data Warehouse, aber die beiden Begriffe sind nicht austauschbar. Eine Datenbank ist der Oberbegriff für ein Speichersystem, in dem Sie Daten Aufzeichnung , die für viele Zwecke verwendet werden, z. B. für die Transaktionsverarbeitung, die Unterstützung von Anwendungsfunktionen und die Erstellung von Berichten. Zu den Datenbanken gehören z. B. OLTP (Anwendungsdatenbanken), OLAP (in Datenlagern verwendet), XML, CSV-Dateien, Textdateien und Tabellenkalkulationen. Die meisten Datenbanken sind auf eine bestimmte Anwendung, einen bestimmten Geschäftsprozess oder Zweck beschränkt. Eine Datenbank, die für die Abwicklung von Transaktionen konzipiert ist, ist nicht so strukturiert, dass sie sich für Analysen eignet.
Im Vergleich dazu ist ein Data Warehouse ein spezialisierter Satz von Funktionen für die Extraktion von Daten aus Transaktionssystemen und die Speicherung dieser Daten in einem bestimmten Datenbanktyp, der so organisiert und optimiert ist, dass er Datenanalysen und Berichte unterstützt. Ein typisches Data Warehouse umfasst mehrere Datenbanken, in denen Daten auf verschiedenen Ebenen der Transformation gespeichert werden, darunter Quelldatenbanken, Betriebsdatenspeicher, die Kerndatenbank des Data Warehouse und spezielle Data Marts, die den Benutzern gefilterte Ansichten der Daten präsentieren.
Vorteile eines Data Warehouse
Unternehmen implementieren Data Warehouses aus vielen Gründen, die von der Notwendigkeit strategischer Geschäftseinblicke bis hin zur Bewältigung taktischer Herausforderungen bei der Datenaggregation und -speicherung reichen. Im Allgemeinen bieten Data Warehouses die folgenden Vorteile:
- Integration von Daten aus verschiedenen Quellen in ein einziges Datenmodell - Dieser Nutzen ist für Unternehmen wichtig, die vorgefertigte und SaaS-Softwareangebote nutzen, die ihr eigenes Datenmodell haben, das nicht an einen Unternehmensstandard angepasst werden kann. Das Data Warehouse bietet einen Ort, an dem Datenmodellinkongruenzen zwischen den Quellsystemen abgeglichen werden können, um das Gesamtbild der Datenbestände eines Unternehmens zusammenzustellen.
- Bereitstellung eines einheitlichen Ortes für den Datenzugriff - Für die Benutzer kann es sowohl teuer als auch zeitaufwändig sein, auf Daten aus einer Vielzahl von Quellsystemen zuzugreifen, die in einem Unternehmen verwendet werden. Ein Data Warehouse bietet die Möglichkeit, Daten an einem gemeinsamen Ort zu aggregieren, wo sie organisiert und den Benutzern zur einfachen Nutzung präsentiert werden können.
- Behalten Sie die Datenhistorie bei, ohne die Quellsysteme zu verlangsamen - Wenn Geschäftsabläufe funktionieren, werden ständig neue Daten erzeugt. Mit der Zeit verlangsamt das Volumen der neu erzeugten Daten die Transaktionssysteme. Durch die Verlagerung von Daten in ein Data Warehouse können die Quellsysteme von alten Daten bereinigt werden, um die Effizienz der Transaktionsverarbeitung zu erhalten.
- Ermöglichen Sie eine zentrale Ansicht im gesamten Unternehmen - Die meisten Abteilungen innerhalb eines Unternehmens sind in Bezug auf die von ihnen erstellten Daten territorial eingestellt und möchten kontrollieren und einschränken, wer darauf zugreifen kann und wie sie verwendet werden. Es gibt zwar Fälle, in denen dies eine gute Praxis ist (z. B. geschützte Geschäftsgeheimnisse), aber viele der in einem Unternehmen erzeugten Daten haben das Potenzial, in anderen Teilen des Unternehmens einen Mehrwert zu schaffen. Das Data Warehouse bietet einen gemeinsamen Ort, an dem funktionale Daten im Silo gesammelt werden können, um ein Gesamtbild der Unternehmensdaten zu erstellen, das häufig Erkenntnisse liefert, die der Unternehmensführung bei Investitionsentscheidungen und der strategischen Planung helfen.
- Bereinigen und Abgleichen von mehrdeutigen und doppelten Daten - Es ist sehr selten, dass Daten aus verschiedenen Quellsystemen sauber und nahtlos zusammenpassen. Häufiger kommt es bei der Datenerfassung zu Datenkonflikten, Lücken, Redundanzen und fehlenden Informationen, die behoben werden müssen, damit der kombinierte Datensatz effektiv für Analysen genutzt werden kann. Die Unterschiede können absichtlich auf geschäftlichen Erfordernissen beruhen, können aber im Zusammenhang mit der Berichterstattung zu Verwirrung führen. Das Data Warehouse bietet Unternehmen die Möglichkeit, Geschäftsregeln anzuwenden, um Probleme mit der Datenqualität zu beheben, ohne die Quellsysteme ändern zu müssen.
- Zentrale Überwachung und Kontrolle zur Durchsetzung von Richtlinien für den Datenzugriff und die Datennutzung - Data governance und die Kontrolle darüber, wer im Unternehmen berechtigt ist, auf Daten zuzugreifen und sie zu nutzen, sind ein wichtiger Bestandteil der Maximierung des Werts der Datenbestände eines Unternehmens. Da ein Data Warehouse ein zentrales Lager für Daten aus dem gesamten Unternehmen darstellt, ist es auch der ideale Ort für die Umsetzung von Datenzugriffsrichtlinien.
- Vermeiden Sie Leistungseinbußen bei der Abfrage transaktionaler Systeme für das Reporting - Analyseabfragen sind in der Regel sehr komplex und verbrauchen erhebliche Systemverarbeitungsressourcen. Die Ausführung von Analysen und Berichten auf transaktionalen Systemen kann dazu führen, dass Nutzer Latenzprobleme haben und Geschäftsabläufe langsam werden. Data Warehouses bieten eine separate Umgebung, in der Analyseabfragen sicher ausgeführt werden können, ohne die Leistung der Quelldatenbanken oder der Anwendungen, die auf ihnen basieren, zu beeinträchtigen.
- Organisieren Sie Daten so, dass sie für Geschäftsanwender sinnvoll sind - Transaktionssysteme haben Datenstrukturen, die für die Leistung der Anwendungen und Geschäftsabläufe, die sie unterstützen, optimiert sind - und nicht, um von menschlichen Benutzern leicht verstanden zu werden. Data Warehouses und Data Marts ermöglichen es, die Daten eines Unternehmens neu zu organisieren, zu katalogisieren und so zu beschreiben, dass Geschäftsanwender sie verstehen und die Daten, die sie zur Entscheidungsfindung benötigen, leichter finden können.