Data Warehousing – Zusammenführung aller erdenklichen Datenquellen
Data Warehousing umfasst verschiedene Methoden und Algorithmen, um beispielsweise Daten aus ERP- und anderen IT-Systemen, Office-Dateien, Daten aus Webseiten oder Internetbörsen zu extrahieren, bereinigen, abzugleichen, zu konsolidieren und in ein Zielsystem zu überführen, welches als Zwischenspeicher (sogenannter Data Lake) dient und in der Regel die Datenbasis für Analyseverfahren darstellt.
Von besonderer Bedeutung dabei ist der ETL-Prozess (Extract, Transform, Load). Über bestimmte Verfahren entwickelte ETL-Prozessketten ermöglichen eine automatisierte Zusammenführung von Daten aus unterschiedlichsten internen und externen Datenquellen. Erfahrungsgemäß können ETL-Prozessketten je nach Projekt sogar komplexer werden als die eigentlichen Analysen.