Führen Sie alle erdenklichen strukturierten und unstrukturierten Daten zentral zusammen

DATA LAKE

Ein Data Lake speichert Daten in strukturierter und unstrukturierter Form, beispiels­weise Daten aus ERP- und anderen IT-Systemen, Bilder, Videos, Text-Dokumente und andere Office-Dateien, Daten aus Webseiten und dem Social Media.


Anders als ein klassisches Data Warehouse, strukturiert ein Data Lake die Daten nicht vor, so dass Daten leichter integriert werden können. Der Data Lake dient jedoch für Data Scientists als wichtiger Pool an Daten zur Bewältigung von neuen Ananalyseaufgaben.

ETL-KETTEN

Zusammenführung von getrennt gehaltenen, jedoch im Zusammenhang stehenden Daten aus relevanten Datenquellen über kundenindividuelle und automatisierbare ETL-Prozessketten

SCHNITTSTELLEN

Über ODBC-, JDBC- und andere Schnittstellen können problemlos jegliche SQL-Datenbanken angebunden werden, um Daten aus ERP-, CRM- und anderen IT-Systemen zu integrieren

SQL & NOSQL

Einsatz von NoSQL-Datenbanken wie beispielsweise Cassandra, MongoDB, Neo4j oder HBase ermöglicht die effektive und effiziente Speicherung von Daten jeglicher Art von Text-Dokumenten über Maschinendaten bis hin zu graphen-orientierten Social Media Daten

UNSTRUKTURIERTE DATEN

Unter Einsatz von intelligenten Parsing- sowie MapReduce-Algorithmen, ist das Sammeln und Analysieren von unstrukturierten Daten kein Problem

VERTEILTES RECHNEN

Tools aus dem Apache Hadoop Ökosystem ermöglichen verteilte Speicherung und Auswertung von Daten