Online Analytical Processing mit hetero-homogenen Data Warehouses: Prototypische Implementierung und Benutzerstudie

Author
J. Roth
Master Thesis
MT1502 (June, 2015)
Supervised by
o. Univ.-Prof. Dr. Michael Schrefl
Instructed by
Dr. Christoph Schütz
Accomplished at
University Linz, Institute of Business Informatics - Data & Knowledge Engineering
Resources
Copy

Abstract (German)

In einem Data Warehouse werden üblicherweise Daten aus verschiedenen, oftmals heterogenen Quellen eines Unternehmens zusammengeführt um diese langfristig für Datenanalysen zu speichern. Um dies zu bewerkstelligen werden diese Daten mit aktuellen Techniken entweder in einem homoge-nen oder einem rein heterogenen Schema zusammengeführt. Bei der Überführung in ein homogenes Schema gehen mitunter wichtige Informationen verloren, in einem heterogenen Schema können diese Informationen zwar behalten werden aber die Komplexität der Datenstruktur und Analyse der Daten steigen dadurch mitunter an, darüber hinaus sinkt die Datenqualität. In dieser Arbeit wird der hetero-homogene Ansatz zur Datenanalyse prototypisch implementiert. Eine Benutzerstudie unter Verwen-dung des SUS-Fragebogens (System Usability Scale) untersucht die Usability des hetero-homogenen Ansatzes.

Abstract (English)

The data which are stored in a data warehouse originate from different, often heterogeneous sources in a company to permanently store these data for data analysis. At present there are two different approaches to consolidate these data, the homogenous and the heterogeneous approach. Using the homogenous approach some information of the heterogeneous data may be lost; using the heteroge-neous approach this information can be kept but needs complex data structures and therefore loses clarity. In this thesis we implement a prototype for hetero-homogenous data analysis and we conduct a user-study using the SUS questionnaire (System Usability Scale) in order to evaluate the usability of the hetero-homogenous approach.

Preface (German)

In dieser Arbeit wurde einerseits unter Verwendung des Open-Source OLAP-Tools Saiku in der Version 2.4 in Verbindung mit Mondrian 3 und einem bestehendem Prototypen in Oracle der als Index ver-wendet wurde gezeigt wie hetero-homogene Data Warehouses in relationalen Datenbanksystemen abgebildet und genutzt werden können und andererseits wurde, anhand einer Benutzerstudie geprüft ob dieser Ansatz für OLAP in hetero-homogenen Data Warehouses einen brauchbaren Grad an Usa-bility gewährleistet. Dazu wurden ein für diese Zwecke etablierter Fragebogen, der sich System Usabi-lity Scale nennt, gemeinsam mit einer post-Task Frage zur Ermittlung der Schwierigkeit einzelner Auf-gaben verwendet die von 40 Probanden nach Einsatz des OLAP-Tools mit hetero-homogener Umset-zung und 21 Probanden nach Einsatz des gleichen OLAP-Tools mit rein heterogener Umsetzung be-antwortet wurden. Das Ergebnis dieser Studie hat gezeigt, dass der hetero-homogene Ansatz prinzi-piell eine gute bis sehr gute Usability besitzt und bei bestimmten Aufgaben durch die eindeutige Zu-ordnung von heterogenen Ebenen in Dimensionshierarchien und heterogenen Kennzahlen die Auswahl vereinfacht, andererseits hat sich auch gezeigt, dass genau dieser Effekt bei komplexeren Abfragen in denen viele heterogene Dimensionen und Kennzahlen gleichzeitig für eine Abfrage benötigt werden zu Problemen führen kann wenn der Anwender kein oder wenig Wissen zur Datenstruktur bzw. Datenlage besitzt da hier schnell eine gewisse Frustration entstehen kann wenn auf Grund der gegeben Restriktionen Ebenen und Kennzahlen nicht für den Anwender sichtbar sind die er eigentlich erwarten würde. Auf Grund dieses Ergebnisses scheint es notwendig eine Art Wegweiser für den Anwender in einem OLAP-Tool, das den hetero-homogenen Ansatz umsetzt, bereitzustellen um sicher gehen zu können, dass sich der Anwender im hetero-homogenen Raum zurechtfindet und auch ohne fundiertes Hinter-grundwissen mit der Anwendung umgehen kann. Des Weiteren wurde in dieser Arbeit, wie erwähnt, ein bereits bestehender Prototyp verwendet um die hetero-homogene Funktionalität abbilden zu können. Aus Gründen der Effizienz wäre es hier notwendig eine eigenständige Lösung zu implementieren die diesen nicht mehr benötigt.