OLAP Patterns: A Pattern-Based Approach to Multidimensional Data Analysis

Autor
I. Kovacic
Dissertation
PT2101 (2021)
Ressourcen
Kopie

Kurzfassung

Abstract:

Users of a business intelligence (BI) system employ an approach referred to as online analytical processing (OLAP) to view multidimensional data from different perspectives. Query languages, e.g., SQL or MDX, allow for flexible querying of multidimensional data but query formulation is often time-consuming and cognitively challenging for many users. Alternatives to using a query language, e.g., graphical OLAP clients, parameterized reports, or dashboards, are often not a full-blown alternative to using a query language. Experience in cooperative research projects with industry led to the following observations regarding the use of OLAP queries in practice. First, within the same organization, similar OLAP queries are repeatedly composed from scratch in order to satisfy similar information needs. Second, across different organizations and even domains, OLAP queries with similar structures are repeatedly composed from scratch. Finally, vague requirements regarding frequently composed OLAP queries in the early stages of a project potentially lead to rushed development in later stages, which can be alleviated by following best practices for OLAP query composition. In engineering, knowledge about best-practice solutions to frequently arising challenges is often documented and represented using patterns. In that spirit, an OLAP pattern describes a generic solution for composing a query that allows a BI user to satisfy a certain type of information need given fragments of a conceptual model. This thesis introduces a formal definition of OLAP patterns as well as an expressive, flexible, and generally applicable definition language.

Zusammenfassung:

Anwender*innen von Business-Intelligence (BI)-Systemen verwenden einen Ansatz, der als Online Analytical Processing (OLAP) bezeichnet wird, um multidimensionale Daten aus verschiedenen Perspektiven zu betrachten. Abfragesprachen wie SQL oder MDX ermöglichen dabei die flexible Abfrage von multidimensionalen Daten. Für viele Anwender*innen ist die Formulierung solcher Abfragen jedoch kognitiv anspruchsvoll und daher oft zeitaufwendig. Alternativen zur Verwendung einer Abfragesprache wie grafische OLAP-Clients, parametrisierte Berichte oder Dashboards sind oft keine vollwertige Alternative zur Verwendung einer Abfragesprache. Die Erfahrungen aus Forschungsprojekten in Kooperation mit Industriepartnern führten zu den folgenden Beobachtungen hinsichtlich der Verwendung von OLAP-Abfragen in der Praxis: Erstens werden innerhalb derselben Organisation wiederholt ähnliche OLAP-Abfragen von Grund auf neu zusammengestellt, um ähnliche Informationsbedürfnisse zu befriedigen. Zweitens werden ähnlich strukturierte OLAP-Abfragen über verschiedene Organisationen und sogar Domänen hinweg wiederholt von Grund auf neu erstellt. Schließlich können vage Anforderungen an häufig benötigte OLAP-Abfragen in der Frühphase eines Projekts zu einer überstürzten Entwicklung in späteren Phasen führen, was bis zu einem gewissen Grad vermieden werden kann, indem bewährte Lösungen (Best-Practices) für die Zusammenstellung von OLAP-Abfragen herangezogen werden. Im Ingenieurwesen wird das Wissen über Best-Practice-Lösungen für häufig auftretende Herausforderungen oft in Form von Mustern (Patterns) dokumentiert. In diesem Sinne beschreibt ein OLAP-Muster eine generische Lösung für die Zusammenstellung einer Abfrage, die es BI-Anwender*innen ermöglicht, eine bestimmte Art von Informationsbedarf anhand von Fragmenten eines konzeptuellen Modells zu befriedigen. In dieser Arbeit wird eine formale Definition von OLAP-Mustern sowie eine ausdrucksstarke, flexible und allgemein anwendbare Definitionssprache vorgestellt.