Parsen und Transformieren von SQL-MDi-Abfragen in Föderierten Data Warehouse-Systemen

Autor
W. Brunneder
Masterarbeit
MT0802 (April, 2008)
Betreut von
o. Univ.-Prof. Dr. Michael Schrefl
Angeleitet von
Mag. Stefan Berger
Ausgeführt an
Universität Linz, Institut für Wirtschaftsinformatik - Data & Knowledge Engineering
Ressourcen
Kopie

Kurzfassung (Englisch)

Business cooperations or mergers may require cross-Data Warehouse analysis to assess business performance. A Federated Data Warehouse System is an appropriate instrument for that purpose by providing transparent access to the integrated component-systems with a global scheme or global cube, respectively. In order to ensure transparency it is necessary to hide existing hetergeneities between the component-schemes from the user. Thus, the multidimenisonal query language SQL-MDi was developed in order to resolve the heterogeneities.

The goal of this thesis is the development of a parser-component as a part of a query tool to generate compatible component-schemes or cubes, respectively, in a Federated Data Warehouse System. One challenge for the parser-component is to analyse a SQL-MDi query by checking the validity of the syntax and contained metadata and by recognizing and handling logical conflicts. The ouput of the parser-component is a tree-structure which contains the operators of the algebra on which SQL-MDi is based on. This tree-structure will be used as an execution plan for a processor-component, which creates statements for the component-systems according to the algebra-operators and calculates an integrated scheme or cube, respectively. Considering logical optimizations during the contruction of the tree-structure enables the processor-component to efficiently create and process the statements for the component-systems.

Kurzfassung (Deutsch)

Unternehmenskooperationen und -zusammenschlüsse können Data Warehouse-übergreifende Analysen zur Leistungsbeurteilung erfordern, wofür sich die Erstellung eines Föderierten Data Warehouse-Systems anbietet. Ein Föderiertes Data Warehouse-System bietet transparenten Zugriff auf die integrierten Komponentensysteme mit Hilfe eines globalen Schemas bzw. eines globalen Würfels. Um Transparenz zu gewährleisten, ist es erforderlich den Benutzer von den zwischen den zu integrierenden Schemata bzw. Würfeln bestehenden Heterogenitäten abzuschirmen. Für diesen Zweck wurde die multidimensionale Abfragesprache SQL-MDi entwickelt, welche die Auflösung der Heterogenitäten ermöglicht.

Ziel dieser Diplomarbeit ist die Entwicklung einer Parser-Komponente, welche eine Teil-Komponente eines Abfrage-Werkzeugs zur Generierung kompatibler Schemata bzw. Würfel in einem Föderierten Data Warehouse-System darstellt. Die Parser-Komponente hat die Aufgabe, eine in SQL-MDi formulierte Abfrage zu analysieren, d.h. die Korrektheit der Syntax und der enthaltenen Metadaten zu prüfen sowie logische Konflikte zu erkennen und zu behandeln. Der vom Parser zu generierende Output ist eine Baumstruktur, welche die Operatoren der SQL-MDi zugrunde liegenden Algebra beinhaltet. Die Baumstruktur dient als Ausführungsplan für eine Prozessor-Komponente, welche auf Basis der Algebra-Operatoren Sub-Anweisungen für die Komponentensysteme erzeugt und ein integriertes Schema bzw. einen integrierten Würfel berechnet. Durch die Berücksichtigung von logischen Optimierungsmöglichkeiten bei der Erzeugung der Baumstruktur, wird die Prozessor-Komponente bei der effizienten Generierung und Verarbeitung der Sub-Anweisungen unterstützt.