The Semantic Data Warehouse for the AgriProKnow Project: A First Prototype

Author
S. Schausberger
Master Thesis
MT1603 (November, 2016)
Supervised by
o. Univ.-Prof. Dr. Michael Schrefl
Instructed by
Ass.-Prof. Dr. Christoph Schütz
Accomplished at
University Linz, Institute of Business Informatics - Data & Knowledge Engineering
Resources
Copy

Abstract (English)

Contemporary dairy farming heavily relies on modern technology such as milking robots, feeding systems, and various sensors which track animal movement, micro climate, etc. All these systems produce vast amounts of data. These data contain potentially valuable information that could be used to increase efficiency of dairy farm operations. As of now this potential remains underused, which the AgriProKnow project intends to change. The AgriProKnow project develops a data analysis platform as a means to extract knowledge from the information contained in the data. In this thesis we present a first prototype of the AgriProKnow project's data analysis platform in the form of a semantic data warehouse (sDWH). The sDWH is realised using a combination of semantic technologies and a relational database management system. The schema and all instance data are described in RDF format using the RDF Data Cube Vocabulary. The RDF schema is mapped to a relational data model; the instance data in the sDHW are stored in a relational database. Furthermore, the sDWH provides intuitive query facilities for the stored data, the semOLAP patterns. The semOLAP patterns are defined by database and domain experts. Each semOLAP pattern contains wildcards. Based on the semOLAP patterns, users create queries and provide concrete values for the wildcards in the pattern. The combination of the semOLAP pattern and concrete values for its wildcards results in an SQL query which is executed in the relational database of the sDWH. If the concrete values for the wildcards of the semOLAP pattern are RDF elements, the export of the query results can be done in RDF as well. The query result is enriched semantically including, a definition of the result's structure and the underlying query.

Abstract (German)

Moderne Rinderbetriebe setzen eine Vielzahl moderner Technologien wie etwa Temperatursensoren, Milchroboter oder Fütterungsroboter ein. Dadurch entstehen große Mengen an Daten in den Betrieben. Diese Daten enthalten potenziell wertvolle Informationen, welche zur Effizienzsteigerung genutzt werden können. Das Potenzial dieser Informationen wird derzeit jedoch nicht voll ausgeschöpft. Das Projekt AgriProKnow will dies ändern. Deshalb wird im Rahmen des Projekts AgriProKnow eine Analyseplattform entwickelt, die helfen soll, neues Wissen aus in den Daten enthaltenen Information zu generieren. In dieser Arbeit wird ein erster Prototyp dieser Analyseplattform, dem Semantic Data Warehouse (sDWH) beschrieben. Das sDWH kombiniert semantische Technologien mit einem relationalen Datenbankverwaltungssystem. Die Schema- und Instanzdaten des sDWH werden in RDF mittels RDF Data Cube Vocabulary beschrieben. Das RDF-Schema wird in einem relationalen Datenmodell abgebildet. Die Instanzdaten werden in einer relationalen Datenbank gespeichert. Das sDHW bietet außerdem intuitive Abfragemöglichkeiten, die semOLAP Patterns. Diese werden von Datenbank- und Domänenexperten definiert, und beinhalten Platzhalter. Erstellen die Nutzer Abfragen werden diese Platzhalter mit konkreten Werten gefüllt. Basierend auf diesen Werten und dem zugrundeliegenden Pattern, wird daraus eine SQL-Abfrage generiert, welche in der relationalen Datenbank des sDWH ausgeführt wird. Wurden die Werte für das Pattern in Form von RDF-Elementen angegeben, erfolgt auch der Export im RDF-Format. Hierbei wird zusätzlich zu den Daten des Ergebnisses, eine semantische Beschreibung in Form einer Definition der Struktur des Ergebnisses und der zugrundeliegenden Abfrage exportiert.