Active Data Warehouses: Complementing OLAP with Analysis Rules

Author
T. Thalhammer
PhD Thesis
PT0101 (2001)
Resources
Copy

Abstract (English)

In the recent years, Event-Condition-Action (ECA) rules have been successfully used for developing on-line transaction processing systems (e.g., warehouse management systems). ECA rules are based upon the principle that when an event occurs and a specified condition is satisfied, then a particular action will be carried out without requiring any interaction with the user. The field of application of ECA rules in on-line transaction processing systems ranges from internal tasks (e.g., ensuring the integrity of databases) to external tasks (e.g., realizing the business rules of a particular application program). Although practically relevant, ECA rules have not been utilized for automatizing various processes (e.g., routine analysis tasks) within decision-support systems (data warehouses and OLAP systems) so far.

This thesis proposes an approach to carry out routine decision tasks and semi-routine decision tasks automatically within data warehouses using ECA rules. Such systems are called active data warehouses, since these systems analyze the data warehouse as reaction to occurred events. The "decisions" that are generated by these rules will be realized by executing transactions in on-line transaction processing systems. The emphasis of such ECA rules, which we call analysis rules from now on, is (i) on automatizing analyses originally carried out manually by users (analysts) and (ii) on defining how decisions will be generated.

This basic approach of analysis rules is extended by a framework to specify complex decision tasks. These extensions are (i) flexible modeling of decision criteria, (ii) alternative approaches to specify decision-making models, and (iii) determining the bindings of action parameters. We define the semantics of the basic approach and of the extended approach declaratively and procedurally and propose a basic implementation of analysis rules using off-the-shelf database technology.

Abstract (German)

In den vergangenen Jahren wurden Ereignis-Bedingungs-Aktions-Regeln erfolgreich in der Entwicklung von transaktionsverarbeitenden Systemen (z.B., Lagerhaltungssysteme) verwendet. Solche Regeln basieren auf der Idee, daß beim Eintritt eines Ereignisses eine spezifizierte Bedingung geprüft wird und – falls diese Bedingung erfüllt ist – eine entsprechende Aktion ausgeführt wird ohne daß dafür eine Benutzerinteraktion erforderlich ist. Der Anwendungsbereich dieser Regeln erstreckt sich von der Erledigung systemspezifischer Aufgaben (z.B., Sicherstellung der Integrität von Datenbanken) bis zur Erledigung applikationsspezifischer Aufgaben (z.B., Realisierung von Geschäftsregeln eines Anwendungsprogrammes) in transaktionsverarbeitenden Systemen. Obwohl Abläufe (z.B., standardisierte Analysen) innerhalb von Entscheidungsunterstützungssystemen (Data Warehouses und OLAP-Systeme) ebenfalls mit Ereignis-Bedingungs-Aktions-Regeln automatisiert werden können, wurden diese dort bisher nicht eingesetzt.

Diese Dissertation beschäftigt sich mit der automatischen Ausführung von strukturierten und halbstrukturierten Entscheidungsprozessen innerhalb von Data Warehouses unter Verwendung von Ereignis-Bedingungs-Aktions-Regeln. Solche Data Warehouses werden Aktive Data Warehouses genannt, da gemäß den spezifizierten Regeln beim Eintritt eines Ereignisses Daten im Data Warehouse analysiert werden und anschließ end eine "Entscheidung" getroffen wird. Umgesetzt werden solche Entscheidungen, indem durch das Data Warehouse in einem operativen Datenbanksystem eine Transaktion ausgeführt wird. Der Schwerpunkt solcher Ereignis-Bedingungs-Aktions-Regeln, die fortan Analyseregeln genannt werden, liegt (i) in der Nachahmung/Automatisierung des Analyseprozesses eines Endbenutzers (Analyst) und (ii) in der Festlegung, wie Entscheidungen getroffen werden.

Das soeben skizzierte Basismodell für Analyseregeln wird um ein Framework zur Modellierung von komplexen Entscheidungsprozessen erweitert. Die Erweiterungen beziehen sich insbesondere auf (i) die flexible Modellierung von Entscheidungskriterien, (ii) alternative Ansätze zur Komposition von Gesamtentscheidungen aus Teilentscheidungen und (iii) auf die Bestimmung von Aktivitätsparametern. Die Semantiken des Basismodells sowie der genannten Erweiterungen werden deklarativ und prozedural definiert. Weiters wird ein Ansatz zur Implementierung von Analyseregeln des Basismodells mittels Standard-Datenbanktechnologien vorgeschlagen.