Digital Watermarking of Medical Sensor Data for Data Leakage Detection - a Proof-of-Concept Prototype
- Author
- S. Gruber
- Master Thesis
- MT2003 (September, 2020)
- Supervised by
- o. Univ.-Prof. Dr. Michael Schrefl
- Instructed by
- Dr. Bernd Neumayr
- Accomplished at
- University Linz, Institute of Business Informatics - Data & Knowledge Engineering
- Resources
- Copy
Abstract (German)
Medizinische Geräte erzeugen medizinische Sensordaten, die zeitindizierte Sequenzen medizinischer Messungen sind. Mit Hilfe einer Datenplattform können Patienten ihre medizinischen Sensordaten dauerhaft speichern und sie an Datennutzer, wie Ärzten oder Forschern, weitergeben. Allerdings können Datennutzer Daten, auf die sie Zugriff haben, an Dritte weitergeben. Digitale Wasserzeichen können verwendet werden, um angeforderte Daten unmerklich mit einem Wasserzeichen zu versehen, welches dem Datennutzer, der die Daten angefordert hat, zugeordnet ist. Falls irgendwo Daten eines Patienten gefunden werden, kann der für die Weitergabe verantwortliche Datennutzer durch Extrahieren des eingebetteten Wasserzeichens identifiziert werden. In dieser Arbeit stellen wir einen neuen Wasserzeichen-Ansatz für medizinische Sensordaten zur Erkennung von illegaler Datenweitergabe vor. Da medizinische Sensordaten dauerhaft in der Datenplattform gespeichert werden, sind in diesem Wasserzeichen-Ansatz Einbettung und Erkennung von Wasserzeichen informiert, d.h. sie nutzen die Originaldaten. Darüber hinaus ist die Einbettung von Wasserzeichen durch Nutzungseinschränkungen konfigurierbar, dass Daten, die mit einem Wasserzeichen versehen werden, für diagnostische Zwecke nutzbar bleiben. Eine wesentliche Herausforderung für die Erkennung von Wasserzeichen sind böswillige Angriffe, die darauf abzielen, eingebettete Wasserzeichen zu verzerren oder zu entfernen. Daher basiert die Erkennung von Wasserzeichen auf Ähnlichkeitssuchen. In dieser Arbeit entwerfen, implementieren und evaluieren wir einen Prototyp, der auf dem eingeführten Wasserzeichen-Ansatz basiert. Die Evaluierung zeigt unter anderem, dass der Prototyp als sicher gegenüber gebräuchlichen Varianten von Verzerrungs-, Kollusions-, Teilmengenauswahl- und Löschangriffen angesehen werden kann. Darüber hinaus zeigt die Evaluierung, dass die Leistung des Prototyps als ausreichend für den praktischen Einsatz zur Bereitstellung kontinuierlicher Blutzuckermessungen für Datennutzer wie Ärzte angesehen werden kann. Der Prototyp kann auch auf verschiedene Arten von Sensordaten angewendet werden und bietet eine hohe Anpassungsfähigkeit sowie Erweiterbarkeit.
Abstract (English)
Medical devices produce medical sensor data which are time indexed sequences of medical measurements. By using a data platform, patients can permanently store their medical sensor data and share it with authorized data users such as doctors or researchers. But authorized data users may leak accessed data to unauthorized parties. Digital watermarking can be used to imperceptibly watermark requested data with a watermark associated to the requesting data user. If leaked data is found anywhere, the leaking data user can be identified by extracting the embedded watermark. In this thesis, we introduce a new watermarking approach for medical sensor data to detect data leakage. Due to medical sensor data being permanently stored in the data platform, watermark embedding and detection are informed, i.e. they take advantage of original data. In addition, watermark embedding is configurable by usability constraints such that watermarked data remains useful for diagnostic purposes. A major challenge for watermark detection are malicious attacks which aim to distort or remove embedded watermarks. In order to counteract malicious attacks, watermark detection is based on similarity searches. In this thesis, we design, implement and evaluate a proof-of-concept prototype which is based on the introduced watermarking approach. Among other things, the evaluation shows that the prototype can be considered secure against common variants of distortion, collusion, subset selection and deletion attacks. Furthermore, the evaluation shows that the performance of the prototype can be considered sufficient for practical use of providing continuous blood glucose measurements for data users such as doctors. The prototype may also be applied to different kinds of sensor data and provides high adaptability as well as extensibility.