Projektinterview: Entwicklung eines Datentreuhänders in einem Forschungsprojekt
02.12.2024 / Dr. Kathrin Stollenwerk
aus dem Netzwerk Insider Dezember 2024
Datentreuhandmodelle können zur Lösung vielfältiger Probleme in der Digitalwirtschaft beitragen. Durch Datentreuhänder können die Potenziale verfügbarer Daten besser ausgeschöpft und der Austausch von Daten gestärkt werden. Sie gewährleisten als neutraler Vermittler Datengebern einen sicheren und vertrauensvollen Umgang mit ihren Daten.
Dr. Kathrin Stollenwerk ist seit drei Jahren bei ComConsult im Bereich Informationssicherheit beschäftigt. Zu ihren Hauptaufgaben gehören der Aufbau, die Pflege und Konzeption von Informationssicherheitskonzepten und -managementsystemen insbesondere nach BSI-IT-Grundschutz und ISO 27001. Neben diesen Aufgaben ist sie in Forschungsprojekten des Bundesministeriums für Bildung und Forschung BMBF tätig, die sich mit Datentreuhandmodellen befassen. Von einem solchen Projekt berichtet sie in diesem Interview.
ComConsult war an einem auf drei Jahre ausgelegten Forschungsprojekt beteiligt, das vom BMBF gefördert wurde. Was war die Kernidee des S3I-X-Projekts?
Die Idee beim S3I-X-Projekt ist, dass ein Datentreuhänder entwickelt wird, der die Daten aus der vollmechanisierten Holzernte verwahrt und verschiedenen Nutzern zur Verfügung stellt. Ein Datentreuhänder ist ein neutraler Vermittler zwischen einem Datengeber und einem Datennehmer, der nicht im Eigeninteresse handelt, sondern die Rechte beider Seiten wahrt. Der Datentreuhänder stellt dabei sicher, dass sich die Beteiligten sicher identifizieren und authentifizieren können, setzt die verschiedenen Nutzungsrechte, die an die Daten geknüpft werden, um und gewährleistet, dass andere keinen Zugriff auf die Daten erhalten.
Für welche Akteure sind die aus der vollmechanisierten Holzernte gesammelten Daten von Interesse?
Man kann sich folgendes Szenario vorstellen: Ein Waldbesitzer möchte auf seiner Waldfläche Bäume ernten lassen. Dazu beauftragt er ein Forstunternehmen, das mit seinen Maschinen in dieses Waldstück fährt und die Bäume erntet. Die Maschinen, die dabei zum Einsatz kommen, sind sogenannte Harvester. Diese speziellen vollmechanisierten Holzernte-Maschinen erfassen eine große Menge Daten. Ein Harvester sammelt zum Beispiel Daten darüber, wo sich eine Maschine befindet, wie viele und welche Bäume geerntet werden und wie der Stammdurchmesser und die Stammlänge der geernteten Bäume sind. Die erfassten Daten sind nicht nur für den Waldbesitzer, sondern können auch für weiterverarbeitende Betriebe wie Sägewerke und Fuhrunternehmen sowie für Behörden und die Forschung interessant sein. Es gibt also zahlreiche Akteure, die Interesse an den Daten hätten, doch leider werden diesen Daten zurzeit, zumindest in Deutschland, kaum weiterverarbeitet.
Welche Vorteile hätte das Teilen der Daten?
Würden die Daten für alle Beteiligten vorliegen, könnte in diesem Idealfall ein Sägewerk viel besser seine Auslastung planen. Der Fuhrunternehmer könnte seine Routen genau festlegen, wenn er Informationen darüber hätte, welche Baumstämme wo liegen. Die Forschungseinrichtungen hätten verlässliche Daten, mit denen sie zusammen mit Daten aus weiteren Quellen Rückschlüsse über den Zustand des Waldes ziehen könnten. Der Waldbesitzer hätte wichtige Daten für seine Holzbuchführung und nicht zuletzt würden die Daten den Maschineneigner darüber informieren, wie effizient seine Maschinen arbeiten und wie ausgelastet seine Mitarbeiter sind.
Welche Probleme bringt das Teilen der Daten mit sich?
Häufig möchten Dateneigner ihre Daten nicht teilen, weil sie befürchten, die regulatorischen Vorgaben zu verletzen. Vor allem hat man Angst vor einer Verletzung der Datenschutzgrundverordnung, denn die maschinengenerierten Daten enthalten auch Personenbezug. Je nach Maschinentyp und Softwareversion könnte der Name des Waldbesitzers oder des Maschinenführers in den Daten enthalten sein. Mit den Daten über die Maschinenposition könnte man Datenbewegungsprofile des Maschinenführers anlegen. Die Herausforderung ist also, dass unbefugte Dritte keinen Zugang zu bestimmten Daten erhalten dürfen. Es wäre auch vorstellbar, dass den Erntemaschinen eine bestimmte Preismatrix hinterlegt wird, um zu entscheiden, wo sie die Bäume schneiden, wie sie die Bäume entasten und so weiter. Dies und andere Informationen wie zum Beispiel die Holzqualität stellen Geschäftsgeheimnisse dar, die nicht für alle Akteure einsehbar sein sollten. Ein weiteres Problem liegt darin, dass juristisch überhaupt nicht geklärt ist, wer was mit rein maschinengenerierten Daten machen darf, denn Daten, die eine Maschine erhebt, haben keinen Eigentümer. Während der Umgang mit personenbezogenen Daten bis ins kleinste Detail reguliert ist, ist die Handhabung mit maschinengenerierten Daten vollkommen offen. Das führt dazu, dass Daten aus Sorge, man könne etwas falsch machen, nicht geteilt werden.
Welche Chancen bietet der Datentreuhänder in dieser Situation?
Der Datentreuhänder kann die regulatorische Lücke nicht schließen, doch er kann ein verlässliches Umfeld bieten und feste Spielregeln aufzeigen, wie miteinander umgegangen werden darf. Dadurch kann er den Akteuren, die ihre Daten zur Verfügung stellen wollen, eine gewisse Sicherheit bieten.
Welche Aufgabe hatte ComConsult in diesem Forschungsprojekt?
Wir haben uns mit den Anforderungen an den Datenschutz und die Informationssicherheit für die Datentreuhandkomponenten beschäftigt. Dabei haben wir uns ein Projekt aus Finnland bzw. generell Skandinavien zum Vorbild genommen. In Finnland werden maschinengenerierte Daten aus der Holzernte viel häufiger genutzt als in Deutschland. Es gibt zwischen den Akteuren eine Nutzervereinbarung, wie mit den Daten umgegangen wird. Diese Nutzervereinbarung haben wir zugrunde gelegt und versucht, uns daran zu orientieren.
Wie war das Projekt angelegt?
Wir sind nicht die einzigen, die sich mit Datentreuhandmodellen im Rahmen eines Forschungsprojektes auseinandersetzen. Es gab einen groß angelegten Call vom BMBF, und es waren viele Schwesterprojekte involviert. Es fanden regelmäßig Vernetzungskonferenzen statt, auf denen wir uns mit anderen Projektbeteiligten zu unserer Fragestellung ausgetauscht haben. In einem Begleitprojekt standen Juristen für Fragen zur Verfügung, mit denen wir unsere Ideen diskutieren konnten. Unsere Vorstellungen kamen gut an und lassen sich vermutlich auch gut umsetzen.
Wer war am S3I-X-Projekt beteiligt?
Zum einen war das Institut für Mensch-Maschine-Interaktion MMI der RWTH Aachen an dem Projekt beteiligt. Die Konsortialführung hatte das Institut für Forschung und Transfer RIF e.V. aus Dortmund inne. Das Softwareunternehmen Nexoma aus Arnsberg hat zusammen mit dem MMI an der Entwicklung der Software gearbeitet. Unterstützt wurden sie vom RIF, das im Kompetenzzentrum Wald und Holz 4.0 aktiv ist und, wie auch das MMI, an vielen Projekten im Bereich Digitalisierung in der Forstwirtschaft beteiligt ist. Dadurch hatten wir Kontakt zu Forstwirten, Maschinenherstellern und anderen Akteuren aus der Forstwirtschaft, um erst einmal zu verstehen, welche Daten von wem und wie genutzt werden, und welche Relevanz sie in der Praxis haben könnten.
Wie ist aktuell der Ist-Zustand bei der Waldernte und wie kann ein Anwendungsfall für den Soll-Zustand unter Einbeziehung eines Datentreuhänders aussehen?
Ein typischer Anwendungsfall für den Ist-Zustand ist folgender: Ein Waldbesitzer ruft einen Forstunternehmer an und beauftragt ihn, seine Bäume zu ernten und ihm anschließend die Erntedaten auszuhändigen. Nachdem der Harvester die Bäume geerntet und die Erntedaten aufgenommen hat, speichert ein Mitarbeiter des Forstunternehmers die Daten vom Harvester auf einem USB-Stick, nimmt diesen mit zu seinem Computer und schickt von dort aus die Daten per E-Mail an den Waldbesitzer. Die Daten werden also manuell von der Erntemaschine zum Waldbesitzer transportiert.
Dieser Anwendungsfall könnte mit dem Datentreuhänder als zwischengeschaltete neutrale Instanz so aussehen: Die Beauftragung der Holzernte erfolgt weiterhin telefonisch oder auf anderem Weg außerhalb des Datentreuhänders. Danach legt der Forstunternehmer im Datentreuhänder eine Meldung an, dass er eine Erntemaßnahme für Waldbesitzer A mit seinem Harvester B durchführt und gibt dabei an, wer Einblick in die Daten erhalten darf. Nach der Ernte übermittelt Harvester B seine Erntedaten an den Datentreuhänder, welcher die Daten dem Auftrag zuordnet und die Daten den autorisierten Personen, in diesem Fall Waldbesitzer A, zur Verfügung stellt. Waldbesitzer A könnte im nächsten Schritt im Datentreuhänder zum Beispiel eine Regel festlegen, dass er die Daten allen Sägewerken im Umkreis von 50 Kilometern übermitteln darf. Oder er könnte festlegen, dass die Daten an Forschungseinrichtungen ohne Nennung von Namen weitergegeben werden dürfen. Diese und andere Regelungen ließen sich mit dem Datentreuhänder umsetzen.
Welche Relevanz hatte der Data Governance Act bei eurer Arbeit?
Der Data Governance Act DGA ist ein Rechtsakt der EU, der das Teilen von Daten regelt. Im DGA wird die Rolle von Datenvermittlungsdiensten, was ein anderer Terminus für Datentreuhänder ist, definiert. Der Rechtsakt stellt an Datenvermittlungsdienste bestimmte Anforderungen, die insbesondere festlegen, was nicht zulässig ist. Der Data Governance Act stellt Mindestanforderungen an die Interoperabilität und die Informationssicherheit und regelt Anforderungen an die Nutzerverwaltung. Eine Forderung ist, dass Daten im Eigeninteresse nicht weiterverarbeitet werden dürfen. Im S3I-X-Projekt findet eine gewisse Art von Datenweiterverarbeitung statt, indem beispielsweise Datensätze anonymisiert und Personenbezüge entfernt werden. Wichtig ist, dass der Datentreuhänder diese Datenweiterverarbeitung neutral im Auftrag des Datengebers vornimmt und nicht etwa, weil sich die Daten an Dritte besser verkaufen lassen. Der DGA wurde ungefähr zeitgleich mit dem Start unseres Projektes veröffentlicht, weshalb noch niemand Erfahrung mit dieser Verordnung hatte. Deshalb bestand ein Großteil unserer Arbeit darin, zu prüfen, inwieweit der Rechtsakt unser Vorhaben betrifft und wie eine DGA-konforme Umsetzung aussehen kann.
Welche Rolle hatte ComConsult bei der technischen Umsetzung?
Anders als bei Projektgeschäften in der freien Wirtschaft, ist die Arbeit in einem Forschungsprojekt ergebnisoffener und es steht das Ziel im Vordergrund, zu neuen Erkenntnissen zu einem wichtigen aktuellen Thema zu kommen. Wir haben sehr viel im Projektteam darüber diskutiert, wie wir unsere Vorschläge zur Ausgestaltung des Datentreuhänders umsetzen können. Wenn die Mitglieder des Projektteams Ideen vorstellten, war es meine Aufgabe zu prüfen, ob die Vorstellungen im Hinblick auf die DSGVO und den Data Governance Act realisierbar sind. Wir haben uns intensiv mit Fragen zur Konzipierung möglicher Nutzerverwaltungsrechte auseinandergesetzt. Hier galt es, Regeln zu entwickeln, die der Datentreuhänder gewährleisten kann. Wir haben die technische Umsetzung begleitet, ohne sie selbst durchzuführen. Es existiert aktuell ein Prototyp, in dem Daten hochgeladen werden können. Man kann Nutzerregeln festlegen, und der Datentreuhänder setzt sie entsprechend um und stellt die Daten einem anderen Nutzer zur Verfügung. Alles funktioniert so, wie wir uns das vorgestellt haben.
Wann wird der Prototyp in ein betriebsbereites Produkt umgesetzt?
In den nächsten 19 Monaten werden wir in einem Folgeprojekt daran beteiligt sein, den Prototypen in ein betriebsfähiges Produkt zu überführen. Unser Projektteam wurde erheblich erweitert. Neben den vier Partnern aus dem Entwicklungsprojekt sind nun auch Partner aus der Forstwirtschaft mit an Bord, die das Projekt fachlich deutlich enger begleiten können.