Big Data als Chance im Kampf gegen das Coronavirus? Oder ein Angriff auf die Privatsphäre der BürgerInnen? Vergangene Woche wurde auch in Österreich eine Datenschutzdebatte laut, als bekannt wurde, dass der Telekommunikationsanbieter A1 dem Corona-Krisenstab Nutzerdaten zur Überprüfung der getroffenen Maßnahmen gegen die Ausbreitung des Virus zur Verfügung stellt. Nicht genau bekannt war zuerst, um welche Daten es sich handelt und in welcher Form sie der Regierung übergeben werden. An dieser Schnittstelle kommt Invenium ins Spiel, ein Unternehmen, das eng mit der Technischen Universität Graz verbunden ist.
Aber was macht Invenium genau? „Mit unserem Partner und Datenlieferanten A1 bieten wir Bewegungsanalysen auf Basis anonymisierter Handydaten an. Am häufigsten analysieren wir die vielfältigen Tourismusregionen und Städte Österreichs – wie die unglaublich fotogene, aber berüchtigte Stadt Hallstatt oder die Stadt Graz, unsere geliebte Heimatstadt.“ Das Leitbild des Unternehmens lautet: „Die menschliche Mobilität in großem Maßstab erforschen.“ Wie das genau funktioniert, warum seine Technologie in der Coronakrise helfen kann und ob das datenschutzrechtlich bedenklich ist, hat uns Michael Cik, einer der Gründer von Invenium, im Interview erzählt.
Was macht ihr genau, was leistet Invenium?
Michael Cik: Wir machen Data Analytics, das heißt wir sind auf die Analyse und Aufbereitung von Daten spezialisiert, mit starkem Fokus auf das Verkehrswesen. Ich komme selbst aus diesem Bereich. 2012 bin ich an A1 herangetreten und habe gesagt, ich würde gerne für Verkehrsmodelle kooperieren. Verkehrsmodelle meint, dass auf Basis von Modellen geschaut wird, wo die Bevölkerung lebt und arbeitet. Daraus wird für die Zukunft ein Modell gebaut, das aussagt, wohin sich der Individual- und der öffentliche Verkehr entwickelt und wo neue Infrastruktur gebaut werden muss. Wir nutzen diese Modelle, statistische Modelle, und reichern sie mit realen Daten an. 2012 haben wir gedacht, wir könnten die Mobilfunkdaten in die Modelle mit hineinnehmen, um sie besser zu kalibrieren.
Wir haben von der TU Graz aus Forschungsprojekte gemeinsam mit A1 gemacht, unter anderem ein Projekt, wo es darum ging, wie die Mobilfunkdaten, die Mobilfunk-Signalisierungsdaten eines Telekommunikationsunternehmens, anonymisiert werden müssten, um sie für Forschung oder sogar für kommerzielle Zwecke verwenden zu können.
Wie funktioniert das technisch?
Michael Cik: Signalisierungsdaten kann man sich so vorstellen: Ein Telekommunikationsunternehmen hat ein Monitoringsystem, um festzustellen, wieviele Menschen auf einem Masten angemeldet sind, um die Infrastruktur für die KundInnen und für das System zur Verfügung zu stellen. Das sind keine KundInnenendaten, sondern technische Daten. Bei jedem Handygerät kann man feststellen, in welcher Position zum Masten das Gerät ist. Das ist aber nicht vergleichbar mit dem GPS-Tracking einer App wie es etwa bei diversen Fitness-Apps gemacht wird, wo man genau auf einer Karte markiert wird und zum Beispiel die gelaufene Route sieht. Bei Signalisierungsdaten springt man immer zwischen den Masten hin und her und bekommt im städtischen Bereich eine Genauigkeit zwischen 300 bis 500 Metern, im ländlichen Bereich sind die Abweichungen noch größer.
Wir werfen alle Daten in einen Topf und schauen uns an, wieviele Menschen etwa zwischen Gemeinde A und Gemeinde B unterwegs sind und wo stark frequentierte Bereiche liegen. Diese Informationen kann ich aus den Daten abstrahieren, die dann in die Verkehrsmodelle einfließen. Wir haben das gemacht und nutzen das für Fragestellungen aus dem Bereich Verkehr, Tourismus, Retail und den Eventbereich.
Wie kommen die Daten von A1 zu euch?
Michael Cik: A1 hat diese Daten in ihrem Monitoring System, nehmen sie her, schmeißen die Simkarten-Nummern weg und generieren einen Koordinatenpunkt für ein gewisses Gebiete. Diese Information bekommen wir und generieren daraus wiederum Aussagen wie: Zwischen den Gemeinden A und B verkehren am Tag 50 oder 100 oder 200 Leute am Tag. So kann man den Binnenverkehr analysieren. Bei einer Innenstadt könnte eine Fragestellung sein: Wieviele Menschen bewegen sich am Linzer Hauptplatz, wo kommen sie her, wohin gehen sie nachher, wielange halten sie sich dort auf? Das sind klassische Fragestellungen, die wir beantworten können.
A1 ist ja nur einer von mehreren Mobilfunkanbietern, ist das trotzdem aussagekräftig?
Michael Cik: Wir arbeiten ja mit Statistik und Mathematik. Wir haben 5,4 Millionen Simkarten im System, das sind über 40 % der Gesamtheit. Wenn man weiß, wie groß eine Stichprobe bei 40% ist, hochgerechnet auf die Gesamtbevölkerung , dann haben wir eine sehr geringe Schwankungsbreite. Wir rechnen statistisch, wir machen Hochrechnungen und liefern den KundInnen wirklich nur aggregierte Analyseergebnisse. Die Kundin bzw. der Kunde bekommt auch die anonymisierten Daten von A1 nicht zu sehen, sondern nur eine Zusammenfassung in aggregierter Form, angepasst an die Fragestellung.
Und wie kann das, was ihr macht, in der Coronakrise helfen?
Michael Cik: Wir haben uns schon länger Gedanken zur Theorie des Social Contacting gemacht. Dabei geht es um Folgendes: Je weniger soziale Kontakte ich habe, umso flacher wird die Kurve der Ansteckungen. Das ist die Grundlage unserer Gedanken. Je geringer die Mobilität ist, so die Annahme, umso geringer ist das Social Contacting. Wir machen diese Analysen bereits seit drei Jahren, auch im kommerziellen Bereich, und haben uns gedacht, wir schauen mal, um wieviel die Mobilität abnimmt. Wir könnten für den Krisenstab täglich einen Mobilitätsindex errechnen, diesen könnte der Krisenstab wiederum in seine Modelle einfließen lassen. Die Mitglieder des Krisenstabs waren alle sehr begeistert von dem Thema und seitdem schauen wir, wieviel Mobilität jeden Tag unterwegs ist, ob das gleich bleibt etc. Unser Ansatz war überhaupt nicht, irgendjemanden oder irgendetwas zu überwachen, sondern wir wollten eher den anderen Modellierern zeigen: Je weniger Mobilität, desto weniger Social Contacting – und das wirkt sich wiederum auf das Abflachen der Kurve aus. Das war unser Ansatz. Seitdem sind wir im 24-Stunden-Betrieb.
Was antwortet ihr, wenn die Leute trotzdem Bedenken haben, was ihre Privatsphäre betrifft?
Michael Cik: Wir sind fast zwei Jahre lang bei allen Institutionen gewesen – Arbeiterkammer, TÜV, Datenschutzbehörde, und sind von allen in Bezug auf Datenschutz geprüft worden. Ich verstehe die Kritik nicht, denn das kann nur bedeuten, das die Leute nicht verstehen, was wir machen. Wir wollen keineswegs ein Individuum abbilden. Wir wollen anonymisierte, aggregierte Analysen von Daten anbieten. Das machen wir schon immer, das bieten wir seit Jahren an.
A1 macht die Anonymisierung der Rohdaten, Invenium macht die Verarbeitung der Daten und bereitet das Ergebnis auf. Unsere Daten liegen auf strikt getrennten Servern. A1 hat einen eigenen Server, wir haben einen eignen Server mit unseren Daten und auf einem dritten Server liegen die sensiblen Kundendaten von A1.
Was sagst du dazu, dass in Deutschland ein Tracking von Infizierten erwägt wird?
Michael Cik: Das ist ein ganz anderes Thema, da geht es um personenbezogene Daten. Würde man die Rohdaten hernehmen und das machen – das ginge absolut gar nicht. Wir haben immer gesagt, auch gemeinsam mit A1, selbst wenn uns jemand fragen würde, wir würden es nicht machen. Wenn du es einmal machst, ist das ganze Thema kaputt und wir könnten nichts mehr damit machen. Dazu kann uns niemand zwingen.
Michael Cik ist Co-Founder von Invenium Data Insights und stellvertretender Institutsleiter am Institut für Straßen und Verkehrswesen der TU Graz. Der studierte Verkehrswissenschaftler beschäftigt sich seit vielen Jahren mit dem Thema „Digitalisierung im Verkehrswesen“ und der Frage „Wie kann ich die Mobilität der Menschen besser verstehen?“