AllgemeinDatenschutzE-GovernmentIT-Sicherheit

Wie gefährlich ist Big Data?

Anfang Dezember ließen Hannes Grassegger und Mikael Krogerus die Bombe des Michal Kosinski platzen und regten eine hitzige Debatte über Big Data und Wahlbeeinflussung an. Die beiden Autoren berichten in dem Artikel „Ich habe nur gezeigt, dass es die Bombe gibt“ über das von Michal Kosinski entwickelte Verfahren zur Vermessung der Persönlichkeit eines Menschen anhand von im Internet gesammelten Daten.

Schon in den 80er Jahren hatten Psychologen die sog. Ocean-Methode entwickelt, die Charakterzüge von Menschen aufgrund von fünf Persönlichkeitsdimensionen messen kann. Es fehlte jedoch Jahre lang an einer entsprechend umfangreichen Datenbank, dieses Problem wurde durch das Internet gelöst. Nach der Veröffentlichung einer App zur Erstellung eines Persönlichkeitsprofils wird die Methode durch die so gewonnen Daten immer erweitert, bis Kosinski eine Person, basierend auf zehn Facebook-Likes, besser einschätzen kann als ein normaler Kollege und mit 300-Likes besser als der Lebenspartner. Nachdem Kosinski die mögliche negative Verwendung seines Systems, nicht den Menschen anhand von Daten zu analysieren, sondern zu beeinflussen, bewusst geworden ist, zieht er sich zurück.

Bei der Concordia Summit trat im September 2016 Alexander Nix, CEO von Cambridge Analytica (CA) auf und erklärte den Zuhörern „die Macht von Big Data und Psychografie im Wahlkampf“. Er erklärt den Erfolg von Präsidentschaftskandidat Ted Cruz zu einem Ergebnis von CA Arbeit und  erklärte die Funktionsweise. Dieses System gleicht dem von Kosinski, jedoch hat CA aus vielen verschiedenen Quellen Daten gekauft (z.B. Acxiom und Experian) und diese mit Wählerlisten und Onlinedaten kombiniert. Nix sagt, CA habe Psychogramme von allen erwachsenen US Bürgern, also 220 Millionen Menschen erstellt.

Mittlerweile werden kritische Stimmen zu diesem Artikel laut. An Brexit habe CA nur in sehr geringen Umfang mitgewirkt; Ted Cruzs Erfolg sei ebenso anhand anderer, teils schlüssigerer, Merkmale zu erklären. Auch kann CA keine Belege für ihre Behauptungen vorlegen und streitet inzwischen sogar ab, Facebook-Daten zu nutzen. Stattdessen würden Wählerdatenbank der Republikaner, politische Daten sowie online und offline erwerbliche Daten herangezogen und eigene Umfragen in den Swing-States durchgeführt. Das Unternehmen erklärt gegenüber WIRED, sein Auftrag habe darin bestanden, Wählerstimmen durch die Nutzung digitaler Medienkanäle zu gewinnen.

Die vollumfassende Korrektheit des Artikels sei dahingestellt, jedoch haben die Autoren zweifelsfrei eine Debatte über Data Mining, Data Targeting und Big Data angestoßen. Die mediale Aufmerksamkeit glich der Verbreitung von Fake-News; man suchte eine Erklärung für den Wahlsieg Trumps und akzeptierte CA bereitwillig als solche. Allerdings ist selbst Kosinski und mit ihm viele weitere, der Meinung, eine Wahl lasse sich nicht allein durch Big Data gewinnen.

Dennoch, Data Mining ist keine Neuheit, wenngleich es eher Anwendung im Bereich der Forschung findet. Zunächst werden Datensätze oder Texte identifiziert und anschließend extrahiert und zu strukturierten Datensätzen umgearbeitet. Ein Algorithmus untersucht im Folgenden die Daten auf Zusammenhänge. Es handelt sich um eine Form der Datenanalyse, da die ursprünglichen Daten nicht verändert werden.
Kaum eine Rechtsordnung hat bisher spezielle Regelungen für Data Mining eingeführt.

Das gilt auch für das deutsche und europäische Recht. Hier dürften lediglich Urheberrechte und Datenschutzrechte, etwa in Form der DS-GVO, betroffen sein. Das Datenschutzrecht wird i.d.R. betroffen sein, da Werke oder Daten meist Personenbezug aufweisen und diese identifizierbar seien. Dies würde bedeuten, dass es nach der neuen DS-GVO einer Einwilligung oder gesetzlichen Rechtfertigung zur Verarbeitung der personenbezogenen Daten bedarf. Da es an einer Einwilligung für die Weiterverwendung regelmäßig fehlen wird, ist wohl die einzige Möglichkeit Data Mining zu ermöglichen die Zweckbindung des Art. 5 I b EU DS-GVO zu wissenschaftlichen Zwecken gem. Art. 89 I EU-DSGVO zu durchbrechen.

Im Bereich des Urheberrechts findet § 23 UrhG keine Anwendung. Data Mining stellt die Herstellung eines Korpus dar und zieht hierbei lediglich die Daten zur Erweiterung dessen heran, die im Folgenden schematisiert werden. Dies stellt weder ein neues Werk dar, noch wird das eigentliche Werk verändert. Somit fehlt es an dem Merkmal der Bearbeitung. Auch das Recht der Datenbanken findet keine Anwendung. Diese neue Zusammenführung von Daten widerspricht insbesondere Art. 7 Datenbank-RL, da es an der vom EuGH geforderten Wiederherstellung der ursprünglichen Datenbanken mangelt. Die optionalen Schranken der EU finden bislang kaum Anwendung. So hat Deutschland keine Wissenschaftsschranke i.S.d. Art. 5 III a InfoSoc-RL eingeführt; solche Normen sind lediglich verstreut in §§ 52 a I, III und 53 II 1 Nr. 1, III UrhG zu finden.

Aus europäischer Sicht ist Großbritannien besonders ins Auge zu fassen, da hier eine Schranke für nicht-kommerzielle Analysen von urheberrechtlich geschützten Werken und Datenbanken besteht, die die InfoSoc-RL berücksichtigt.
Anders verfahren hingegen die USA, wo die Generalklausel des „Fair Use“ Anwendung findet, dies bezeichnet eine Rechtsdoktrin des Urheberrechts. Nach „Fair Use“ wird urheberrechtlich geschütztes Material zum Zweck der Kritik, Bildung, Wissenschaft u.ä. wiedergegeben, stellt dies keine Urheberrechtsverletzung dar.

Wird dem Vorschlag der EU-Kommission gefolgt, wird die Reform des Urheberrechts wohl auch eine Schranke zum Vorteil von Text und Data Mining beinhalten. Dies soll die Wettbewerbsfähigkeit der europäischen Forschung insbesondere gegenüber Ländern wie den USA steigern.

Weiterführende Links:

https://www.dasmagazin.ch/2016/12/03/ich-habe-nur-gezeigt-dass-es-die-bombe-gibt/

https://www.youtube.com/watch?v=n8Dd5aVXLCc

https://www.wired.de/collection/life/so-reagiert-cambridge-analytica-auf-die-kritik-datenwissenschaftler-haben-nicht-die

http://meedia.de/2016/12/05/karriere-einer-linken-verschwoerungstheorie-die-angeblich-unheimliche-macht-der-algorithmus-alchimisten-von-cambridge-analytica/

http://www.zeit.de/digital/internet/2016-12/us-wahl-donald-trump-facebook-big-data-cambridge-analytica

http://www.nytimes.com/2016/11/20/opinion/the-secret-agenda-of-a-facebook-quiz.html?_r=1

http://meedia.de/2016/12/05/karriere-einer-linken-verschwoerungstheorie-die-angeblich-unheimliche-macht-der-algorithmus-alchimisten-von-cambridge-analytica/

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*