Katrin Eggert

Google implementiert BigData datenschutzkonform

Verteilte Berechnung macht zentrale Speicherung der Rohdaten überflüssig

Gleich vorweg: Dies ist weder Werbung für Google noch löst es alle Datenschutzprobleme im Zusammenhang mit BigData. Aber es ist (endlich) ein technologischer Ansatz, der beweist, dass sich BigData und Datenschutz nicht gegenseitig ausschließen.

In einem hervorragend lesbaren Blogartikel 1 stellt Google einige Neuerungen ihrer Tastatur-App vor. Dies ist auf den ersten Blick nicht aufsehenerregend, doch der Titel „Machine Learning without Centralized Training Data“ macht neugierig: Die hier vorgestellten Studien, Methoden und Protokolle ermöglichen eine datenschutzkonforme BigData-Anwendung!

Konkret geht es um die Wortvorhersage beim Tippen auf dem Smartphone. Eine Funktion, die Datenschutz-sensiblen Menschen oft ausschalten, weil die Vorhersage in der Regel „in der Cloud“ geschieht. Dies bedeutete, dass alles, was man tippt, zum Anbieter gesendet wird. Bis heute.

Bereits jetzt nutzt Google in ihrer aktuellen Tastatur (Gboard-App) die im Blog-Artikel dargestellte Technologie. Damit hat Google Datenschutz einfach eingebaut, ohne großen Rummel. Natürlich nicht nur zum Selbstzweck: Google nutzt damit die Rechenleistung aller Smartphones, um das eigene neuronale Netz zu trainieren. Dies ist fair, weil der Nutzer etwas davon hat – eine verbesserte Wortvorhersage.

Und das, ohne dass Google die getippten Inhalte überhaupt erhält. Nebenbei spart dies auch noch Datenübertragungsvolumen. Gepaart mit dem vorgestellten Kommunikationsprotokoll ist selbst die Rückrechnung einzelner vom Smartphone geschickter Trainings-Updates unmöglich: es stellt (beweisbar) sicher, dass nur verdichtete Daten ausgewertet werden können. Selbst dieses Protokoll für sich genommen ist (auch für andere Anwendungen wie z.B. Befragungen) ein echter Gewinn für den Datenschutz.

Ihre und unsere Aufgabe ist es nun, den Weg weiter zu gehen: Spinnen Sie. Brechen Sie aus. Versuchen Sie nicht (nur) mit althergebrachten Methoden, neue (BigData-)Probleme zu lösen.

Fordern Sie solche Lösungen von den Entwicklern in Ihren Unternehmen ein. Berichten Sie darüber, dass es Alternativen gibt. Dass diese nicht nur Spinnerei, sondern bereits in Produkten umgesetzt sind, die auf Milliarden von Geräten laufen.

Klären Sie die Politik auf, dass es solche Privatsphäre-fördernde Lösungen sind, die wir entwickeln müssen, statt über viele Jahre hart erkämpfte Grundrechte zu opfern, um wirtschaftliche Interessen zu bedienen. An dieser Stelle: Chapeau, Datenschutzkonferenz!

1 Wer den englischen Blog-Eintrag von Google nicht so gut lesen kann, dem sei der ebenfalls hervorragende heise-Artikel von Johannes Merkert empfohlen.