Menü

Google stellt Bibliothek für Differential Privacy zur Verfügung

Die C++-Bibliothek konzentriert sich auf Funktionen, die anscheinend für gewöhnlich nur schwer von Grund auf neu zu erstellen sind.

Lesezeit: 1 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 4 Beiträge

(Bild: Tatiana Shepeleva/Shutterstock.com)

Von

Google hat eine C++-Bibliothek für den Umgang mit Differential Privacy (differentieller Privatsphäre) als Open Source zur Verfügung gestellt. Diese kommt wohl in etlichen Kernprodukten des Internetkonzerns wie Chrome, Maps und Fi zum Einsatz. Entwickler können sie nutzen und in eigenen Tools für den Umgang mit aggregierten Daten verwenden, ohne persönlich identifizierbare Informationen innerhalb oder außerhalb ihres Unternehmens preiszugeben.

Das Ziel von Differential Privacy ist es, präzise Modelle zu trainieren, die aber keine Rückschlüsse auf die verwendeten Daten zulassen. Differential Privacy ist keine Erfindung von Machine-Learning-Experten, sondern kommt in unterschiedlichen Feldern der Datenverarbeitung und Statistik bereits seit Längerem zum Tragen.

Für den Start hat man sich anscheinend auf Funktionen konzentriert, die besonders schwierig von Grund auf auszuführen sind. Die Ingenieure hinter der Bibliothek listen hier auf:

  • Statistische Funktionen: Es werden die verbreitetsten datenwissenschaftlichen Operationen (Zählungen, Summen, Durchschnitte, Mediane und Perzentile) unterstützt.
  • Tests: Neben einer umfangreichen Testsuite hilft eine erweiterbare Bibliothek mit dem Zusatz "Stochastic Differential Privacy Model Checker", Fehler zu vermeiden.
  • Sie umfasst eine PostgreSQL-Erweiterung sowie gängige Rezepte für den Einsatz.
  • Die Bibliothek lässt sich um weitere Funktionen erweitern, zum Beispiel um zusätzliche Mechanismen oder Aggregationsfunktionen.

Die Bibliothek ist nicht die erste Initiative seitens Google zum Thema Privatsphäre in diesem Jahr: So sind mit Tensorflow Privacy, eine Python-Bibliothek, die Optimierer zum Trainieren von ML-Modellen mit Differential Privacy enthält, und Tensorflow Federated, mit dem mobile Endgeräte ein gemeinsames Prediction Model erstellen können, ohne die Daten miteinander zu teilen, im Frühjahr erschienen. Und Private Join and Compute, seit Juni Open Source, ist eine neue Art von MPC (Secure Multi-Party Computing), die das PSI-Protokoll erweitert, damit Unternehmen mit vertraulichen Datensätzen zusammenarbeiten und gleichzeitig die Messlatte für den Datenschutz höher legen können.

Die Differential Privacy Library wird auf GitHub unter der Apache License gehostet.
(ane)