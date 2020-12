Google hat Version 2.4 des auf Machine Learning (ML) ausgelegten Frameworks TensorFlow veröffentlicht. Das Release bringt Erweiterungen für paralleles Modelltraining mit und hat ein Subset der NumPy-APIs an Bord. Die seit TensorFlow 2.0 integrierte Deep-Learning-Library Keras stabilisiert derweil das Mixed-Precision-Training.

Das Modul für verteiltes Training tf.distribute bringt im aktuellen Release gleich zwei Neuerungen mit. Zum einen gilt die API MultiWorkerMirroredStrategy , die ein synchrones verteiltes Training von Modellen erlaubt, nun als stabil. Der Ansatz verteilt die Arbeit auf mehrere Worker-Prozesse, die jeweils potenziell auf mehreren GPUs laufen können.

Als zweite Neuerung bringt das tf.distribute -Modul eine neue Methode mit, die bisher noch als experimentell gekennzeichnet ist: ParameterServerStrategy setzt ebenfalls auf mehrere, parallele Worker-Prozesse, die aber asynchron arbeiten. Dazu verwalten sogenannte Parameterserver die Variablen, die sich die einzelnen Worker-Prozesse bei jedem Schritt abholen und nach getaner Arbeit aktualisieren.

Für den Einstieg hat das TensorFlow-Team ein Tutorial veröffentlicht, das Multi-Worker-Training in Keras mit der nun als stabil gekennzeichneten Strategie umsetzt. Auch für das Parameter-Server-Training existiert ein Tutorial, das direkt auf TensorFlow Core setzt.

Ebenfalls als experimentell gekennzeichnet ist die Anbindung an die Python-Library NumPy für Berechnungen auf Vektoren und Matrizen beziehungsweise mehrdimensionalen Arrays. Das im 2.4-Release eingeführte Modul tf.experimental.numpy enthält ein Subset der NumPy-APIs, das sich nahtlos mit den restlichen TensorFlow-APIs verbinden lässt. Das Framework kümmert sich um die optimierte Ausführung und die automatische Vektorisierung.

Die API kann unterschiedliche Typen aus TensorFlow und NumPy wie tf.Tensor beziehungsweise np.ndarray als Eingabe verwenden. Der Blogbeitrag zu TensorFlow 2.4 führt ein Beispiel zum Verwenden von NumPy-Code in Input-Pipelines und zum Berechnen von Gradienten auf: