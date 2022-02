Ohne zusätzliche Hardware: KI-Inferenz in IBMs Power10-Prozessor Im Kern beschleunigt Berthold Wesseler Zu den Power10-Erweiterungen zählt der Matrix Math Accelerator für schnelle KI-Inferenz. Damit verlagert IBM KI-Berechnungen von der GPU in die CPU und rückt sie näher an die Anwendungen. Intel, AMD und ARM wollen folgen.

iX-tract Mit dem integrierten Matrix Math Accelerator soll IBMs Power10 die KI-Inferenz beschleunigen, ohne dass Coprozessoren nötig sind.

Dafür hat IBM den Instruktionssatz der Power10-CPU um neue Befehle erweitert.

Dadurch, dass die Power10-Architektur die KI-Inferenz viel näher an die Daten heranbringt, lässt sich die KI während einer Datenbanktransaktion oder parallel zu einer Anwendung ausführen.

Auch ein auf einem beliebigen System trainiertes Modell lässt sich auf einem Power10-Server einsetzen.

Dem Power10-Prozessor hatte IBM einige Erweiterungen für rechen-, speicher- und bandbreitenintensive Workloads spendiert. Auf jedem Prozessor des neuen Power-Server-Topmodells E1080 sind erstmals die Matrix Math Accelerators (MMA) für die beschleunigte Ausführung von Vektor- und Matrixberechnungen untergebracht, wie sie moderne Anwendungen wie Deep Learning oder SAP HANA benötigen.

Ebenfalls an Bord ist eine Implementierung der Memory Inception, die ein hochperformantes Hauptspeicher-Clustering erlaubt. Doch während bei der Memory Inception noch an dem Zusammenspiel von Hardware und Betriebssystem gefeilt wird, sind MMAs beim E1080 bereits in Gebrauch. Auch insgesamt hat IBM den Schwerpunkt bei den Verbesserungen des Power10 auf KI gelegt – neben mehr Performance, höherer Energieeffizienz und verbesserten Speicher- und I/O-Architekturen.