Intels dritte Xeon-Scalable-Generation für KI und Riesen-Datenbanken

Die "Cooper Lake"-Xeons mit BFloat16-Erweiterung zielen auf Server mit vier oder acht Prozessoren und sehr viel RAM beziehungsweise Optane-Speicher.

Lesezeit: 2 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 11 Beiträge

(Bild: Intel)

Von

Die Serverprozessoren der Baureihe Xeon Scalable Processor (Xeon-SP) sind Intels wichtigstes Produkt und dominieren die weltweiten Rechenzentren. Nun startet die dritte Generation "Cooper Lake" nach den 2019 eingeführten Cascade Lakes; die erste Generation heißt Skylake (2017).

Intel bringt nur 11 Cooper-Lake-Typen in den Unterfamilien Xeon Scalable Gold 5300, Gold 6300 und Platinum 8300 mit 16 bis 28 Kernen auf den Markt. Sie sind für Server mit vier (4S) oder acht (8S) Prozessorfassungen gedacht. Cooper Lake kommt also (wie bereits durchgesickert war) nicht in billigeren Versionen für die wesentlich häufiger gekauften Dual-(2S-) und Single-Socket-(1S-)Maschinen.

Anders ausgedrückt treten Intels "3rd Gen Xeon Scalable Processors" nicht gegen AMDs Epyc 7002 "Rome" mit bis zu 64 Kernen an. Erst "später im Jahr 2020", wie Intel bei der Vorstellung von Cascade Lake abermals betonte, sollen die Ice-Lake-Xeons für 1- und 2-Socket-Server aus der 10-Nanometer-Fertigung und mit PCI Express 4.0 kommen. Facebook hat mit Intel gemeinsam trotzdem auch einen Single-Socket-Server in Open-Compute-(OCP-)Bauform für Cooper Lake entwickelt.

Cooper-Lake-Xeons sind vor allem für 4S-Maschinen mit bis zu 112 Kernen und 18 TByte Speicher gedacht.

(Bild: Intel)

Bei Cooper Lake kommt weiterhin 14-Nanometer-Technik zum Einsatz und bis auf die neuen Einheiten für das effiziente KI-Format BFloat16 unterscheiden sich die Rechenwerke kaum von jenen der Vorgänger. Daher bringt Intel nur Cooper-Lake-Typen für Server mit vier bis acht Prozessorfassungen auf den Markt; das ist eine vergleichsweise kleine Marktnische.

Anders als noch im August 2019 vollmundig von Intel versprochen, kommt also kein 56-kerniger Cooper Lake. Es bleibt auch bei je 48 PCI-Express-3.0-Lanes sowie sechs DDR4-RAM-Kanälen pro Socket. Mit nur einem DIMM pro Kanal ist aber nun DDR4-3200 statt DDR4-2933 möglich.

Als Chipsatz für CPL-SP-Serverboards dient weiter Intels C621 alias Lewisburg (LBG) mit den Varianten C627A und C629A samt Intel Quick Assist Technology (QAT) für schnelle Verschlüsselung in Telco-Servern. Cooper-Lake-Boards benötigen die CPU-Fassung LGA4189 (Socket P+), die Xeon-SP der ersten und zweiten Generation hingegen LGA3647 (Socket P).

Intels Cooper-Lake-Xeons sind die ersten x86-Serverprozessoren mit BFloat16 für schnellere KI-Datenverarbeitung.

(Bild: Intel)

Wichtigste Neuerung bei Cooper Lake (CPL-SP) ist die Verarbeitung des effizienten Datenformats BFloat16 für KI-Anwendungen. Damit lassen sich sowohl Trainings- als auch Inferencing-Algorithmen beschleunigen, manche um den Faktor 1,9.

Das in den Google-TPUs verwendete BFloat16-(BF16-)Datenformat für Gleitkommazahlen erlaubt einen enorm weiten Wertebereich, belegt aber auf Kosten der Genauigkeit weniger Platz als 32-Bit-Gleitkommazahlen (FP32). Auch Nvidias A100-(Ampere-)Beschleuniger können mit BF16 umgehen, angeblich will es auch IBM beim POWER10 bringen. Cooper Lake ist aber der erste x86-Prozessor mit BFloat16. Intel sieht sie als Teil von Deep Learning Boost (DLBoost). Zuvor schon kamen dafür die AVX-512 Vector Neural Network Instructions (VNNI).

In Cooper-Lake-Servern (Plattform: Cedar Islands) lassen sich auch nichtflüchtige Optane-Speichermodule der zweiten Generation (Optane DC Persistent Memory 200 alias Barlow Pass) mit etwas höherer Taktfrequenz und bis zu 4,5 TByte Kapazität pro CPU-Fassung einbauen. Dazu muss man aber eine der drei teureren HL-Varianten der Xeons kaufen und einen 4S-Server – bei 8S-Systemen ist "persistenter Optane-DC-Speicher" nicht vorgesehen.

Control-Flow Enhancement Technology (CET) kommt bei Xeons erst mit Sapphire Rapids (SPR)

(Bild: Intel)

Wie erwähnt steht noch 2020 die vierte Xeon-SP-Generation Ice Lake an (ICL), aber ohne BFloat16, dafür unter anderem mit PCIe 4.0 und der RAM-Verschlüsselung MKTME. Man erwartet hier zudem acht DDR4-Speicherkanäle in einer Variante der LGA4189-Fassung.

Intel betonte zudem, dass der für 2021 angekündigte Xeon-SP "Sapphire Rapids" (Plattform: Eagle Stream) mit 10-Nanometer-Strukturen seinen ersten "Power On" gemeistert habe. Sapphire Rapids ist für mehrere Supercomputer-Projekte wie Aurora eingeplant und bringt PCIe 5.0 mit kohärentem CXL-Interconnect und vermutlich auch DDR5-SDRAM. Sapphire Rapids kann auch wieder BFloat16. Neu ist die Befehlssatzerweiterung Advanced Matrix Extensions (AMX), zu der Intel "demnächst" mehr verraten will.

Sapphire Rapids (SPR) bringt bei Xeons auch die schon 2016 angekündigte Control-Flow Enforcement Technology (CET) zur Abhärtung gegen Malware-Angriffe. Sie soll mit den "Tiger Lake"-Mobilprozessoren samt "Willow Cove"-Mikroarchitektur in der zweiten Hälfte des laufenden Jahres 2020 debütieren. In eine ähnliche Richtung geht Pointer Authentication Code (PAC) in Apples ARM-Prozessoren seit dem A12.

Intel 3rd Gen Xeon Scalable Processors (Cooper Lake, CPL-SP)
Prozessor Kerne/Threads Cache Takt/Turbo TDP
Xeon Platinum 8380H* 28/56 38,5 MByte 2,9/4,3 GHz 250 Watt
Xeon Platinum 8376H* 28/56 38,5 MByte 2,6/4,3 GHz 205 Watt
Xeon Platinum 8354H 18/36 24,75 MByte 3,1/4,3 GHz 205 Watt
Xeon Platinum 8353H 18/36 24,75 MByte 2,5/3,8 GHz 150 Watt
Xeon Gold 6348H 24/48 33,0 MByte 2,3/4,2 GHz 165 Watt
Xeon Gold 6328H* 16/32 22,0 MByte 2,8/4,3 GHz 165 Watt
Xeon Gold 5320H 20/40 17,5 MByte 2,4/4,2 GHz 150 Watt
Xeon Gold 5318H 18/36 24,75 MByte 2,5/3,8 GHz 150 Watt
* HL-Version für bis zu 4,5 TByte Speicher verfügbar (RAM + Optane DC Persistent 200)

(ciw)