Dell EMC Dell DSS 8440 mit NVIDIA-GPUs für performante KI- und ML-Anwendungen Auf Trab gebracht Hubert Sieverding Vier Netzteile und zwölf Lüfter sind notwendig, um im Dell DSS 8440 zehn NVIDIA V100 bei Laune zu halten. Von der massiven Rechenkraft sollen KI- und ML-Entwickler profitieren.

iX-Tract Beim Dell DSS 8440 handelt es sich um einen GPU-Server vierfacher Höhe mit bis zu 10 V100- oder 16 T4-GPUs.

Dell EMC kombiniert für den Server das bewährte Mainboard des PowerEdge C4140 mit zwei Intel Xeon Gold 6148 sowie vier PCIe-Switches für die GPUs.

In den Benchmarks kann der DSS 8440 zeigen, dass die GPUs KI- und ML-Anwendungen deutlich beschleunigen – bei massivem Energieverbrauch.

Zeiten ändern sich: RISC war gestern, davor gab es Parallelrechner, teuer und schwer zu bedienen. Nun kommen spezielle GPU-Server auf den Markt – sie kosten zwar noch immer viel, lassen sich als x86-64-Hardware aber einfacher steuern.

Beim Dell EMC DSS 8440 handelt es sich um ein solches Server-Einhorn: Zwar hat auch er zwei Xeon-Gold-CPUs und die übliche Ausstattung fürs Rack-Blech – doch all das gleicht eher dem Transporter, der die Formel-1-Boliden zur Piste schleppt. Die Xeon-CPUs scheinen ein notwendiges Übel zu sein, ein Zugeständnis an die Kompatibilitätszwänge eines sogenannten Personal Computers von vor 38 Jahren.

Von vorne sieht die Maschine wie ein Wärmetauscher aus, schemenhaft erkennt man zwölf große Ventilatoren hinter einem Drahtgitter. Um einen DSS 8440 ins Rack zu hieven, sollte der Administrator einen Kollegen um Hilfe bitten und vorher kurz die Sicherungen überprüfen – das vier Höheneinheiten einnehmende Ungetüm wiegt gut 50 kg, ist bei einer Länge von 85 cm nicht gerade handlich und hat mächtig Appetit auf Strom.

Vier Höheneinheiten, 50 kg und vier Netzteile

Alles an der Maschine ordnet sich dem Wohlsein der GPUs unter, was nach dem Öffnen des Gehäuses sofort deutlich wird (siehe Abbildung 1). Dank der umgekehrten Komponentenanordnung – Gebläse und PCIe-Slots vorne, CPUs und Kleinkram hinten – erhalten die Grafikeinheiten die Kühlluft zuerst. Das ist sinnvoll, da NVIDIAs GPUs kompakt gebaut sind und über einen relativ geringen Kühlungsquerschnitt verfügen – trotzdem verbrennen sie jeweils 250 Watt.

Im DSS 8440 haben die GPUs Priorität, sie fordern am meisten kühlende Luft und Strom (Abb. 1). Dell EMC

Die PCIe-Lanes beider Xeon Gold – in Summe 96 – reichen nicht aus, um zehn GPUs mit jeweils 16 Lanes zu versorgen. Daher steckt unter den GPUs nicht einfach nur eine Platine mit Slots, sondern eine mit zusätzlich vier PCIe-Switches. Diese sind mit dem Motherboard eines PowerEdge C4140 verkabelt. So gesehen ist der DSS 8440 also ein erweiterter Großserienserver. Jeder Switch kann vier PCIe3-x16-Slots und zwei PCIe3-x4-NVMe-Drives bedienen. Entsprechend lässt sich das Switch­board mit vier, acht oder zehn Tesla-V100- oder acht, zwölf oder 16 Tesla-T4-GPUs von NVIDIA bestücken. Da diese sich auch untereinander koordinieren, spielen die Xeons mit ihren UPI-Links bei KI-Anwendungen nur Vermittlungszentrale und sorgen für den Datennachschub.