Apple Silicon M1 Max: Apple will es mit Nvidias GeForce RTX 3080 aufnehmen

Beim System-on-Chip M1 Max baut Apple im Wesentlichen eine 10-Kern-CPU um eine riesige Grafikeinheit, die in Gefilde großer GeForces und Radeons vordringt.

Lesezeit: 5 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 456 Beiträge

(Bild: Apple)

Von
  • Mark Mantel

Mit den neuen "Apple Silicon"-Prozessoren M1 Pro und M1 Max marschiert der Hersteller mit großen Schritten auf das Territorium der etablierten Chipentwickler: Nahm es Apples ARM-Prozessor M1 mit AMDs und Intels Notebook-Prozessoren auf, schickt die Firma jetzt mit den Nachfolgern eine Kampfansage nicht nur an die CPU-Teams der Konkurrenz, sondern auch an die eigenständigen Grafikchips von AMD und Nvidia. Der M1 Max soll es mit der schnellsten Mobil-GPU GeForce RTX 3080 aufnehmen können.

Dazu flanscht Apple nicht mehr nur eine moderate Grafikeinheit an eine CPU, um die nötigsten Aufgaben bei der Bildausgabe zu übernehmen. Beim M1 Max sind die zehn ARM-CPU-Kerne im Größenvergleich vielmehr Beiwerk der GPU, die aus 32 Kernen mit 4096 Shader-Rechenwerken, einer FP32-Rechenleistung von 10,4 TeraFlops und einer mächtigen Media Engine für Video-Streams besteht. Letztere beschleunigt etwa die Apple-eigenen Formate ProRes und ProRes RAW sowie H.264 und H.265.

In mehreren Grafiken veranschaulicht Apple die Effizienz sowohl des M1 Max als auch die des M1 Pro mit halb so starker GPU (16 Kerne, 2048 Shader). Das Topmodell soll bei einer Leistungsaufnahme von weniger als 60 Watt vergleichbar schnell sein wie eine mobile GeForce RTX 3080 in einer Konfiguration mit 95 Watt – die wiederum in etwa auf dem Niveau einer Desktop-GeForce-RTX-3060 liegt. Darf die mobile GeForce RTX 3080 etwa 160 Watt aufnehmen, kommt der M1 Max nicht mehr ganz hinterher, hat dann aber einen deutlichen Effizienzvorteil. Auf dem Papier könnte es der M1 Max sogar mit AMDs Kombiprozessoren der aktuellen Spielekonsolen Playstation 5 und Xbox Series X aufnehmen.

Apple-Benchmarks zum M1 Max und M1 Pro (10 Bilder)

Verglichen mit Nvidias mobiler GeForce RTX 3050 Ti soll die GPU des M1 Pro ähnlich schnell sein, aber 70 Prozent weniger elektrische Leistung aufnehmen. Der Vergleich ist allerdings nur bedingt fair, da die GeForce-GPU im getesteten Lenovo-Notebook mit 105 Watt oberhalb des Sweet-Spots betrieben wird.
(Bild: Apple)

Die Zahlen sind allerdings mit Vorsicht zu genießen: Apple gibt keine Details zu den herangezogenen Benchmarks an. Im Zweifelsfall kam Software zum Einsatz, die den eigenen MacBooks besonders gut liegt. Apples Fokus liegt etwa auf Produktanwendungen und nicht 3D-Spielen.

Im Falle der CPU hat Apple im Wesentlichen die Anzahl der Performance-Cores von vier auf acht verdoppelt und im Gegenzug die Anzahl der Effizienz-Kerne auf zwei halbiert. In mehrkernoptimierten Anwendungen soll die Rechenleistung verglichen mit dem M1 um 70 Prozent steigen. Die 10-Kern-Konfiguration soll zudem in jeder Wattklasse leistungsstärker sein als Intels Vier- und Achtkerner der Tiger-Lake-Baureihen U (15-28 Watt) und H (45+ Watt).

Für die Leistung investiert Apple ordentlich in Silizium. Der M1 Max und M1 Pro sind zwei unterschiedliche Systems-on-Chip (SoCs) mit 57 Milliarden beziehungsweise 33,7 Milliarden Transistoren, die der Chipauftragsfertiger TSMC mit 5-Nanometer-Technik herstellt. Selbst Nvidias komplexeste 7-nm-GPU GA100 für Rechenzentren hat mit 54 Milliarden weniger Transistoren als der M1 Max. AMDs Navi-21-GPU der Radeon RX 6900 XT kommt auf 26,8 Milliarden Transistoren. Fairer ist allerdings der Vergleich mit anderen Kombiprozessoren: Das SoC der Xbox Series ist mit 15,3 Milliarden Transistoren deutlich simpler aufgebaut und bei einer Chipfläche von 350 mm² in TSMC 7-nm-Prozess deutlich günstiger herzustellen als die neuen M1-Varianten.

Die Webseite Andandtech schätzt anhand der gezeigten Die-Shots, dass der M1 Max stolze 432 mm² misst und der M1 Pro rund 246 mm². Die Schaubilder offenbaren, dass Apple bestehende CPU- und GPU-Blöcke hochskaliert und mit einem Fabric verbindet.

M1 Max und M1 Pro (11 Bilder)

Links der bisherige M1 von 2020 mit einer Chipfläche von rund 120 mm². Sofern alle Chips im selben Maßstab abgebildet sind, kommt der M1 Pro auf rund 256 mm² und der M1 Max auf circa 432 mm².
(Bild: Apple)

Die Rechenleistung steht und fällt mit dem verfügbaren Datendurchsatz. Beim Speichersystem geht Apple einen ungewöhnlichen Weg: Während AMD und Nvidia in der Leistungsklasse der M1-Max-GPU auf GDDR6-DRAM setzen, das mit schnellen Taktfrequenzen auf eine hohe Übertragungsrate getrimmt ist, verwendet Apple effizientere, latenzärmere, aber langsamere LPDDR5-Bausteine. Zur Kompensierung des niedrigen Speichertaktes verbreitert die Firma das Speicher-Interface im Falle des M1 Max auf 512 Bit. Die Rede ist von 400 GByte/s – denkbar wäre LPDDR5-6400-Speicher mit ungerundeten 409,6 GByte/s. Der M1 Pro kommt mit 256 Bit auf die Hälfte.

Apple packt bis zu vier LPDDR5-Bausteine mit 64 GByte Kapazität direkt neben das SoC auf den Träger. Das verkürzt die Signalwege und spart Strom, erhöht also die Effizienz. Der Nachteil: Der Arbeitsspeicher lässt sich nicht austauschen – was bei Apple und vielen Ultrabooks allerdings schon seit Jahren kein Thema mehr ist.

Zur Beschleunigung des Kombiprozessors verwendet Apple derweil einen flotten System-Level-Cache bestehend aus SRAM-Zellen, der ähnlich wie AMDs Infinity Cache bei den Radeon-RX-6000-Grafikkarten funktioniert. Dieser Cache sitzt zwischen den Rechenkernen sowie dem LPDDR5-RAM und hält wichtige Daten vor, um den Zugriff zu beschleunigen. Die Die-Shots legen eine deutliche Erhöhung nahe, womöglich auf bis zu 64 MByte.

Apple Silicon im Vergleich
SoC M1 Max M1 Pro M1
Fertigung TSMC 5 nm TSMC 5 nm TSMC 5 nm
Größe ~432 mm² ~246 mm² ~120 mm²
CPU
Performance-Kerne 8 8 4
P-Kerne L2-Cache 24 MByte 24 MByte 12 MByte
P-Kerne Takt ? ? 3,2 GHz
Effizienz-Kerne 2 2 4
E-Kerne L2-Cache 4 MByte 4 MByte 4 MByte
E-Kerne Takt ? ? 2,06 GHz
GPU
Kerne 32 16 8
Shader 4096 2048 1024
FP32-Rechenleistung 10,4 TFlops 5,2 TFlops 2,6 TFlops
Speicher
RAM-Typ LPDDR5 LPDDR5 LPDDR4X-4266
Interface 512 Bit 256 Bit 128 Bit
Übertragungsrate ca. 400 GByte/s ca. 200 GByte/s 68 GByte/s
System Level Cache Evtl. 64 MByte Evtl. 32 MByte 16 MByte

(mma)