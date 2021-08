Intel hat ein paar zusätzliche Details zu seinen kommenden Arc-Grafikkarten verraten, die ab dem ersten Quartal 2022 Spielerherzen höher schlagen lassen sollen. Leistung und Preise sind neben der Verfügbarkeit dabei aber weiterhin mit großen Fragezeichen versehen.

Erst vor wenigen Tagen hatte Intel zusammen mit dem neu ausgedachten Markennamen "Arc" auch die Verspätung auf 2022 bekanntgegeben.

Die ersten Gaming-Grafikkarten nutzen die GPU namens Alchemist, darauf sollen Battlemage, Celestial und Druid folgen. Genauso kreativ, wie Intel von "Gen" für Generation auf "Arc" für Architecture gewechselt ist, sortiert man also die Chips von A bis derzeit D durch.

DirectX 12U-Alchemist

Die "Alchemist"-GPUs sind zu DirectX 12 Ultimate kompatibel. Das bedeutet, sie können außer dem leistungsschonenden Variable Rate Shading und den bislang kaum genutzten Mesh Shadern auch Raytracing in Hardware beschleunigen – das unterscheidet sie schon einmal von der integrierten Xe-Grafik und dem kaum verbreiteten Ableger DG1.

Xe-Core mit Vektor- und Matrix-Engine (Bild: Intel)

Auch in der Architektur hat Intel an einigen Stellschrauben gedreht. Statt Execution Units gibt es nun je 16 Vector und Matrix Engines ("XMX") in der kleinsten Organisationsform von Xe, dem Xe-Core. Die Vektoreinheiten entsprechen den EUs und schaffen jeweils acht 32-Bit-Operationen pro Takt, also Fused-Multiply-Add-Instruktionen, die zur Berechnung des theoretischen Rechendurchsatzes genutzt werden. Die XMX ist viermal so breit, aber welche Datenformate sie in der Gaming-Version Alchemist beherrscht, hat Intel noch nicht bestätigt – wahrscheinlich ist neben INT8 zumindest auch FP16. Die HPC-Version in Ponte Vecchio kann, ähnlich wie Nvidias Tensor Cores das für KI-Training gedachte Format TF32 ("Tensor-Float") und BF16 ("Brain Float") sowie FP16 und INT8.

Die XMX-Engines werden in 3D-Spielen beim sogenannten Xe-Super-Sampling zum Einsatz kommen. Dabei handelt es sich um Intels Konkurrenten zu Nvidias DLSS, einer Technik, die mithilfe eines vorab trainierten, neuronalen Netzes Upscaling und Bildrekonstruktion vornimmt, um die Performance speziell in Raytracing-Titeln zu steigern, ohne dabei die Bildqualität zu stark zu beeinträchtigen. Xe-Super-Sampling soll Bildinformationen sowohl zeitlich als auch räumlich umliegender Pixel berücksichtigen, um das finale Bild auszugeben.

Xe SS: KI-gestütztes Upscaling mit Reconstruction (Bild: Intel)

Ein Xe-Core bekommt zusätzlich noch Instruction- sowie L1-Caches, der per Software auch als Scratchpad Local Memory umkonfiguriert werden kann, ähnlich wie in Nvidias aktuellen GeForce-Grafikchips. Außerdem sind feste Load-/Store-Einheiten vorgesehen.

Je vier Xe-Cores sind in einer sogenannten Render Slice zusammengefasst und bekommen Fixed-Function-Blöcke für Rasterisierung, vorgezogene Tiefentests, Geometrieverarbeitung, Textursampling (4x8), Media-En- und -Decoding sowie Rasterendstufen (2x16).

Raytracing-Einheiten mit Traversal (Bild: Intel)

Außerdem ist pro Xe-Core eine Raytracing-Einheit vorhanden, wiederum ähnlich wie bei Nvidia, die nicht nur die Box- und Dreiecksschnittpunkte der verfolgten Strahlen prüft, sondern auch das sogenannte Ray-Traversal, also das Abschreiten des Strahls durch die Beschleunigungsstruktur, übernimmt.

In einem DG2-Alchemisten arbeiten dann acht solcher Render-Slices mit insgesamt 512 Ex-Excution Units, 256 Textursamplern und 128 Raster-Endstufen sowie 32 Raytracing-Einheiten zusammen, hinzu kommt ein mit der Anzahl der Render-Slices skalierender Level-2-Cache.

Mit 6 Nanometer über 2 GHz

Intel hat nun offiziell bestätigt, dass der DG2-Chip "Alchemist" mit 6-Nanometer-Technik bei der taiwanischen Chipschmiede TSMC hergestellt wird. Der Prozess nutzt bereits extrem kurzwellige UV-Strahlen zu Belichtung der Strukturen.

Xe HPG: 50 Prozent höherer Takt, 50 Prozent effizienter als Xe LP (Bild: Intel)

Unter anderem die Fertigungstechnik erlaubt es, die Taktrate im Vergleich zur DG1-Grafikkarte um 50 Prozent anzuheben, verspricht Intel. Aber auch die Architektur selbst, die verwendeten Transistoren und Auslegung der Schaltkreise spielen dabei eine Rolle. Explizit wird das zwar nicht erwähnt, aber die GD1-Karten liefen mit rund 1,5 GHz – die Hälfte obendrauf und man ist bei rund 2,25 GHz, einem Takt, mit dem bereits erste Benchmarkergebnisse der DG2-Karten in einer Datenbank gesichtet wurden. Die Effizienz, also die Leistung pro Watt, soll ebenfalls um 50 Prozent steigen.

An welchem Tag genau die Karten auf den Markt kommen, was sie kosten und wie gut sie verfügbar sein werden, ist noch genauso unklar wie die finale Performance. Denn eines ist klar: Der Erfolg steht und fällt auch mit der Treiberqualität. (csp)