Intel Xe-Grafik: Gaming-Version, Raytracing und Fertigung außer Haus

Intel hat seine kommende Xe-Grafikarchitektur mit Details unterfüttert: Raytracing soll an Bord sein, dazu hohe Taktraten und zusätzliche Ausführungseinheiten.

Lesezeit: 2 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 23 Beiträge

Intel Xe: HPG-Variante mit Hardware-Raytracing

(Bild: Intel)

Von
  • Carsten Spille

Mit der neuen Grafikarchitektur Xe, die als integrierte Prozessorgrafik mit den Tiger-Lake-Prozessoren debütieren soll, hat Intel große Pläne. Unter anderem soll sie vom Low-Power-Chip bis zum Rechenzentrum skalieren. Dafür mussten die Ingenieure an Xe einiges umbauen. Details dazu hat Intel nun auf dem Architecture-Day vorgelegt – und dabei gleich noch eine neue, außer Haus gefertigte Gaming-Variante und Raytracing-Support in Hardware angekündigt. Die ersten Karten sollen 2021 kommen.

Mit vier Xe-Varianten will Intel den kompletten Markt von der integrierten Grafik bis zum Exascale-Beschleuniger für Supercomputer abdecken. Den Xe-Einstieg gibt es bei der integrierten Tiger-Lake-Grafik mit der Variante Xe LP, darüber kommt die neu angekündigte HPG-Version zum Einsatz, die über Mid-Range bis zur High-End-Grafik reicht.

Für KI-Anwendungen im Rechenzentrum ist dann Xe HP gedacht und ganz oben im Portfolio übernimmt die HPC-Version, die als Ponte Vecchio den Exaflops-Supercomputer Aurora befeuern soll. Mehr als nur denkbar ist, dass jede Version neben spezieller Anpassungen auf Transistorebene auch Spezialfunktionen wie Tensor-Kerne, hohen FP64-Durchsatz für Supercomputer oder eben Raytracing-Hardware für Gamer bietet.

Den Anfang macht Xe LP, der als energieeffiziente Version für die integrierte Grafik und Einsteiger-Grafikkarten DG1 sowie die Server-Chips SG1 gedacht ist. Gegenüber heutiger integrierte Grafik soll Xe LP mit 96 Ausführungseinheiten und 1536 Gleitkommaoperationen pro Takt schon auf dem Papier gehörig zulegen – hinzu kommen Verbesserungen durch Änderungen an der Architektur, etwa den schnelleren Caches oder schlicht der Optimierung für höhere Taktraten.

Ein wenig aussagekräftiges Diagramm, welches Intel zeigte, deutet Frequenzen von 1,8 GHz für Xe LP an - allerdings bei höherer Spannung gegenüber der aktuellen Gen11-Grafik in Ice-Lake-Prozessoren, die nur rund 1,1 GHz schaffen. Daher ist fraglich, ob solch hohe Takte auch bei integrierter Grafik oder nicht doch eher bei den dedizierten Grafikchips DG1 und SG1 zu finden sein werden.

Die neu angekündigte Variante "Xe HPG" soll das Beste von LP, HP und HPC vereinen: Die Effizienz bei Rechenaufgaben von HPC, die Skalierbarkeit der HP-Variante und die Grafikeffizienz von Xe LP. Hinzu kommt – erstmals von Intel bestätigt – Hardware-Unterstützung für Raytracing über die etwas krude Formulierung "With Hardware Dedicated Raytracing". Viel mehr war dazu noch nicht zu erfahren, außer der Ankündigung, gerade diese Variante mit externer Prozesstechnik, also bei einem Chipauftragsfertiger wie TSMC oder Samsung, herzustellen. Dass Intel diesen Schritt aufgrund weiterer Verzögerungen bei der eigenen 7-Nanometer-Technik gehen muss, hatte die Firma während der Bekanntgabe der Quartalszahlen einräumen müssen.

Intel Xe: Vier Architekturen, teils bei externen Auftragsfertigern.

(Bild: Intel)

Ebenfalls komplett überarbeitet hat Intel die Media Engine von Xe LP, also die Display Controller und Video-Einheit. Künftig unterstützt die Grafik über DisplayPort 1.4 und HDMI 2.0 eine Auflösung von bis zu 8K, also 8192 × 4096 Pixel. Maximal sollen Displays mit 360 Hz und Adaptive Sync unterstützt werden. Xe LP entlastet den Prozessor bei der Videowiedergabe von 8K-Inhalten mit 60 Bildern pro Sekunde. Erstmals ist auch ein Hardware-Decoder für den lizenzfreien AV1-Codec mit an Bord, dessen Einsatz bei den meisten großen Streamingdiensten als gesetzt gilt.

Intel Xe LP: Überarbeitete Media-Engine mit AV1-Decoder, 8K60-Video, 360 Hz und Adaptive Sync.

(Bild: Intel)

Bei der Data-Center-Variante Xe HP setzt Intel auch auf eine möglichst hohe Transcoding-Leistung – nach eigenen Angaben mit einer Qualität, die mit Offline-Transcoder die auf der CPU laufen vergleichbar ist. In einer Demo zeigte man erstes Xe-Silizum, welches 10 4K60-HEVC-Streams parallel in Echtzeit kodierte.

Eine Demo der Skalierbarkeit der Xe-HP-Architektur zeigte eine einzelne Tile einer "Intel XeHP HD Graphics NEO", die unter Linux (ohne genauere Distributionsangabe) rund 10,6 TFlops FP32-Rechendurchsatz erreichte, also 10,6 Billionen Gleitkommarechenschritte pro Sekunde. Das ist in etwa das Performance-Niveau einer schnellen Radeon RX 5700 XT. Dann schalteten die Intel-Ingenieure zwei und schließlich vier Tiles, also Chip-Instanzen hinzu, und erreichten in dem synthetischen Benchmark eine nahezu perfekte Skalierung der Rechenleistung. Die Kunst ist freilich, dies auch bei komplexeren Berechnungen oder bei echter Grafiklast hinzubekommen.

Skalierungsdemo: Ein einzelner HP-Xe-Chip schafft bereits 10,5 TFlops und lässt sich vierfach koppeln.

(Bild: Intel)

Der Xe-HP-Chip lief dabei mit 1,3 GHz und hatte laut mitlaufendem Log 2048 Compute Units – höchstwahrscheinlich also 4096 FP32-FMA pro Takt.

(csp)