Menü

IDF: Intel stellt Haswell-Prozessor vor

Lesezeit: 2 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 102 Beiträge
Von

Gleich zu Anfang des IDF lässt es Intel ordentlich krachen, mit der neuen Prozessorgeneration Haswell. Nachdem Produktchef Daddi Permutter in seiner Eröffnungsrede eine Demo vorführte, in der ein Haswell-Prototyp bei gleicher Energieaufnahme etwa doppelte Performance wie ein aktuelles Modell lieferte, stellten Chefarchitekt Ronak Singhal und seine Crew den neuen Chip genauer vor. Seine Erweiterungen im Instruktionssatz (AVX2 , FMA und TSX) hatte Intel schon geraume Zeit vorab bekannt gegeben, nun folgten Details zur Hardware-Architektur.

Eine neuer Energiesparzustand "Instant Resume" ermöglicht einen aktiven Schafzustand, aus dem der Kern ohne lange Aufwachphase hellwach wird.

(Bild: Intel)

Herausragend ist dabei der neue aktive Powermanagementzustand "S0ix Active Idle", der den Energieverbrauch beim Nichtstun auf das sparsame Niveau der Schlafzustände S3 oder S4 herabsenkt, der aber keine lange Aufwachzeit (Resume) erfordert. Das Ganze erfolgt vollautomatisch per Hardware in feinkörnigen Stufen. Hinzu kommen zahlreiche Verbesserungen sowohl im aktiven Zustand als auch in den S3/S4-Schlafzuständen. Die CPU-Kerne selbst bieten dafür neue C-States. Die Übergangszeiten wurden um 25 Prozent beschleunigt und die Links zur Periphie besitzen neue Powermanagementzustände. Die Plattformen soll Displays mit Autorefresh (PSR) aufweisen so dass letztlich die Energieaufnahme im Idle auf ein Zwanzigstel der aktuellen Werte gesenkt werden kann.

Haswell-Kern: Zweimal FMA, zwei neue Ports und viele Verbesserungen

(Bild: Intel)

Um die Performance zu erhöhen hat Intel beim Haswell gegenüber Ivy-Bridge erheblich an der Mikroarchitektur gestrickt, ohne jedoch die prinzipielle Pipeline zu ändern. Erhöht wurde die Bandbreite beim Holen des Codes, die Sprungvorhersage wurde verbessert und das Fenster für Out-of-Order vergrößert. Der L2-TLB ist nun auch etwas größer und für große Speicherseiten optimiert. Vor allem kamen zwei weitere Ports hinzu, die aus der Reservation Station bedient werden: Port 6 bietet eine vierte Integer-ALU sowie eine zusätzliche Branch-Unit. Port 7 steuert eine dedizierte Store-Address-Unit an. Der mächtige AVX2-Befehl für Multiply-Add (FMA) kann parallel in zwei Einheiten via Port 0 und 1 ausgeführt werden mit einer Latenzzeit von 5 Takten. Im Durchsatz kommt Haswell mit zweimal FMA auf 32 Flops pro Takt und Kern bei einfacher Genauigkeit und 16 Flops/Takt/Kern bei doppelter Genauigkeit, damit dürfte er im wichtigen Linpack-Benchmark bei gleichem Takt und gleicher Kernzahl die doppelte Performance gegenüber dem aktuellen Ivy-Bridge erreichen.

Es reicht aber nicht allein, mehr Funktionseinheiten aufzubieten, die Daten müssen auch schnell genug nachgeliefert werden. Dazu hat Intel beim L1-Daten- und L2-Cache den Durchsatz verdoppelt. Der L1D kann jetzt pro Takt 64 Bytes lesen (zwei AVX-Worte) und 32 Bytes schreiben.

Bei der Grafik hat Intel beim GT3 neben zahlreicher Detailverbesserungen eine zweite "Scheibe" gegenüber GT2 zugelegt: die die Anzahl der Execution Units (Shader) verdoppelt, ebenso wie die Einheiten für Rasterisierung, Z, Stencil, Color Blend und so weiter sowie die Gesamtgröße der Caches. Die zweite Scheibe kann auch abgeschaltet werden, um Energie zu sparen. Im gemeinsamen "Nichtscheiben"-Teil der vorderen Pipeline sitzen unter anderem die Fix Function Units, deren Performance für die meisten Renderaufgaben ebenfalls verdoppelt wurde. Schließlich gibt es hier noch den Media-Teil, der nun skalierbares Video-Coding (SVC) und Motion-JPEG-Dekoder bietet. Für MPEG2 kann er on the fly enkodieren, etwa für DNLA-Streaming oder DVD- Erzeugung. Er beherrscht nun auch das Abspielen von 4Kx2K-Videos. Während bei Ivy Bridge die einzelnen Engines zweifach parallel arbeiten konnten, können bei Haswell die Engines Codec, Imaging und Scale/Composite nun dreifach parallel arbeiten. (as)