Aufbruch in neue Welten

Grafikkarten mit schnelleren Chips machen Spieleerlebnisse intensiver

Trends & News | News

Die nächste Grafikkartengeneration wird überwiegend auf dem 3D-Chip TNT-2 von nVidia und S3s Savage 4 beruhen, die die Grafikkartenhersteller aber mit unterschiedlichen Taktraten einsetzen. Dagegen bringt 3Dfx den Voodoo-3 in drei Ausführungen ausschließlich auf eigenen Boards heraus.

Die 3D-Chips von nVidia - der Riva TNT und sein schnellerer Nachfolger Riva TNT-2 - markieren in etwa das obere Ende des Leistungsspektrums aktueller 3D-Chips. Während ATIs Rage 128 sowie der Savage 4 von S3 sich ungefähr auf dem Niveau des älteren TNT bewegen und der Voodoo-3 von 3Dfx etwas unterhalb des TNT-2 liegt, muß man die Neuentwicklungen von Matrox (G400) und VideoLogic (PowerVR 250) im Mittelfeld ansiedeln. Wie nah der Permedia-3 von 3Dlabs an den TNT-2 herankommt, ist noch nicht absehbar. Da ATI, Matrox, 3Dlabs und 3Dfx selbst Grafikkarten produzieren, konzentrieren sich die Kartenhersteller ohne eigene Chipproduktion auf die Bausteine von nVidia und S3.

Die Produzenten Elsa, Diamond, Creative Labs, Hercules, Guillemot, Leadtek und Asus bieten für anspruchsvolle Anwender eine Produktlinie mit dem Riva TNT-2 an (Erazor III, Viper 770, 3D-Blaster TNT 2, Dynamite TNT/2, Maxi Gamer Xentor/32, WinFast 3D S320II, AGP-V3800). Die Boards sind überwiegend mit 32 MByte SDRAM bestückt und sollen im Mai zu Preisen zwischen 350 und 400 DM in den Handel kommen. Während Elsa nur den Standardchip mit einem Chiptakt von 125 MHz und einem Speichertakt von 150 MHz einsetzt, hat die Konkurrenz auch Ausführungen mit dem TNT-2/Ultra angekündigt, die mit 150/183 MHz laufen sollen. Über die Verfügbarkeit und die tatsächlichen Taktraten des TNT-2/Ultra gibt es allerdings widersprüchliche Informationen. Asus will daher den Standard-TNT/2 mit 183 MHz schnellen SGRAMs kombinieren.

Daneben gibt es preiswertere Produkte mit dem Savage 4 von S3, die bereits im April verfügbar werden sollen. Bei Diamond besteht diese aus der Stealth III 540 für 180 DM (16 MByte) und der noch günstigeren Stealth III 520 (8 MByte). Creative Labs bietet die 3D-Blaster Savage 4 mit 32 MByte für etwa 250 DM an; Elsa und Hercules haben auch eine 16-MByte-Variante im Programm. Die Preise für die beiden Elsa-Produkte sind 199 DM für die 16-MByte-Ausführung und 299 DM für die 32-MByte-Version. Das Taktratenchaos ist hier noch größer. Bei Elsa, Creative Labs und Hercules verwendet man ausschließlich den Savage 4 Pro mit einem Chiptakt von 125 MHz und einem Speichertakt von 143 MHz. Eventuell gibt es diese Variante noch mit höheren Takten - S3 feilt ständig an der Spezifikation. Diamond setzt auch den auf 8 MByte begrenzten Savage 4 LT mit 110/110 MHz ein. Dazwischen liegen die Bausteine Savage 4G und Savage 4M mit 125/125 MHz, die voraussichtlich auf Bulk-Produkten und Mainboards auftauchen werden.

Die Besonderheiten des Savage 4 sind Motion-Compensation für beschleunigte DVD-Wiedergabe und Unterstützung für digitale LC-Bildschirme. Letztere will Elsa bei einer für Juni angekündigten Version der Winner II unterstützen. Zudem ist der Savage 4 der einzige Baustein mit Texturkompression, was beispielsweise Unreal Tournament benötigt, um die insgesamt 1 GByte umfassenden HiRes-Texturen einsetzen zu können.

Grafikboards mit dem Voodoo-3 von 3Dfx wird es ausschließlich von STB geben. Bereits im April soll eine 143 MHz schnelle Version für 259 DM in Ausführungen für PCI und AGP sowie eine 166-MHz-Variante (nur AGP) mit TV-Out und einem drei Titel umfassenden Spiele-Bundle für 399 DM in den Handel kommen. Die schnellste Ausführung mit 183 MHz hofft man im Mai anbieten zu können, ihr Preis steht noch nicht fest.

Bislang erzeugen 3D-Chips `fühlbare´ Oberflächenstrukturen mittels einer je nach Lichteinfall verschobenen zusätzlichen Textur. Weitaus realistischer wirkt das in DirectX 6.0 vorgesehene `Environment-mapped Bump-Mapping´. Der G400 von Matrox führt dieses Verfahren in Hardware aus und zeigt den Vorteil recht eindrucksvoll. Es produziert nicht nur fotorealistische Strukturen, auch mit farbigen Lichtquellen, sondern simuliert selbst Wellen auf Wasseroberflächen oder Luftturbulenzen über heißem Asphalt.

Weitere Merkmale des G400 sind zwei Monitorausgänge, die beliebige Bereiche eines Desktops gleichzeitig auf zwei Monitore - auch mit verschiedener Auflösung - ausgeben können. Einer der beiden Ausgänge kann auch über ein optionales Modul einen digitalen LC-Monitor oder ein Fernsehgerät ansteuern. Der G400 unterstützt ferner Single-Pass-Multitexturing, AGPx4, maximal 32 MByte Bildspeicher sowie 8-Bit-Stencil-Buffer (`Scherenschnitt´-Masken für Cockpits und ähnliches) und erreicht eine Füllrate von 300 MPixel/s. Grafikkarten mit dem G400 kann man im Sommer erwarten, Ausführungen und Preise stehen noch nicht fest.

VideoLogic konnte endlich die lange erwartete PC-Version des in der Spielekonsole Dreamcast eingesetzten Power-VR-Chips demonstrieren. Der PowerVR 250 steuert 16 MByte SDRAM-Bildspeicher über einen 125 MHz schnellen und 64 Bit breiten Datenbus an. Auf einem Pentium-III-500 leistete er 80 fps in der Quake-II-Demo1 bei 800 x 600 Bildpunkten (16 Bit Farbtiefe) und liegt mit nVidias TNT-2 gleichauf (siehe unten). Trotzdem reicht er unter Direct3D nicht ganz an die Performance des TNT-2 heran. Ab Juni 99 will man die AGP-Grafikkarte `Neon 250´ für 389 DM anbieten; eine PCI-Version soll folgen.

Die Spieleprogrammierer haben reichlich zu tun, um die Möglichkeiten dieser Produktstufe auszuschöpfen. Zum Ende dieses oder Anfang nächsten Jahres steht bereits die nächste Chipgeneration ins Haus, die dann dank 0,18-µm-Fertigung genügend Transistorfunktionen auf einem Chip vereinen wird, um auch die Geometrietransformation und Beleuchtungsberechnung in Hardware auszuführen. Dies entkoppelt die 3D-Leistung von der CPU, so daß man auch mit langsameren Prozessoren eine gute 3D-Leistung erreicht. (Manfred Bertuch/ea)

[#anfang Seitenanfang]


Wir konnten uns im Vorfeld der Messe einen Performance-Eindruck von der noch nicht im Handel befindlichen Grafikkarte Erazor III mit nVidias neuem 3D-Chip Riva TNT-2 verschaffen. Das Testboard arbeitete mit 125 MHz Chip- sowie 150 MHz Speichertakt und noch vorläufigen Windows-9x-Treibern von Elsa. Der Leistungsverlust bei 32-Bit-Rendering gegenüber 16 Bit Farbtiefe fällt geringer als beim Vorgänger Riva TNT aus: Bei der Auflösungsstufe 800 x 600 beträgt die 32-Bit-Leistung (Incoming Gameindex) noch 78 Prozent der 16-Bit-Leistung, beim Vorgänger waren es nur 63 Prozent. In der nächsthöheren Stufe 1024 x 768 schafft der TNT-2 noch 70 Prozent (TNT: 57 Prozent). In anderen Spielen mit höherer CPU-Last ist der Unterschied geringer, da diese den Grafikchip auch bei 16 Bit nicht am Fillrate-Limit betreiben. Die ermittelten Verhältnisse geben also den Extremfall wieder.

Die Testroutine Demo1 von Quake II lief mit 72 fps, während der TNT hier 60 fps erreicht (Auflösung: 800 x 600, 16 Bit). Beim Wechsel unserer 400-MHz-Pentium-II-Testplattform auf einen Pentium III mit 500 MHz steigerte sich der Quake-II-Wert auf 81 fps. Der Treiber enthält allerdings noch keine Optimierung für die Befehlssatzerweiterung SSE des Pentium-III. Unter Unreal konnte sich der TNT mit dem Detonator-Treiber bereits auf 26 fps steigern (800 x 600, 16 Bit). Die Erazor III schafft hier 33 fps, was sich mit dem Pentium-III-500 noch auf 36 fps erhöht. Spielbar wird nun auch die 1024er-Auflösung: während der Vorgänger lediglich 19 fps liefert, kommt die Erazor III auf 24 fps und beim Wechsel zum Pentium-III-500 auf 26 fps.

Beim Benchmark Indy3D, der den OpenGL-Treiber wesentlich stärker als Quake II fordert, fällt der Unterschied zwischen TNT und TNT-2 deutlich geringer aus: Im Testpunkt `Simulation´ liegt der ältere TNT auf dem Pentium-II-400 bei 33 fps, die Erazor III erzielt 35 fps; mit Intels neuem Flaggschiff Pentium-III-500 leistet sie 41 fps. Die entsprechenden Werte für `Animation´ betragen 9,0 fps für den TNT und 9,1 fps bei der Erazor III. Erst beim Wechsel auf die stärkere CPU steigert sich das Ergebnis auf 11,0 fps. Bei 3D-Modellen mit mehr als 10 000 Polygonen hängt der Durchsatz somit fast ausschließlich von der CPU-Leistung ab.

Die Erazor III ist für Mai 99 avisiert und soll mit 32 MByte SDRAM etwa 400 DM kosten. Angekündigt ist eine Version ohne Videofunktionen und eine Variante mit Videoein- und -ausgängen. Video-Capturing/-Editing und Konvertierung nach MPEG-1/2 ist mit dem leistungsfähigen Tool Mainactor 3.0 möglich. Um in den Genuß eines Pentium-III-optmierten Treibers zu kommen, der die speziellen SSE-Befehle nutzt, sind Interessenten der Erazor III auf entsprechende Treiber-Versionen von nVidia angewiesen. Elsa wird die eigenen SSE-optimierten OpenGL-Treiber (Elsa SIMDream) nur zusammen mit der Synergy 2 anbieten. Dieses TNT-2-Board für professionelle OpenGL-Anwendungen soll ab Ende Mai für rund 500 DM (16 MByte) beziehungsweise 600 DM (32 MByte) in den Handel kommen. Das AGPx4-Board bietet laut Elsa speziellen Support für 3D Studio MAX und AutoCAD R14. (Manfred Bertuch/ea)

[#anfang Seitenanfang]


Auf der CeBIT'99 konnte c't einige Benchmarks durchführen, anhand derer sich die 3D-Leistung aktueller Grafikworkstations und Grafikkarten unter OpenGL und Windows NT 4.0 vorläufig einschätzen läßt. Da die Messungen an den Ständen der Hersteller durchgeführt werden mußten, reichte die Zeit nicht immer für alle Testpunkte, auch stimmen die Testplattformen nur teilweise überein. Die Ergebnisse lassen trotzdem erste Schlußfolgerungen zu:

Bei großen Geometrien ohne Texturen mit 40.000 und 150.000 Polygonen (Indy3D, MCAD40 und MCAD150) ist die Wildcat-4000-Technologie von Intergraph dank ihrer guten Hardware-Geometriebeschleunigung die derzeit schnellste Lösung unter Windows NT 4.0 mit Intel-Prozessoren. Auf einem Dual-Pentium-III-Xeon- 550-System erzielte sie annähernd doppelt so gute Ergebnisse wie die SGI Visual Workstation 320 mit Dual-Pentium-II-450. Da auch der Cobalt Chipsatz von SGI den größten Teil der Geometrie- und Beleuchtungsberechnung (bis zu vier Lichtquellen) in Hardware durchführt, kann die Visual Workstation von den SSE-Befehlen des Pentium-III nur begrenzt profitieren (siehe die Tabellenwerte in Klammern). Bei den texturlastigen Testpunkten "Simulation" und "Animation" erzielt dagegen SGI die höheren Werte. Überraschend ist das gute Abschneiden einer Grafikkarte mit dem 3D-Chip "Riva TNT-2". Sie erzielt bei "Simulation" den Spitzenwert von 41,1 fps. Offenbar ist dieser auf 3D-Spiele optimierte Chip am ehesten den trilinear gefilterten Texturen gewachsen, den dieser Testpunkt fordert. Sein Single-Pass-Multitexturing, das bei 3D-Spielen sehr wichtig ist, kann professionelle OpenGL-Hardware ebenfalls nicht bieten -- auch SGIs Cobalt Grafikchip nicht. Bei größeren Modellen (AWadvs) kommt TNT-2 jedoch ins Hintertreffen, da hier die Geometrie-Funktion der SGI-Grafik zum Tragen kommt, oder der Multithreaded-Treiber von Diamonds FireGL1 effektiv ein Dual-Prozessor-System auslasten kann.

Einen ausführlichen Vergleichstest von OpenGL-Karten (Diamond, Elsa, 3Dlabs, AccelGraphics) auf verschiedenen Plattformen mit ein oder zwei Pentium-II- und Pentium-III-CPUs im Vergleich mit SGIs Visual Workstation bringt c't in Ausgabe 9/99 (Erstverkaufstag: 26.4.99). (Manfred Bertuch, c't)

Vorläufige Viewperf- und Indy3D-Messungen von OpenGL-Hardware
Grafikhardware Wildcat 4000 Cobalt Grafik Chipsatz 3, 4 FireGL 1 TNT-2 125/150 MHz 5
Hersteller Intergraph Silicon Graphics Diamond nVidia
Testplattform Dual PIII-Xeon 550 Visual Workstation 320, Dual PII-450 Dual PIII-500 PIII-500
ViewPerf 6.1 1
AWadvs-02 24,7 (30,8) 24 11,2
ProCDRS-01 18,2 20
DX-04 21,4 (23,8) 13
DRV-05 6,4
Light-02 1,86 1,78 1,37
Indy3D 2
Simulation 14,3 29,8 15 41,4
Animation 12,9 15,8 (17,7) 11 11
MCAD 40 27,8 14,2 (16,8)
MCAD 150 9,4 4,2
Preis ab 17.000 DM (Systempreis für PII-450) ab 8000 DM (Systempreis) 1.800 DM 400 DM
Alle Messungen durchgeführt mit 24 Bit Farbtiefe und 24 Bit Z-Buffer.
Große Werte sind besser (fps)
1 Single-Prozessor-Kompilation
2 Auflösung 1024 x 768
3 Wait-for-Vsync und Double Buffer ausgeschaltet
4 Werte in Klammern gelten für ein Dual-PIII-500-System nach Angaben von SGI
5 mangels NT-4.0-Treiber unter Widows98 ermittelt, Standard-Treiber ohne SSE-Optimierung
Anzeige