Ein Fächer Schnelles

Nvidias Tesla K20 gegen Intel Xeon Phi und AMD FirePro W9000

Test & Kaufberatung | Test

Wer hat den leistungsfähigsten Rechenbeschleuniger: AMD, Intel oder Nvidia? Diese Frage ist vielschichtig – wir schauten uns die Features der Konkurrenten und ihre Leistung bei einem der wichtigsten Aspekte für das High-Performance Computing an: der Matrixmultiplikation.

Lange angekündigt, heiß erwartet und nun endlich da: Nvidias Super-Rechenkarte Tesla K20 mit der riesigen GK110-GPU (3300 Euro) soll beim Hochleistungsrechnen neue Maßstäbe setzen und AMDs FirePro W9000 (3100 Euro) sowie Intels ab Ende Januar erhältlichen Xeon Phi 5110P (2700 Euro) locker abhängen. Nvidia strotzt vor Selbstbewusstsein – und hat auch guten Grund dazu. Denn die Kalifornier sind Marktführer im Bereich der Hochleistungsrechenkarten und haben dank jahrelanger Bemühungen auch zahlreiche Universitäten und Forschungseinrichtungen auf ihre CUDA-grüne Seite ziehen können. AMD spielt in diesem Markt kaum eine Rolle und Intel will mit seinem Larrabee-Nachfolger Xeon Phi nun David spielen und Nvidia das Leben schwer machen. Auf in die Schlacht der Shader-Kerne, Transistoren und doppeltgenauen Berechnungen!

Von der Tesla K20 gibt es zwei verschiedene Varianten, die Nvidia auf der Supercomputing-Konferenz SC12 Mitte November vorstellte: die K20 und die schnellere K20X. Letztere ist ausschließlich für Server gedacht und nur lüfterlos erhältlich. Nvidia schickte uns daher eine normale K20, die dank ihres aktiven Kühlsystems wunderbar in unsere Intel-Workstation (Asus Z9PE-D8 WS) mit zwei Xeon E5-2690 (jeweils 8 Kerne, 16 Threads und 2,9 bis 3,8 GHz) passt. Zwei sechspolige PCIe-Stromstecker versorgen die Karte mit ausreichend Energie – schlucken darf sie bis zu 225 Watt. Damit die Tesla K20 diese Grenze nicht überschreitet, begrenzt Nvidia die Taktfrequenz des aus 7,1 Milliarden Transistoren bestehenden GK110-Chips auf konservative 706 MHz. Dank der enormen Zahl von 2496 Shader-Rechenkernen reicht das dennoch für eine beeindruckende – theoretische – Rechenleistung: 3,52 Billionen Gleitkommaoperationen pro Sekunde (TFlops) schafft die Tesla K20 bei einfacher Genauigkeit (Single Precision/SP), bei der für die Forschung viel wichtigeren doppelten Präzision (Double Precision/DP) noch ein Drittel davon (1,17 TFlops). Zum Vergleich: Der Vorgänger Tesla C2050 bietet nur 1,028 SP- und 0,514 DP-TFlops. ...

Sie möchten wissen, wie es weitergeht?

Als c't-Plus-Abonnent gratis lesen

Anmelden als c't-Plus-Abonnent

Anzeige
Anzeige