Trends & News | News

Prozessor mit 256 Kernen

Dass moderne Chipentwicklung nicht großen Konzernen in Übersee vorbehalten ist, beweist zurzeit das französische Start-up Kalray mit einem Many-Core-Prozessor. Dabei stapelt der wenig klangvolle Name MPPA-256 sogar tief: Denn zu den in 16 × 16 VLIW-Kernen organisierten Arbeitspferden des Chips kommen noch einmal rund 20 Cores für Verwaltungsaufgaben. Samt 40 MByte Speicher und Caches sowie diversen Peripherieeinheiten bringt es der mit 28-nm-Strukturen bei TSMC hergestellte Chip auf stolze 2,8 Milliarden Transistoren. Zum Vergleich: Intels aktueller Core i7 hat nur halb so viele, Nvidias größter Grafikchip indes mehr als doppelt so viele.

Bei perfekter Auslastung seiner Rechenwerke schafft der MPPA-256 230 GFlops mit einfacher Genauigkeit; doppelte Genauigkeit ist ebenfalls möglich. Damit liegt er vor einem modernen Quad-Core-Prozessor – etwa von Intel –, aber noch weit unter Grafikkarten, die bereits die TFlops-Marke geknackt haben. Interessanter als die absolute Rechenleistung ist jedoch die dafür benötigte elektrische Leistung. So richtig rückt Kalray damit noch nicht raus, hat in Präsentationen aber schon einmal die Größenordnung von 5 Watt als „Typical Power Consumption“ erwähnt. Sofern diese auch für den Fall gilt, dass alle Kerne unter Volldampf stehen, ergäbe das eine sehr beachtliche Effizienz.

Ohnehin ist die 2008 vom ehemaligen ST-Micro-Chef Joël Monnier gegründete Firma, die bisher rund 25 Millionen Euro in Forschung investiert hat und bereits 2017 100 Millionen Euro Umsatz anstrebt, (noch) recht geizig mit Informationen zu dem neuen Chip. So soll jeder einzelne VLIW-Kern (Very Long Instruction Word) seine 7-stufige Pipeline mit 400 MHz betreiben und eigenen L1-Cache haben. Jeweils 16 Cores sitzen mit einem Verwaltungskern und gemeinsam genutztem Speicher in einem Cluster. 16 solcher Cluster sind in einem Gitter angeordnet und raffiniert zeilen- und spaltenweise miteinander verschaltet. An den vier Rändern des Gitters koordiniert jeweils ein nicht näher bezeichneter, aber vermutlich von ARM stammender Quad-Core-Prozessor die Kommunikation. Dafür steht ihm jeweils ein halbes MByte RAM zur Verfügung, ein 64-bittiges DRAM-Interface sowie I/O-Einheiten teilen sich jeweils zwei dieser Kommunikationsknoten. Mehrere MPPA-Chips kann man über insgesamt vier Interlaken-Schnittstellen mit jeweils bis zu acht Lanes koppeln. Für die Kommunikation mit der Außenwelt stehen 2 × 40-GBit-Ethernet und PCIe 3.0 (2 × 8 Lanes) zur Verfügung.

Sowohl der MMPA-256 als auch die noch für dieses Jahr angekündigten Varianten mit 512 und 1024 Kernen werden in C programmiert. Dafür kombiniert Kalray einen angepassten gcc mit speziellen Bibliotheken für Task- und Datenparallelisierung. Weitere Tools helfen bei der automatischen Zuordnung von Hardware-Ressourcen. Ausgemachtes Ziel von Kalray ist es, die Leistungsfähigkeit von kundenspezifischen Chips (ASICs) mit der Flexibilität gewöhnlicher Multi-Core-Prozessoren zu verbinden. (bbe)

Acht Kerne oder 2,5 GHz fürs Handy

Während die Konkurrenz auf ARMs neue Cortex-A15-Kerne umsteigt oder auf eigene ARM-kompatible Designs setzt, dreht ST-Ericsson im Rennen um den schnellsten Handy-Prozessor an der Taktschraube: So soll der NovaThor L8580 ModAp seine vier Cortex-A9-Kerne mit bis zu 2,5 GHz betreiben. Dazu kommen noch eine PowerVR-SGX544-GPU mit 600 MHz Taktfrequenz und ein integriertes LTE-Modem.

Die hohe Taktfrequenz dürfte den Chip in Benchmarks weit nach vorne bringen, zumal sie mit einer hohen Single-Thread-Performance einhergeht. Allerdings verheizen andere Vierkerner mit Cortex-A9 bereits bei 1,3 bis 1,5 GHz sehr viel Leistung. ST-Ericsson lobt jedoch die Sparsamkeit des NovaThor L8580 und begründet sie zum einen mit dem hauseigenen 28-nm-Fertigungsprozess und FD-SOI-Technik (Fully Depleted Silicon on Insulator). Zum anderen beherrscht jeder Kern – unabhängig von den anderen – zwei Betriebsmodi: einen mit voller Taktfrequenz und einen sehr sparsamen mit auf 0,6 Volt reduzierter Kernspannung, aber noch unbekannter Taktfrequenz.

Einen ganz anderen Ansatz verfolgt Samsung mit dem Exynos 5 Octa. Wie der Name andeutet, hat das System-on-Chip für Tablets und Smartphones tatsächlich acht Kerne, doch dahinter steckt ein Rechentrick: So liefern nach ARMs big.LITTLE-Konzept vier Cortex-A15-Cores den Löwenanteil der Rechenleistung und vier sparsame Cortex-A7-Cores übernehmen, wenn wenig Arbeit anliegt. Gerüchteweise laufen die A15-Cores mit bis zu 1,8 GHz und ihre kleinen Geschwister mit maximal 1,2 GHz. (bbe)

Artikel kostenlos herunterladen

Anzeige
Anzeige