Prozessorgeflüster

Von Memristoren und anderen Kannibalen

Trends & News | Prozessorgeflüster

Die Back-to-School-Saison startet mit vielen neuen Prozessoren, wiewohl IBMs große Serverchips eher weniger mit dem Schulanfang zu tun haben dürften. Daneben gibts auch ein paar Verzögerungen – bei AMDs Steamroller vielleicht, bei HPs Memristor bestimmt.

Nun sind sie draußen: Intels neue Atom-Prozessoren Z2670 für Tablets mit der Clover-Trail-Plattform (S. 33) samt Cloverview-2-Prozessor, AMDs Trinity-APUs für Desktop-PCs (S. 98) sowie im High-End-Bereich IBMs Power7+. So richtig draußen ist Intels Z2670 allerdings nicht – als reines OEM-Produkt bleibt er fürs normale Publikum weitgehend eine Black Box: keine Auflistung in der Intel-Datenbank, keine Datenblätter, keine Specification Updates, nichts Genaues über das Innenleben, nix über TDP, Transistorzahl, Die-Größe und so weiter. Okay, letztere wird die Firma Chipworks sicherlich bald durch Aufsägen des Chips vermessen, so wie sie es schon beim Vorgänger Atom Z2460 (Medfield-Plattform mit Penwell-1-Prozessor) getan hat, der sich demnach auf eine bescheidene Fläche von 63,4 mm2 ausdehnt.

Die kanadische Firma Chipworks, die sich auf Reverse Engineering sowie die Untersuchung auf mögliche Urheberrechtsverletzungen in Chips spezialisiert hat, hat unlängst auch eine Tochterfirma in Europa eröffnet – also wenn irgendwer mal einen Chip zersägt und analysiert haben möchte … Zuvor war sie emsig mit dem iPhone-5-Prozessor A6 beschäftigt. Nun wissen wir definitiv, dass er von Samsung gefertigt wird, zwei CPU- und drei Power-VR-GPU-Kerne besitzt und dass der gesamte Chip 97 mm2 groß ist – also etwa so groß wie ein mobiler Ivy-Bridge M2 mit zwei Kernen. Laut Chipworks belegt der reine ARM-Kern mit 15,8 mm2 etwa 50 Prozent mehr Platz als derjenige des Vorgängers A5, und das, obwohl der fürs iPhone 4 noch in dem gröberen 45-nm-Prozess gefertigt wurde. Das ergäbe übern Daumen die dreifache Transistormenge für den neuen Kern – irgendwoher muss die doppelte Performance ja auch kommen. Chipworks’ Analyse hat zudem ergeben, dass Apple, anders als bei den Chips zuvor, das Layout der ARM-Kerne offenbar nicht allein irgendwelchen Tools von Cadence und Co. überlassen, sondern von Hand „getunt“ hat.

Eigengewächs

Es handelt sich beim A6 also weder um einen von ARM vorgegebenen Cortex A9 noch um einen Cortex A15, sondern um einen eigenen Apple-Chip, eine hauseigene Weiterentwicklung mit ARMv7s-Architektur, irgendwo auf halbem Wege zwischen den beiden ARM-Designs. Das angehängte „s“ ist wichtig, denn das steht für die Vector Floating Point Unit Version 4 (VFPv4), die Fused Multiply-Add und Float16 beherrscht. Immerhin bescheinigt GeekBench dem iPhone 5 wohl dank VFPv4 fast die dreifache Gleitkomma-Performance gegenüber dem Vorgänger. Im Moment ist nur noch nicht klar, ob die Gleitkommaeinheit mit einfacher oder (vermutlich) doppelter Genauigkeit arbeitet und mit 16 oder bereits mit 32 Registern.

AMDs Trinity muss man nicht aufsägen: Er wird von Globalfoundries in Dresden im 32-nm-HKMG-SOI-Prozess gefertigt und ist als Vierkerner mit 246 mm2 mehr als doppelt so groß wie Apples A6. Rätselraten gabs eher um die Zukunft seines Sockels und wie das überhaupt mit der APU-Roadmap weitergeht. Von PCIe 3.0 ist jedenfalls nichts zu sehen und der im Frühjahr noch für 2013 vorgesehene Nachfolger Kaveri mit zwei bis vier Streamroller-Kernen und HSA Application Support scheint erst einmal untergetaucht zu sein. Es sieht so aus, als ob Richland, auch Trinity 2.0 genannt, mit auf 28-nm-Technik verkleinerten Piledriver-Kernen dazwischengeschoben wird.

Die richtig großen Chips stammen jedoch aus dem Hause IBM. Schon Ende August kam der zNext-Prozessor für Mainframes heraus, mit einem Rekordtakt von bis zu 5,5 GHz . Nun folgten die Updates der beiden P-Systeme P770 und P780 mit dem Power 7+, der bei vier und sechs Kernen einen Takt von bis zu 4,2 GHz und bis zu 3,8 GHz bei acht Kernen erreicht. Jeder Prozessor bietet zusätzlich Vierfach-SMT – wenn das nicht reicht, kann man auf ein Dual-Chip-Modul mit 16 Kernen zurückgreifen. Etwa 40 Prozent schneller bei SPECint_rate2006 als der Vorgänger soll der Prozessor im Single-Modul bei 8 Kernen sein. Bis zu 64 Kerne können in der P770 und 128 Kerne in der P780 mitarbeiten. Nur PCIe 3.0 hat IBM seinen Systemen noch nicht gegönnt.

Fremdeinwirkung

Nein, nicht etwa, weil es technische Probleme gäbe, sondern weil HPs Herstellungspartner SK Hynix sonst sein eigenes Flash-Business kannibalisieren würde, daher sollen die für Mitte 2013 versprochenen Memristoren jetzt erst gegen Ende 2014 erscheinen. Das gab Memristor-Erfinder und HP-Fellow Stan Williams auf einem Round Table der Kavli Foundation eher beiläufig bekannt. Immer wieder haben in den letzten Jahren Wissenschaftler bezweifelt, dass HPs Memristoren überhaupt wie angegeben funktionieren können und die Kleinkarierten beanstandeten, dass diese ohnehin keine echten Zweipol-Elemente wie Kondensatoren, Spulen oder Widerstände seien. Wenn sie funktionieren, ist mir die wissenschaftliche Einstufung egal, so konterte Williams jovial.

Nun gibt es neue Gründe, warum HP und Hynix sich so langsam sputen müssen, denn sonst schnappen ihnen andere die neue Speichertechnologie weg. So meldeten Forscher der Oregon State University einen Durchbruch, Memristoren mit billigem Zink-Zinn-Oxid hergestellt zu haben – wogegen HP/Hynix auf weitaus teureres Titaniumdioxid setzen.

Auf der erwähnten Tagung der Kavli Foundation, die unter dem Motto stand: „How Atomic Scale Devices Are Transforming Electronics“, berichtete auch Prof. Michelle Simmons vom Australian Centre of Excellence for Quantum Computation and Communication Technology an der University of New South Wales über Fortschritte, die Position einzelner Atome mit einem Rasterkraftmikroskop zu verändern und sie als Speicher zu benutzen; Stichwort: single-dopant Transistors. Kollegen von der gleichen Universität machten gleichzeitig weltweit mit einem Artikel in Nature auf sich aufmerksam, hatten sie es doch erstmalig geschafft, bei einem solchen single-dopant Transistor – ein Phosphoratom in hochreinem Silizium – gezielt einen Spin zu setzen und wieder zu lesen. Damit hat man ein Quantenbit (Qubit), das sich von den normalen Bits durch die merkwürdige Eigenschaft unterscheidet, nicht nur 0 oder 1 sein zu können, sondern auch beides gleichzeitig beziehungsweise eine Überlagerung beider Zustände. Was jetzt aber noch fehlt, ist eine quantenmechanische Verschränkung möglichst vieler solcher Qubits, um daraus einen Quantencomputer in herkömmlicher Siliziumtechnologie fertigen zu können. Das könnte vielleicht ganz schnell gehen und wäre dann quasi ein Quantensprung beim Quantencomputing. (as)

Artikel kostenlos herunterladen

Kommentare

Infos zum Artikel

Kapitel
  1. Eigengewächs
  2. Fremdeinwirkung
1Kommentare
Kommentare lesen (1 Beitrag)
  1. Avatar
Anzeige

Anzeige

Anzeige