Viereinhalb Jahre hat die nur einen Steinwurf von Intels Headquarter entfernt residierende kalifornische Firma Transmeta an ihrem geheimnisvollen ‘Morphing Prozessor’ Crusoe gewerkelt. Nun ist die Katze aus dem Sack, Crusoe betritt als Mobile Internet Processor das Rampenlicht.
Zielmarkt für Transmeta ist, wie schon vorher durchdrang, nicht der Desktop-Bereich, sondern allein das Mobilsegment, also Notebooks, Web-Pads und PDAs. Schwerpunkt bildet dabei eine preiswerte und dennoch leistungsfähige Internet-Einbindung (Browser, Plugins et cetera), wobei die volle x86-Kompatibilität eine wesentliche Voraussetzung ist. Konkurrierende Designs wie Mobile Pentium II oder K6-2 verbrauchen laut Transmeta viel zu viel Strom, andere fristen als Windows-CE-, Java- oder Palm-Rechner Internet-mäßig ein Inseldasein, da sie mit den verbreiteten Plugins nicht viel anfangen können. Mit Crusoe will Transmeta weg von solchen Inseln.
Crusoe ist nicht nur ein einzelner Prozessor, sondern der Name einer ganzen Familie, die nach dem gleichen Prinzip arbeitet, aber mit unterschiedlichen Eigenschaften ausgestattet ist (hätte man vielleicht lieber familienbezogen Kelly statt Crusoe nennen sollen). Zwei Vertreter der Crusoe-Family stellte Transmeta vor, den TM3120 mit maximal 400 MHz Takt für PDAs und Web-Pads sowie den leistungsfähigeren TM5400 für den Notebook-Bereich.
Das Besondere an den Crusoes ist, dass sie nur etwa zu einem Viertel in Hardware und zu drei Vierteln in Software ausgelegt sind. Wie das im Einzelnen geschieht, hatte c't schon - wie sich jetzt zeigte, völlig korrekt - aus den veröffentlichten Transmeta-Patenten geschlossen [[#lit1 1]]. Das zu Grunde liegende so genannte Code-Morphing-Verfahren setzt komplexe x86-Befehle in einfachere Befehle (Atome) um, die von einem ebenfalls einfachen, aber dafür schnellen 128-Bit-VLIW-Prozessor - zwei- oder vierfach zu Molekülen verbunden - parallel ausgeführt werden. So verschieden ist das von der Arbeitsweise moderner Prozessoren allerdings nicht. Auch bei K6, Athlon und Pentium II/III findet zur Laufzeit im Prozessor eine Übersetzung des x86-Codes in einfache RISC-Befehle statt, die µops, Rops oder QuadOps heißen. Ein K6 -III etwa (dem dank [[#lit2 2]] bestdokumentierten Prozessor) kann neben einem Sprung drei oder vier solcher QuadOps gleichzeitig behandeln, was bei 38 Bit pro QuadOp schon einer 152-bittigen VLIW-Struktur entspräche.
Und auch die spekulative Ausführung von Befehlen ist modernen Prozessoren durchaus nicht unbekannt, bei Crusoe ist dieses wichtige Feature allerdings sehr ausgeprägt. Hierbei hilft seine Hardware entscheidend mit, denn sie bietet zu jedem der 64 Allzweck- und 32 FPU-Registern ein so genanntes Schattenregister.
Alle spekulativ ausgeführten Befehle wirken zunächst nur auf die Schattenregister. Wenn sich die Spekulationen als wahr erweisen, sorgt ein Commit-Befehl dafür, dass die Werte in die offiziellen Target-Register übertragen werden. Der Commit-Befehl wird dabei parallel zu den VLIW-Befehlen quasi ohne bemerkbaren Zeitverlust im Hintergrund ausgeführt. Dabei kann Crusoe aufeinander folgende x86-Befehle auch bündeln und - das unterscheidet ihn doch stark von den bestehenden Hardware-Konzepten - dynamisch optimieren - ähnlich wie ein sehr moderner Mehr-Pass-Compiler.
Statt starrer Verdrahtung oder wenig flexiblem Microcode vermag die Code Morphing Software (CMS) deutlich mehr, schließlich ist sie nicht nur wie übliche Microcodes wenige KByte groß, sondern etwa 2 MByte mächtig. So kann sie zur Laufzeit häufig benutzte Sequenzen erkennen und diese Stufe um Stufe optimieren. Manch komplexe x86-Routine mit beispielsweise zehn Befehlen vermag CMS nach mehreren Optimierungsstufen auf nur vier VLIW-‘Moleküle’ zu reduzieren.
Anders als reine Softwarekonzepte wie FX32! kann Crusoe derzeit noch nicht bereits gelernte Optimierungen einer Applikation in einer Datei abspeichern und später darauf aufbauen. Auch Eingriffe des Benutzers zur Auswahl von Optimierungsstrategien sind nicht vorgesehen.
Der von CMS benötigte Speicherbedarf ist allerdings riesig - eine Achillesferse des barfußlaufenden Crusoe-Prozessors. Zwar passt CMS in ein 512 KByte Flash, das beim Booten dann in den Hauptspeicher auf 2 MByte expandiert wird. Hinzu kommt aber noch der Zwischenspeicher für übersetzte Sequenzen (Translation Cache) von 6 bis 14 MByte (von den OEMs konfigurierbar), sodass diese bis zu 16 MByte dann dem x86-Klienten entzogen sind. Für die übersetzten x86-Befehle verbraucht CMS rund sechsmal mehr Speicher und bläht so sowohl Speicherbedarf als auch die benötigte Speicherbandbreite reichlich auf. Letzteres ist relevant für die Performance, denn hier entsteht ein neuer Flaschenhals, den die anderen Prozessoren nicht kennen, da sie das ‘Aufblähen’ des Codes zur Laufzeit nur im Prozessorkern selbst vornehmen.
Damit Crusoe nicht performancemäßig zu stark einbricht, benötigt er große Caches und zusätzlich lokalen Speicher im Kern. Transmeta hat ihn dazu mit insgesamt 96 KByte (TM3120) oder 384 KByte (TM5400) Cache versorgt, zu denen sich 8 KByte Local Data Memory (LDM) und 8 KByte Local Programm Memory (LPM) gesellen. LPM kann man sich quasi als einen ladbaren und zur Laufzeit änderbaren Microcode vorstellen - ein klein bisschen wie rekonfigurierbare Hardware. Ob ein Speicherbereich (genauer eine 4-KByte-Page) zumindest zum Teil bereits übersetzt vorliegt, merkt sich Crusoe in zusätzlichen T-Bits des Translation Lookaside Buffers (TLB), der ansonsten wie ein normaler x86-TLB aufgebaut ist. Mit großen 4 MByte-Pages (die NT 4 unterstützt) würde so ein T-Bit allerdings wenig Sinn machen, wahrscheinlich simuliert Crusoe daher die Big Pages in Software.
Hätte Transmetas Chipschmiede IBM den Crusoe-Chips ihre neueste Embedded DRAM Technologie zur Verfügung gestellt, wäre es vielleicht sogar möglich gewesen, die benötigten 16 MByte Speicher mit auf den Chip zu integrieren. Dann wäre der Prozessor nach außen ein ganz normaler x86er, das ganze Code Morphing fände im Inneren statt, Bandbreitenprobleme auf dem Speicherbus gäb es dann nicht - doch wer weiß, vielleicht kommt das noch.
Einen anderen fürs Speichermanagement benötigten Bestandteil, der normalerweise extern in x86-Designs zu finden ist (Ausnahme Cyrix MediaGX) haben die Crusoe-Prozessoren jedoch bereits integriert: die North Bridge. Dieser Baustein enthält Speicher- und PCI-Controller sowie die Ansteuerungslogik für ein serielles EPROM. TM3120 unterstützt PC133 und TM5400 zusätzlich DDR-SDRAM PC266. Der TM5400 besitzt gleich zwei 64-bittige Speicher-Interfaces, sodass er dem erwähnten Bandbreitenproblem durch ein zusätzliches 16 MByte PC266-Modul bequem aus dem Weg gehen kann.
Der VLIW-Prozessor kann maximal vier Operationen pro Takt ausführen, wozu ihm aber nur fünf Einheiten zur Verfügung stehen (Pentium III hat zwar mehr Einheiten, kann aber auch nur fünf davon gleichzeitig ansprechen, der Athlon bietet hingegen alle seine neun Einheiten gleichzeitig und uneingeschränkt an). Insbesondere dürfte FPU/MMX mit nur einer gemeinsamen Unit reichlich schwach dimensioniert sein, die Intel/AMD/Cyrix-Konkurrenz weist beispielsweise 2 MMX-Units auf. ISSE (oder 3Dnow!) unterstützt Crusoe gar nicht. Einige Bestandteile des Prozessors sind noch nicht weiter spezifiziert, darunter die Sprungvorhersage oder die so genannte Alias-Hardware.
Mit der LongRun-Technologie ist Transmeta der Konkurrenz einen großen Stepp voraus. Während Intel mit Speedstep bislang kein großer Sprung, sondern nur ein kleiner Hopser nach vorn gelungen ist (zwei mäßig verschiedene Taktraten und Kernspannungen per Hand oder bei Umschaltung zwischen Batterie- und Netzbetrieb), beherrscht LongRun eine dynamische Takt- und Spannungsumschaltung mit einem großen Hubbereich. Je nach aktueller Auslastung des Prozessors fährt er automatisch den Takt von 700 MHz bis auf 200 MHz herunter und reduziert dabei die Spannung von 1,65 V auf 1,1 V. Und da sich die Leistungsaufnahme ~ f · v2 verhält, benötigt er beim ‘Dösen’ nur 13 Prozent Leistung des Volllastbetriebs. So verbraucht auch der 700-MHz- TM5400 im Schnitt nur etwa 1 W und wird auch bei Stress nur handwarm. Lüfter sind daher für Crusoe völlig unnötige Lärmmacher. Beispielsweise bewältigt der TM5400 das Abspielen eines DVD-Videos bei 41 % Volllast (1,8 W) und erwärmt sich dabei gerade mal auf 48,2 °C, ein Pentium III überheizt sich bei der gleichen Aufgabe ohne Lüfter auf 105,5 °C.
Die LongRun-Technik ist auf den TM5400 beschränkt, beide Crusoes bieten jedoch das normale Powermanagement, wie die x86-Prozessoren auch.
Als weiteres Bonbon für kleine Harddisk-lose PDAs und PADs wartet Transmeta auch gleich mit einem interessanten, leistungsfähigen Betriebssystem als Konkurrenz zu Windows CE und anderen auf: Mobile Linux. Hier hatte natürlich Transmeta-Mitarbeiter und Linux-Mentor Linus Torvalds seine Hand mit im Spiel. Mobile Linux passt in eine Flash-Karte von 32 MByte und soll optimal die Powermanagement- und LongRun-Möglichkeiten des Prozessors ausnutzen.
Während das Hardware-Design der ersten beiden Crusoe-Prozessoren festgezurrt ist, arbeitet die Code-Morphing-Gilde rund um Torvalds (ja, der macht eben nicht nur Linux) noch mit Hochdruck an der Verbesserung der CMS. Jede Menge Debug-Code muss noch raus, diverse Optimierungen sind noch möglich, bevor man mit echten Benchmark-Ergebnissen herausrücken will - außerdem ist der TM5400 mit 700 MHz offenbar noch im frühen Prototyp-Stadium. Etwa 10 bis 20 Prozent erhoffen die Optimierer, noch herauszukitzeln, bis die ersten Crusoe-Systeme etwa im Sommer - von wem auch immer - auf den Markt kommen (Updates sollen jederzeit per Internet möglich sein).
Und so blieben alle Aussagen zur Performance sehr unkonkret. Generell soll, so eine dieser Aussagen, der TM 5400 mit 667 MHz etwa das Niveau eines Pentium-III-500 erreichen. Die Benchmarkergebnisse hängen zum großen Teil davon ab, wie gut die CMS-Optimierung greift. Je nachdem, ob eine Software aus kleinen oder großen Schleifen besteht, ob Routinen oft oder selten aufgerufen werden, schwankt das Ergebnis zwischen ‘grottenschlecht’ und ‘superschnell’.
Um überhaupt mit etwas ‘Benchmarkartigem’ aufwarten zu können, erfand Transmetas Marketing-Abteilung auf die Schnelle eigene ‘Mobile Benchmarks’, die den Stromverbrauch eines Notebooks für die Ausführung mit in das Ergebnis einbeziehen. So lange man aber nicht die absoluten Werte mit veröffentlicht, bleibt solch ein Benchmark reine Makulatur, zumal sich Transmeta mit dem Pentium III statt dem Pentium III Mobile sowieso den falschen Gegner herausgesucht hat. So etwas nährt natürlich die Gerüchteküche, der zufolge schon im letzten Frühjahr IBM wegen zu schlapper Performance von einem eigenen Einstieg abgesehen hat. Auch von Fujitsu als möglichem OEM wird eine ähnliche Enttäuschung vermeldet.
Zeit also für Transmeta, klare Fakten zu schaffen - oder uns ein Testsystem zu schicken. Und niemand erwartet dabei, dass ein kleines Web-Pad unbedingt Coppermine-800-Niveau haben muss, jedenfalls nicht in diesem Jahr ...
[1] Andreas Stiller, Robinsons Patente, c't 25/99, S. 26
[2] B. Shriver, B. Smith, The Anatomy of a High-Performance Microprocessor, Computer Society, 1998
| Crusoe-Ausführungen | ||
| Prozessor | TM3120 | TM5400 |
| Takt | 266, 366, 400 MHz | 500 ..700 MHz |
| L1-Cache | 64KB I + 32KB D | 64 KB I + 32 KB D |
| L2-Cache | - | 256 KB |
| Local Memory | 8KB D+ 8KB I | 8KB D+ 8KB I |
| TLB | 256 Entries | 256 Entries |
| Prozesstechnik | IBM 7S,0,22 µm | IBM 8S, 0,18 µm |
| Die-Größe | 77 mm2 | 73 mm2 |
| Core-Spannung | 1,5 V | 1,2...1,6V (LongRun) |
| Leistungsaufnahme | 1-3 W | 1 W (bei LongRun) |
| Gehäuse | 474 BGA | 474 BGA |
| Status | Muster und Produktion | Muster, Produktion Mitte 2000 |
| Preise | 333: 65$, 400: 89$ | 500: 119$,700: 329$ |
[#anfang Seitenanfang]
| Leistungshunger | |||
| Betrieb | TM3120 400 MHz | TM5400, 500-700 MHz 1,2-1,6 V |
Pentium III mobile SpeedStep 500 MHz 1,35-1,6 V |
| DVD (Xing) | 2,9 W | 1,8 W | ca. 12/14 W1 |
| MP3 (MMJukebox) | 1,4 W | 1,0 W | ca. 8/10 W1 |
| Auto HALT | 0,9 W | 0,9 W | 1,1/1,7 W |
| Quick Start | 0,4 W | 0,3 W | 0,8/1,3 W |
| Deep Sleep | 0,015 W | 0,03 W | 0,3/0,5 W |
| Off/Instant On | 0 W | 0 W | 0 W |
| Die Speedstep-Werte sind geschätzt für DVD: 80 %, für MP3: 50 % Volllast, inklusive North Bridge (2 W). | |||
[#anfang Seitenanfang]
Nach viereinhalb Jahren Geheimnistuerei lud Transmeta am 19. Januar zur Enthüllung von Crusoe ein - und alle kamen. Nicht nur die Tech-Journalisten, die üblicherweise zu Hardware-Pressekonferenzen gehen, sondern auch die amerikanischen Fernsehsender ABC und CNN schickten Crews und ZDTV übertrug die Veranstaltung sogar live. Das lag zum nicht unwesentlichen Teil daran, dass Transmeta der Arbeitgeber von Linux-Erfinder Linus Torvalds ist, der mittlerweile den gleichen Medien- und Kultstatus genießt wie Apples Steve Jobs. Ein weiterer berühmter Angestellter von Transmeta ist übrigens Dave Taylor, Co-Autor des Ballerspiels Quake.
Die Vielzahl berühmter Namen bei den Mitarbeitern und dem Board of Directors scheint überhaupt eine Stärke von Transmeta zu sein, darunter als Chairman of the Board einer der ganz großen Nestoren der Prozessortechnik: Murray Goldman, der jahrzehntelang für Motorolas Prozessoren verantwortlich zeichnete. Und auch Transmetas Investoren sind in den USA fast jedermann geläufig, neben den Venture-Kapitalisten Paul Allen und George Soros befindet sich darunter übrigens auch die Deutsche Bank.
Nach der Vorstellung der Crusoe-Architektur und einer Quake-Demo (klar, dass hierbei Linus Torvalds gegen Dave Taylor nicht den Hauch einer Chance hatte) kam vor allem eine Frage auf: Wird sich Transmeta gegen die Konkurrenz behaupten können? Auf den ersten Blick scheint Transmeta alle Trümpfe für den Erfolg im Markt für mobile Geräte in der Hand zu halten: Chips mit extrem niedrigem Stromverbrauch, die kompatibel mit allen gängigen Betriebssystemen und Browsern sind und x86-Programme direkt ausführen. Doch ein stromsparender Prozessor alleine ist nicht genug. Das gesamte System mit allen Komponenten (Grafikchip, DVD/CD-ROM-Laufwerk, Display etc.) muss auf niedrigen Stromverbrauch ausgelegt sein - und dies hängt in erster Linie von den OEMs ab.
Doch trotz wiederholter Beteuerungen seitens Transmeta, dass OEMs schon mit den Crusoe-Testchips arbeiten, war offensichtlich keiner der OEMs bereit, einen Prototypen während der Pressekonferenz vorzustellen und damit Transmeta zu unterstützen und mehr Glaubwürdigkeit zu verleihen. Dafür handelte sich die Firma auch reichlich Kritik von der amerikanischen Analysten-Gemeinde ein. Erschwerend kommt hinzu, dass der TM5400-Chip für leichtgewichtige Notebooks erst im Sommer auf den Markt kommt. Bis dahin fließt noch viel Wasser den Notebook-Fluss hinunter. Immerhin hat sich am Tag nach der Pressekonferenz S3 zu Transmeta geoutet und will ein Web-Pad herausbringen.
Der Einfluss von Crusoe auf Intels mobilen Prozessormarkt stand natürlich zur Debatte. Laut Transmeta-CEO Dave Ditzel wird Crusoe richtungsweisend für die Zukunft der Mikroprozessor-Technologie und mobiler Computerplattformen sein, doch er rief nicht im gleichen Atemzug zum Kampf gegen Intel auf. Es ist auch eher unwahrscheinlich, dass Transmeta die Statue des Chipgiganten zum Wackeln bringt, denn die Firma versucht in einen Markt einzudringen, der hauptsächlich von Embedded-Chips wie StrongARM, MIPS und PowerPC beherrscht wird.
Auf der anderen Seite veranstaltete Intel am Tag vor der Crusoe-Vorstellung - welch Überraschung - eine Pressekonferenz über mobile Pentium-III-Prozessoren mit stromsparender SpeedStep-Technologie. Man darf in den kommenden Monaten also auf Intels Reaktion in Sachen Crusoe gespannt sein. Immerhin ist Intel dafür bekannt, aufstrebenden Prozessorherstellern den einen oder anderen Stein in den Weg zu legen. (Sabine Cianciolo)
[#anfang Seitenanfang]
| Transmetas umstrittener Mobile Benchmark | ||
| Pentium III 500 MHz | TM5400 266-533 MHz 1.54V LongRun |
|
| Booting Windows | 10 | 31,2 |
| Windows Desktop Idle | 10 | 62,9 |
| Surfing the Web | 10 | 40,7 |
| Intel Media Benchmark | 10 | 18,3 |
| MP3 playback | 10 | 46,9 |
| DVD playback | 10 | 31,1 |
| In diese ‘Benchmarkwerte’ hat Transmeta die Akkubelastung eines Notebooks bei der Ausführung mit eingerechnet. Größere Werte stehen für ein besseres Performance/Laufzeit-Verhältnis. | ||
Version zum Drucken | Per E-Mail versenden | Heft bestellen
Permalink: http://heise.de/-287486
Das aktuelle Heft ist jetzt im Handel erhältlich.
Ältere Artikel können Sie über unser Zeitschriften-Archiv bestellen.