Mr. „T“ auf neuen Pfaden

Im letzten Jahr führte Intels Cheftechnologe Pat Gelsinger seinen Chef und passionierten Angler Craig Barrett als Mr. Fish ’n Chips ein, jetzt als Mr. „T“, wegen der zahlreichen „T“echnologien, die Intel in petto hat, darunter jetzt auch die CT, die Clackamas-Technologie, wie Intel vornehm die AMD64-Erweiterung umschreibt.

In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen
Lesezeit: 11 Min.
Von
  • Andreas Stiller
Inhaltsverzeichnis

Barrett eröffnete das Forum nun wohl zum letzten Mal als Hausherr (CEO), Ende des Jahres soll dann Paul Otellini seinen Job übernehmen. Wieder waren 5000 Teilnehmer und etwa 500 Journalisten nach San Francisco angereist, um seinen Worten und vor allem den Worten der Referenten zu lauschen, die in etwa 130 Sessions in 14 Tracks über neue Technologien, Design-Guides und Initiativen berichteten. Angereist war aber auch die Konkurrenz AMD, die ihren Erfolg auskosten wollte, dass Intel jetzt ihren 64-Bit-Pfaden folgt. Rund um das Moscone-Tagungszentrum baute sie Stände auf, um hier Glückskekse und T-Shirts mit „Welcome to the World of AMD64“ zu verteilen. Hartgesottene AMD-Marketingmanager tauchten gar im Schutze schottischer Journalisten auf der Intel-Party am Vorabend auf. Dass AMD das IDF „missbraucht“, um parallel dazu in einer nahe gelegenen Hotel-Suite über eigene Produkte und Roadmaps zu berichten, gehört ja nun schon zur IDF-Tradition. Nun erdreistete sich der in Sunnyvale beheimatete Nachbar aber sogar, parallel dazu mit Partys aufzuwarten und zusammen mit VIA und IDF-Gold-Sponsor Nvidia zu Gegenveranstaltungen einzuladen.

Andererseits ist es ja schön zu sehen, dass sich solch große Konzerne zuweilen wie kleine Kinder verhalten: Intel etwa wollte vergangenen Herbst mit dem Pentium 4 Extreme Edition AMD unbedingt die Athlon64-Premiere vermiesen, AMD „rächte“ sich jetzt mit den erwähnten Nadelstichen und begrüßte den Neuling im AMD64-Lager auch mit einer ganzseitigen Anzeige (wie seinerzeit Apple den IBM PC) im San Francisco Chronicle. Selbst seriöse Firmen wie IBM nehmen manchmal an solchen Spielchen teil: Dass die TPC-Rekordwerte der IBM-Regatta mit 1,9-GHz-Power4+-Prozessoren just am Eröffnungstag des IDF veröffentlicht wurden, ist wohl kaum Zufall.

Mike Fister, Intels unkonventioneller Server-Guy, nahm den Fehde-Handschuh auf und versprach, dass bald wieder Itanium an der für die Business-Welt so ungemein wichtigen TPC-Spitze stehe. Denn auch nach der Einführung der von AMD übernommenen 64-Bit-Erweiterung baut Intel den Itanium-Pfad unbeirrt aus. Und die „echten“ 64-Bitter sollen nicht nur mit spezifischen Server-Eigenschaften punkten, sondern auch in der Performance den Desktop-Kollegen zeigen, wo es lang geht. Es wird wohl noch ein, zwei Generationen dauern, aber dann soll ein Itanium-System bei gleichem Preis locker die doppelte Performance liefern wie ein dann aktuelles Xeon-32/64-Bit-System.

Ein Trick, um die Performance der nächsten Itaniums bedarfsabhängig zu vergrößern, nennt sich Foxton. De facto ist es eine von Intel legitimierte Overclock-Fähigkeit für Enterprise-Systeme, die mit einer Fülle von im Prozessor integrierten Thermo-Sensoren abgesichert wird; Ähnliches hat IBM für den Power5 auch vorgesehen. Mehr noch als zusätzliche Performance sollen aber Sicherheitsfaktoren den neuen Itanium-Prozessor für Server attraktiver machen. Dazu gehört eine Cache-Schutztechnik namens Pellston: Treten gehäuft Fehler innerhalb einer Cacheline des L3-Cache auf, so wird diese einfach im Betrieb abgeschaltet und aus der Verwaltung herausgenommen, ähnlich wie defekte Sektoren auf der Festplatte als „Bad Sector“ markiert und ausgeblendet werden.

In der zweiten Jahreshälfte 2004 will Intel neben dem „dicken“ Madison mit 8 MByte L3-Cache und 1,7 GHz Takt kleinere und stromsparendere Versionen anbieten: den Fanwood mit 3 MByte Cache und 1,6 GHz beziehungsweise als ULV mit 1,2 GHz Takt. Im nächsten Jahr steht mit dem Montecito der Umstieg auf 90-nm-Technologie an, mit zwei Prozessorkernen. Ein jeder davon arbeitet mit Simultaneous Multithreading SMT. Gleich 24 MByte L3-Cache stehen den beiden Kernen zur Verfügung. Die kleineren, sparsameren Montecito-Brüder als Nachfolger von Fanwood heißen Millington. Es blieb Pat Gelsinger vorbehalten, am Schlusstag schon mal einen Prototyp des Montecito vorzuführen - ohne ihn jedoch als solchen zu outen (mehr dazu im Artikel S. 124 in c't 6/2004).

Geradezu massiv parallel wird es mit der darauf folgenden Itanium-Version, die vom ehemaligen Alpha-Design-Team in Massachusetts entwickelt wird: Tukwilla wird vermutlich gleich mit 16 Kernen aufwarten und mit einem integrierten Speichercontroller. Die kleine DP-Version geht als Dimona ins Rennen. Mit Tukwilla folgt Intel also abermals AMDs Pfaden, diesmal bezüglich integriertem Speichercontroller. Andererseits übernimmt AMD auch wieder was von Intel, nämlich die SSE3-Erweiterung des Pentium-4E-Prescott-Prozessors. Das hat AMD-Entwicklungsleiter Kevin McGrath kürzlich erst offiziell bestätigt.

Im Desktop-Bereich, wo der stromschluckende Prescott bislang noch nicht so überzeugen konnte, verlagert Intel den Wettbewerb erst einmal mit der „größten Board-Innovation seit 10 Jahren“ auf das Drumherum: neuer Speicherstandard, neues Bus-System, neues Audioverfahren - mit Dolby als Partner - neue Sockeltechnik und vieles mehr und alles auf einmal. Das wird zur CeBIT beziehungsweise kurz danach spannend werden. Die Intel-Chipsätze Grantsdale (i915P/G/GV) und der etwas schnellere Alderwood (i925X) können sowohl mit DDR als auch mit DDR2 umgehen, in einem Board allerdings nur entweder oder. Da DDR2 zurzeit noch etwa 80 Prozent teurer ist, kann man sich ausrechnen, wo zunächst der Run stattfinden wird.

Die neuen Boards bieten für Grafikkarten einen PCI-Express-x16-Slot, der auch nicht kleiner ist als der AGP-Slot jetzt. Demgegenüber ist der für sonstige Erweiterungen vorgesehene PCI Express x1 ähnlich wie etwa Serial ATA hübsch niedlich anzusehen. Zunächst sind die Boards aber mangels Peripherie meist nur mit ein oder zwei dieser Anschlüsse nebst Standard-PCI ausgestattet (die Chipsätze unterstützen derer bis zu vier).

ATI und Nvidia haben jedoch für den langen PCIe-Slot den passenden Füllstoff in Form diverser PCI-Express-Grafikkarten fertig (Intel selbst bietet die passende Extreme Grafik 3 ja nur onboard).

Während ATI den neuen I/O-Standard nativ direkt am Grafikchip als „true PCI Express“ unterstützt, setzt Nvidia auf einen Brückenchip namens High-Speed-Interconnect (HSI) zwischen AGP und PCIe. Das mag auf den ersten Blick als Nachteil erscheinen, ist es aber nicht unbedingt: Dann nämlich, wenn Nvidias Behauptung stimmt, dass die Brücke allenfalls zwei Prozent an Performance kostet. Nvidas Trick bei der Sache ist ein spezieller AGP-16X-Modus, zwischen Grafik-Chip und Brücke, der anders als ATI suggeriert („schafft nur AGP-Performance“) die volle PCI Express-Bandbreite von netto 4 GByte/s ausreizen kann.

Der Vorteil einer Brücke liegt für die Übergangszeit auf der Hand: Nvidia kann AGP- und PCIe-Märkte mit den gleichen Grafikchips bedienen und auch anders herum eröffnet HSI interessante Optionen, nämlich „True-PCIe-Grafikchips“ den Zugang zu alten AGP-Slots zu vermitteln - das dürfte noch einige Jahre für eine große Kundschaft attraktiv sein. Mal sehen, vielleicht vermarktet Nvidia den Brückenchip auch an andere Grafik-Hersteller. Und die einschlägigen Online-Spatzen zwitschern es von allen Web-Dächern: Zur CeBIT wolle Nvidia neben den neuen PCIe-Karten (siehe Pixel-Express S. 44) auch die NV40-Engine vorstellen, mit 16 parallelen Pipelines, Dirext9-Shader 3.0 und, und, und ...

Der PCI Express ist aber nicht nur für schnelle Punkt-zu-Punkt-Verbindungen vorgesehen, er lässt sich auch zu einem Verbindungsgeflecht (Fabric) ausbauen, gut geeignet etwa für Backplanes. Stichwort hier ist „Advanced Switching“ AS. Erst vor ein paar Wochen wurde die Spezifikation für AS endgültig verabschiedet, und schon hat Xilinx einen Chip dafür fertig, welchen Intels Communication Manager Sean Maloney als Erster vorführen durfte.

Auf der Suche, womit man die Milliarden von Transistoren zukünftiger Generationen vernünftig beschäftigen kann, begab sich Intel-Ethnologin Dr. Bell auf die Reise durch verschiedene Kulturkreise dieser Welt, um bei den Eingeborenen vor Ort - unter anderem in München - deren Bedürfnisse auszuloten. Pat Gelsinger machte sich indes auf eine andere Reise in die „Era of Tera“. Seine Mitarbeiter machten sich die Mühe, riesige Datenmengen präzise abzuschätzen, etwa 1666 TByte für alle weltweiten Druckwerke im Jahre 2003 oder 420 Petabyte für Filme. Auf genau 4 999 230 TByte oder rund 5 EByte (Exabyte) soll Ende 2003 der auf magnetischen Datenträgern befindliche Bestand aufgelaufen sein. Die Präfixe für die nächst größeren Tausender-Potenzen sind auch schon definiert: Zettabyte (ZByte) für 1024 und Yottabyte (YByte) für 1027. Für 1030 schlägt Gelsinger nun Barrettbyte (BByte) vor. Ich geh derweil schon mal deutlich weiter und reklamiere Adamsbyte (AByte) für 1042 ...

Das Durchforsten, Analysieren und Verarbeiten (anglistisch RMS genannt: Recognition, Mining, Synthesis) von Riesendatenbeständen ist eine Herausforderung, die heutige Rechnergenerationen massiv überfordert. Das ist derzeit nur, wenn überhaupt, mit großen und teuren Supercomputern und Clustern zu bewerkstelligen. Ähnlich sieht es mit rechenintensiven Aufgabenstellungen aus. Und zur Demonstration kam Gelsinger ein Gast aus Deutschland zu Hilfe: Prof. Dr. Philipp Slusallek von der Universität des Saarlandes und Mitarbeiter bei der inTrace GmbH. Echtzeit-Raytracing heißt hier die Herausforderung, die zum einen optimierte Algorithmen (mit openRT, 30-mal schneller als POV-Ray) benötigt und dennoch ein Riesen-Rack von 32-Dual-Xeon-Boards beschäftigt. 64 Xeons - das sind (ohne L3-Cache) etwa drei Milliarden Transistoren - doch es dauert nicht mehr lange, bis wir die in einem Chip auf dem Schreibtisch haben.

Aber vielleicht braucht man hierfür nicht einmal solche Transistormassen, kleine Spezialchips, etwa mit rekonfigurierbarer Hardware, können hier Enormes bewirken - die Saarländer basteln bereits daran. Gelsinger sieht das Potenzial für rekonfigurierbare Logik auch - und stolz konnte er mit Intels erstem Chip auf diesem Gebiet aufwarten: einem rekonfigurierbaren Kommunikationsprozessor, der nach Bedarf auf 802.11a, 802.11b, 802.11g, GPRS, EDGE oder Wideband-CDMA einzustellen ist. Vor allem interessant für mobile Anwendungen: Der Rekonfigurierbare soll nur halb so viel verbrauchen und ein Viertel so groß sein wie bisherige WLAN-Chips.

Und zu guter Letzt bekam Pat Gelsinger auch die ihm zustehende Flasche Wein (Rheinhessischer Riesling) als Wettgewinn, denn Intel hatte 2003 weit mehr Patente als AMD zugesprochen bekommen - nach drei verlustreichen Jahren, wo AMD in dieser Disziplin vorne lag. Eine neue Wette läuft und sie hat auch was mit Intel und AMD zu tun - aber was, das verrate ich erst im nächsten Jahr. (as) (as)