
Huang Ren-hung kündigte auf der CES an, dass der „ChatGPT-Moment’ der Physical AI bald kommt". Nvidia veröffentlichte die Vera Rubin-Plattform mit 5-facher Rechenleistung, öffnete Alpamayo für autonomes Fahren, Cosmos World Model und Groot Robotics als Open Source. Es wird betont, dass zwei Plattformmigrationen gleichzeitig stattfinden: KI macht Anwendungen neu, Physical AI macht die Realität neu.
Huang Ren-hung begann seine Rede auf der CES damit, dass „wir 15 Kilogramm Inhalt in diesen heutigen Vortrag packen, 3.000 Menschen sitzen im Saal, 2.000 weitere schauen im Hof draußen zu, Menschen sind im vierten Stock online, und Millionen in der ganzen Welt schauen zu." Aber schnell brachte er das Thema zurück zur Hardware und kündigte an, dass Vera Rubin vollständig in die Massenproduktion ging.
Der Name Vera Rubin stammt von einer Astronomin des 20. Jahrhunderts, die beobachtete, dass die Rotationsgeschwindigkeit am Rande von Galaxien ähnlich wie in der Mitte ist, was nach Newtons Physik keinen Sinn ergibt, es sei denn, es existiert unsichtbare Materie – Dunkle Materie. Nvidia benannte seine nächste Rechenplattform nach Vera Rubin, weil das „Unsichtbare", mit dem sie konfrontiert sind, auch expandiert: Rechenbedarf.
Huang Ren-hung beschrieb den verrückten Rechenleistungsbedarf. Die Modellgröße wächst jährlich um das 10-fache, nach o1 wird Inferenz zu einem „Gedankenprozess", Post-Training führt zu explodierten Reinforcement-Learning-Rechen; Test-Time-Scaling lässt die Token pro Inferenz nochmals um das 5-fache steigen; und jedes Mal, wenn eine neue Grenze erreicht wird, fallen die Token-Kosten der vorherigen Generation mit einer Rate von 10-fach pro Jahr. Dies zeigt wiederum, dass der Wettbewerb extrem intensiv ist, und Nvidia muss „jedes Jahr die State-of-the-Art der Berechnung vorantreiben, keine einzige Ausfall".
Custom CPU Vera: Leistung verdoppelt sich, mit Rubin GPU bidirektional konsistenzdatenfreigabe von Anfang an
Rubin GPU: Ein Rechenboard erreicht 100 PFLOPS KI-Rechenleistung, das 5-fache der vorherigen Generation
Netzwerk und Sicherheit: ConnectX-9 bietet 1,6 Tbps horizontale Bandbreite, BlueField-4 DPU entlädt Speicher und Sicherheit
Ein Rechenboard hat 17.000 Komponenten, Compute-Tabletts wurden in einen Zustand ohne Kabel, ohne Rohre, ohne Lüfter umgestaltet. Die sechste Generation NVLink Switch verbindet 18 Knoten zu einer Einheit, erweiterbar auf 200G mit gemeinsamer optischer Verpackung, um Tausende von Racks zu einem „KI-Werk" zusammenzufassen. Bei Trainingsaufgaben mit 10 Billionen Parametern und 100 Billionen Token benötigt Rubin nur ein Viertel der Blackwell-Systemgröße, um die gleiche Einteilung in einem Monatsfenster zu trainieren.
Huang Ren-hung erwähnte auch praktische Branchenherausforderungen. Nvidia hatte intern eine Regel, dass neue Generationen höchstens ein oder zwei Chips wechselten, um die Lieferkette nicht zu zerstören. Aber nachdem sich das Mooresche Gesetz verlangsamt hat, kann der Transistorwachstum nicht mit 10-fach Modell, 5-fach Token, 10-fach Kostenrückgang Schritt halten, ohne „Co-Design" ist es unmöglich zu halten, also musste diese Generation jeden einzelnen Chip neu gestalten. Rubin GPU ihre Gleitkomma-Leistung ist 5-fach von Blackwell, aber Transistoren sind nur 1,6-fach, was bedeutet, dass nur die Verarbeitung durch Transistor-Stapelung bereits an die Decke gestoßen ist, Architektur- und System-Level-Co-Design erforderlich sind, um die Leistung zu erreichen.
Im vergangenen Jahr war das, was Huang Ren-hung wirklich „aufgeregt„ machte, nicht der Fortschritt eines einzelnen Closed-Source-Modells, sondern die Kollektivverschiebung des Open-Source-Modus. Huang Ren-hung sagte, dass offene Modelle jetzt etwa „sechs Monate hinter dem Stand-of-the-Art Modellen" zurückliegen, aber alle sechs Monate tauchen klügere neue Modelle auf, daher explodieren die Download-Zahlen, weil Startups teilnehmen möchten, große Unternehmen teilnehmen möchten, Forscher teilnehmen möchten, Studenten teilnehmen möchten, fast jedes Land möchte teilnehmen.
Viele Menschen missverstehen Nvidia und sagen, dass es nur „GPUs verkauft", während Huang Ren-hung auf der CES-Bühne immer wieder betont hat, dass Nvidia zum Konstrukteur fortgeschrittener Open-Source-Modelle wird, und zwar vollständig offen. Er ratterte eine Reihe von Nvidias Open-Source-Modellen herunter: von Nemotron, das Transformer-SSM mischt, World Model Cosmos, bis zum humanoidem Roboter Groot. Im Bereich autonomes Fahren nicht nur Alpamayo Open-Source-Modelle, sondern auch Trainingsdaten öffnen.
Huang Ren-hung kündigte an, dass Alpamayo „die weltweit erste KI für autonomes Fahren ist, die denken und schlussfolgern kann". Es ist End-to-End von Kamera zu Aktuatoren, es hat eine große Menge von echten Meilen „menschlicher Demonstration" gelernt, es hat auch Meilen gelernt, die von Cosmos generiert werden, plus „Hundertausende" von sorgfältig beschrifteten Proben. Der Schlüssel ist, dass es nicht nur Lenkrad und Bremse ausgibt, sondern Ihnen auch sagt, welche Maßnahmen es ergreifen wird, warum es das tut, und wie die Flugbahn aussieht.
Huang Ren-hung sagte, dass sie vor acht Jahren mit autonomem Fahren begannen, weil sie früh urteilten, dass tiefes Lernen den gesamten Rechenstapel neu machen würde. Alpamayo kündigte an, dass es „heute Open Source" ist, dieser technische Umfang ist riesig, Huang Ren-hung sagte, ihr AV-Team habe „Tausende von Personen", und Mercedes-Benz arbeitet seit fünf Jahren mit ihnen zusammen. Er prognostiziert, dass es in Zukunft möglich ist, dass 1 Milliarde Autos autonom fahren, „jedes Auto wird denkbar sein, jedes Auto wird von KI angetrieben".
Huang Ren-hung verbrachte äußerst lange damit, ein Ding zu erklären: KI die Alltagskenntnisse der Welt verstehen zu lassen, ist viel schwieriger als Sprache. Objektpersistenz, Kausalität, Trägheit, Reibung, Schwerkraft sind für Menschenkinder intuitiv, aber für KI völlig fremd. Und die Daten der realen Welt reichen niemals aus. Er sagte, um Physical AI zu machen, braucht man „drei Computer": einer zum Trainieren von Modellen, einer zum Inferieren an der Kante von Autos/Robotern/Fabriken, und einen zum Simulieren.
Omniverse ist die digitale Zwillingssimualtionswelt, Cosmos ist das weltliche Grundmodell, Robotermodelle sind Groot und Alpamayo. Woher kommen die Trainingsdaten? Sprachmodelle haben viele Texte, echte Videos der physischen Welt gibt es viele, aber diese sind völlig unzureichend, um diverse Interaktionen abzudecken. Also generierten sie synthetische Daten, die den physikalischen Gesetzen entsprechen, und produzierten Trainingsmuster selektiv.
Cosmos kann aus einem einzelnen Bild realistische Videos generation, kann aus 3D-Szenenbeschreibung kohärente Bewegung generieren, kann aus Sensorprotokollen Panoramavideo generieren, kann aus Szenenprompts „Randfälle" manufacturing. Kann auch in einer geschlossenen Schleife simulieren, wenn die Aktion getan wird, antwortet die Welt, Cosmos schlussfolgert den nächsten Schritt. Huang Ren-hung definierte autonomes Fahren als den ersten „Mainstream-Massenmarkt" für Physical AI, und beharrte: „Der Wendepunkt ist genau dieser Zeit", in den nächsten zehn Jahren wird ein großer Teil der Autos der Welt hochgradig automatisiert.
Huang Ren-hung glaubt, dass die zukünftige KI nicht nur multimodal, sondern „Multi-Modell" sein wird. Die klügsten Systeme sollten die am besten geeigneten Modelle für unterschiedliche Aufgaben aufrufen, die realsten Systeme sind von Natur aus Multi-Cloud, Hybrid-Cloud, Edge-Computing. Das bedeutet, dass die Essenz von KI-Anwendungen tatsächlich eine Architektur der Terminplanung und Inferenz ist, ein Agent, der Absicht beurteilen, Modelle auswählen, Tools aufrufen, Ergebnisse kombinieren kann. Huang Ren-hung glaubt, dass diese Agenten zur neuen „Benutzeroberfläche" werden, nicht mehr Excel, nicht mehr Formulare, nicht mehr Befehlszeile.
Nvidia durchlebt einen widersprüchlichen Moment. Es sieht aus wie der gefährlichste in allen Bubble-Narrativen, seine Marktkapitalisierung ist auf ein beispielloses Hoch gestiegen. Aber es ist gleichzeitig wie das stärkste unter allen KI-Konzeptstöcken, jedes Quartal Umsatz, hunderte Milliarden Dollar Nettogewinn, Bruttomargen können 70% erreichen. Wenn ein Unternehmen gleichzeitig die technologische Erzählung, die wichtige Position in der Industrie und die Aufmerksamkeit des Finanzmarktes kontrolliert, wird es zum Totem. Der Vorteil eines Totems ist, dass der Glaube einen Aufschlag bringt, der Nachteil ist, dass der Aufschlag bedeutet, dass du keinen Fehler machen darfst.