Meituan LongCat-2.0 Open Source: 1,6 Billionen Parameter, keine NVIDIA GPU erforderlich.

2026-07-01 02:46:54

Laut einem Bericht von Reuters vom 30. Juni hat Meituan das Open-Source-KI-Modell LongCat-2.0 veröffentlicht. Es verfügt über 1,6 Billionen Parameter, verwendet eine Sparse-MoE-Architektur (Sparse Mixture of Experts) und wurde vollständig mit einem inländischen ASIC-Supercluster trainiert – ohne jegliche NVIDIA-GPUs oder CUDA-Software. Das Kontextfenster des Modells beträgt 1 Million Tokens.

Technische Spezifikationen und Zielanwendungen von LongCat-2.0

LongCat-2.0 nutzt die Sparse-MoE-Architektur, ähnlich den Modellen DeepSeek und Mistrals Mixtral: Das Modell aktiviert nicht alle 1,6 Billionen Parameter gleichzeitig, sondern ein interner Router wählt für jedes Token einen Satz spezialisierter Untermodelle aus. Dies senkt die Inferenzkosten im Vergleich zu einem dichten Modell gleicher Größe. Die wichtigsten technischen Daten und Bereitstellungseinschränkungen:

Parametergröße: 1,6 Billionen (Sparse-MoE-Architektur, nicht alle Parameter gleichzeitig aktiv)

Kontextfenster: 1 Million Tokens (DeepSeek-R1-0528 und GPT-OSS haben jeweils 128.000)

Trainingshardware: Inländischer ASIC-Supercluster (keine NVIDIA-GPUs, kein CUDA-Software-Stack)

Zielanwendungen: KI-Agenten, Codierungswerkzeuge (Codeverständnis, vollständige Codebasis-Bearbeitung, Automatisierungsaufgaben)

Bereitstellung: Inferenzcluster auf Rechenzentrumsebene, nicht für Verbrauchergeräte oder die meisten lokalen Installationen geeignet

Markthintergrund zu inländischen Chips und Bernstein-Daten

Meituan gibt an, die Kerninferenzarchitektur von LongCat-2.0 sei portierbar und könne auf bestehender chinesischer Hardware ausgeführt werden. Die Veröffentlichung erfolgt, während US-Exportkontrollen weiterhin den Export fortschrittlicher KI-Chips nach China einschränken.

Die Aktienforschungsfirma Bernstein schätzt, dass NVIDIA derzeit rund 40 % des chinesischen KI-Chipmarktes hält, Huawei einen ähnlichen Anteil; Bernstein prognostiziert zudem, dass Huawei in diesem Jahr Fortschritte erzielen wird, wodurch NVIDIAs Marktanteil in China um rund 8 Prozentpunkte sinken wird.

Aktueller Stand der Leistungsaussagen: Noch keine Drittanbieter-Verifizierung

Meituan vergleicht LongCat-2.0 in veröffentlichten Benchmarks mit mehreren Closed-Source-Modellen, aber wie der Bericht anmerkt, wurden diese Leistungsaussagen bisher keiner unabhängigen, neutralen Drittanbieter-Bewertung unterzogen.

Der Bericht weist zudem darauf hin, dass Optimierungen für inländische Chips die Leistung von LongCat-2.0 auf NVIDIA-Hardware einschränken könnten, die global weiterhin in Rechenzentren dominiert. Meituan erklärt, die Kerninferenzarchitektur sei weiterhin portierbar; unabhängige Tests werden darüber entscheiden, wie Entwickler außerhalb Chinas das Modell übernehmen.

Häufige Fragen

Für welche Anwendungen ist das 1-Million-Token-Kontextfenster von LongCat-2.0 sinnvoll?

Zum Zeitpunkt des Berichts hatten DeepSeek-R1-0528 und OpenAI GPT-OSS ein Kontextfenster von maximal 128.000 Tokens; LongCat-2.0 gibt 1 Million Tokens an, was für KI-Agenten, die sehr lange Codebasen oder komplexe Aufgabenketten verarbeiten müssen, potenziell relevant ist. Diese Angaben stehen jedoch noch nicht durch unabhängige Verifizierung.

Was ist der KI-Forschungshintergrund von Meituan?

Meituans Kerngeschäft sind Essenslieferungen und lokale Dienstleistungen. 2023 stieg das Unternehmen durch die Übernahme des KI-Start-ups Light Year Beyond für 281 Millionen US-Dollar in den KI-Bereich ein. Erst 2025 wurden interne Modellpläne öffentlich bekannt gegeben; LongCat-2.0 ist als Inferenz-Engine für die KI-Agenten und Codierungstools des Unternehmens positioniert.

Welche Vor- und Nachteile hat die Sparse-MoE-Architektur von LongCat-2.0 im Vergleich zu einem dichten Modell mit 1,6 Billionen Parametern?

Der Hauptvorteil von Sparse MoE ist, dass nicht alle Parameter aktiviert werden; die Anfrage wird an spezifische Untermodelle weitergeleitet, was die Inferenzkosten im Vergleich zu einem dichten Modell gleicher Größe senkt. Allerdings könnte die für bestimmte Hardware (wie inländische ASICs) optimierte Architektur auf anderer Hardware (wie NVIDIA-GPUs) Leistungseinbußen erleiden; unabhängige Testergebnisse stehen noch aus.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.