CEO MiniMax: Kecerdasan Model Edge Setara dengan GPT-4, Teknologi Agen Memerlukan Waktu

MINIMAX7,42%

CEO MiniMax Intelligence, Li Dahai, menyatakan dalam Konferensi 2026 Beijing Zhiyuan bahwa teknologi agen memerlukan pendekatan yang terukur meski mengalami kemajuan cepat. Berbicara kepada Pengpai News dan media lain, Li menjelaskan bahwa ekspektasi publik terhadap agen dengan nol kesalahan melebihi apa yang bisa dihasilkan oleh kurva pengembangan teknis saat ini, karena teknologinya masih membutuhkan waktu untuk matang. Ia mengidentifikasi 2025 sebagai tahun pertama agen, mengantisipasi pertumbuhan meledak yang akan berdampak mendalam pada masyarakat manusia, meski ia menekankan perlunya penilaian tenang terhadap kapabilitas teknis saat ini di ruang AI agent.

Li Dahai Memaparkan Keterbatasan Teknologi Agen dan Evolusi yang Cepat

Li Dahai mengakui bahwa integrasi large model dan teknologi agen berkembang dengan cepat, dengan beberapa skenario yang sudah mendarat pada aplikasi praktis. Saat membahas keterbatasan agen, Li menyatakan dengan blak-blakan: "Masalah ada di mana-mana." Ia menjelaskan bahwa "evolusi model dan teknologi Agent sangat cepat," menuturkan bahwa "mungkin hari ini ada pekerjaan dengan tingkat kesalahan 10%, dan bulan depan tingkat kesalahan turun ke 1% — evolusi cepat menjadi tren inti."

CEO MiniMax Membantah Kesalahpahaman Distilasi Model Kecil

Li Dahai secara langsung menantang keyakinan luas industri bahwa "membuat model kecil yang bagus harus berasal dari distilasi model foundation berskala ultra-besar," menyebutnya sebagai "kesalahpahaman kognitif." Ia menjelaskan: "Di balik distilasi ada prasyarat yang sangat spesifik: objek distilasi itu sendiri haruslah model yang bagus. Distilasi pada dasarnya: bagi perusahaan yang tidak memiliki kemampuan mengembangkan foundation model mereka sendiri tetapi ingin melakukan penerapan, mereka mengadopsi existing small-sized foundation model dan memperoleh kapabilitas skenario tertentu melalui fine-tuning. Dalam proses ini, mereka memang dapat menggunakan model besar lain untuk mensintesis data agar model kecil memperoleh kapabilitas yang sesuai." Li menyatakan bahwa ini adalah paradigma untuk seluruh pelatihan large model, tidak terbatas pada model kecil saja.

MiniMax Mengalihkan Beban Pelatihan ke Chip Domestik

Li Dahai mengungkap: "Sejak tahun ini, karena industri secara keseluruhan telah mengalihkan inference ke chip domestik, kami juga secara bertahap memindahkan pelatihan ke chip domestik dan klaster domestik." Ia mengidentifikasi dua jalur paralel untuk meningkatkan ekosistem komputasi domestik: yang pertama adalah penyempurnaan dari bawah ke atas (bottom-up refinement), di mana perusahaan large model secara bertahap meningkatkan ekosistem melalui praktik pelatihan mereka sendiri, "seperti membasahi selembar batu sedikit demi sedikit, yang memakan waktu." Jalur kedua adalah perencanaan dari atas ke bawah (top-down planning), dicontohkan oleh kerja sama mendalam MiniMax dengan Zhiyuan Research Institute pada ekosistem perangkat lunak FlagOS, di mana perusahaan large model dan perusahaan chip membangun kerja sama mendalam dan bergerak maju di bawah perencanaan. Li Yuxuan, kepala AIInfra MiniMax Intelligence, mencatat bahwa inference sebenarnya membutuhkan presisi yang lebih tinggi daripada pelatihan, dan teknologi penskalaan model yang diusulkan MiniMax menjadi terobosan kunci: mencapai efek memprediksi large model dengan model yang sangat kecil, menyediakan evaluasi mendalam pada chip domestik, menyelaraskan detail eksperimen dengan produsen luar negeri, serta memastikan bahwa presisi pelatihan dapat digunakan. MiniMax mengungkapkan telah mencapai pelatihan quantization-aware dengan bit-width yang sangat rendah di platform Huawei, mencapai 95% efisiensi dari pelatihan biasa. Li Dahai menjelaskan bahwa kehilangan 5% berasal dari overhead quantizer itu sendiri, dan melalui kerja sama mendalam dengan Huawei, overhead ini telah dioptimalkan hingga minimum.

MiniCPM-5 1B Mencapai Kinerja Nyaris Setara GPT-4o pada Benchmark ArtificialAnalysis

MiniMax Intelligence mengumumkan bahwa versi MiniCPM Small Cannon generasi kelima 1B memperoleh skor 17,9 pada evaluasi otoritatif ArtificialAnalysis (AA). Peneliti komunitas open-source membandingkan dan menemukan bahwa GPT-4o (200B parameter), yang dirilis pada Mei 2024, memperoleh skor 18,3-18,6 pada tipe evaluasi yang sama, dengan perbedaan hanya 0,4-0,7 poin antara keduanya. Li Dahai menyatakan: "Pada 2024 kami memprediksi bahwa pada akhir 2026, tingkat kecerdasan model edge dapat mencapai level GPT-4. Dari data saat ini, target tersebut telah tercapai lebih cepat dari jadwal."

Selama "MiniMax Open Source Week" sebelumnya, MiniMax Intelligence merilis dua edge large model: MiniCPM5-1B dan BitCPM-CANN. MiniCPM5-1B kembali menyegarkan batas atas kepadatan kecerdasan model: dengan skala hanya 1B parameter, ia melampaui semua model di bawah 2B parameter di leaderboard AA-Index yang terkenal secara internasional; dibandingkan dengan Qwen3.5-2B yang dirilis 3 bulan lebih awal, MiniCPM5-1B tidak hanya memiliki performa lebih baik tetapi juga mengurangi parameter hingga setengah.

ForgeTrain Framework Tertulis AI Melatih 10% Lebih Cepat daripada NVIDIA Megatron

Model MiniCPM5-1B dipra-latih oleh framework pelatihan AI ForgeTrain yang dikembangkan sendiri oleh MiniMax Intelligence, yaitu framework pra-pelatihan large model kelas produksi pertama di dunia yang sepenuhnya ditulis oleh AI, tanpa keterlibatan programmer manusia. Kecepatan pelatihannya 10% lebih cepat daripada NVIDIA Megatron.

FAQ

Apa yang dikatakan Li Dahai tentang keterbatasan teknologi agen di Konferensi 2026 Beijing Zhiyuan?

Li Dahai menyatakan bahwa ekspektasi publik terhadap agen dengan nol kesalahan melebihi apa yang bisa dihasilkan oleh kurva pengembangan teknis saat ini, dan teknologinya masih membutuhkan waktu untuk matang. Ia menggambarkan keterbatasan agen saat ini sebagai "masalah ada di mana-mana", namun menekankan bahwa tingkat kesalahan turun dengan cepat — dari 10% menjadi 1% dalam sebulan pada beberapa kasus.

Bagaimana perbandingan performa MiniCPM-5 1B dengan GPT-4o pada benchmark ArtificialAnalysis?

MiniCPM-5 1B (dengan 1B parameter) memperoleh skor 17,9 pada evaluasi ArtificialAnalysis, sementara GPT-4o (dengan 200B parameter, dirilis pada Mei 2024) memperoleh skor 18,3-18,6 pada evaluasi yang sama, sehingga menghasilkan perbedaan hanya 0,4-0,7 poin antara kedua model.

Apa itu ForgeTrain dan bagaimana perbandingannya dengan NVIDIA Megatron?

ForgeTrain adalah framework pelatihan AI yang dikembangkan sendiri oleh MiniMax Intelligence, yaitu framework pra-pelatihan large model kelas produksi pertama di dunia yang sepenuhnya ditulis oleh AI tanpa partisipasi programmer manusia. Framework ini melatih 10% lebih cepat daripada NVIDIA Megatron.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar