Sistem ini menggunakan model Gemini dari Google untuk menganalisis tujuan, menjelaskan rencananya, dan bertindak di berbagai permainan yang tidak dikenal.
SIMA 2 belajar keterampilan baru melalui permainan yang diarahkan sendiri dan beradaptasi dengan dunia yang dibuat beberapa saat sebelumnya oleh Genie 3.
DeepMind merencanakan pratinjau penelitian terbatas untuk pengembang dan akademisi.
Pusat Seni, Mode, dan Hiburan Decrypt.
Temukan SCENE
Google DeepMind memperkenalkan SIMA 2 pada hari Kamis—sebuah agen AI baru yang diklaim perusahaan berperilaku seperti “teman” di dalam dunia virtual. Dengan peluncuran SIMA 2, DeepMind bertujuan untuk maju melampaui tindakan sederhana di layar dan bergerak menuju AI yang dapat merencanakan, menjelaskan dirinya sendiri, dan belajar melalui pengalaman.
“Ini adalah langkah signifikan menuju Kecerdasan Umum Buatan (AGI), dengan implikasi penting untuk masa depan robotika dan penggambaran AI secara umum,” kata perusahaan tersebut di situs webnya.
Versi pertama SIMA (Agen Multiworld Instructable yang Dapat Diskalakan), dirilis pada Maret 2024, mempelajari ratusan keterampilan dasar dengan menonton layar dan menggunakan kontrol keyboard dan mouse virtual. Versi baru SIMA, kata Google, membawa hal ini lebih jauh dengan membiarkan AI berpikir untuk dirinya sendiri.
SIMA 2 adalah agen AI kami yang paling mampu untuk dunia 3D virtual. 👾🌐
Didukung oleh Gemini, ia melampaui sekadar mengikuti instruksi dasar untuk berpikir, memahami, dan mengambil tindakan dalam lingkungan interaktif – yang berarti Anda dapat berbicara dengannya melalui teks, suara, atau bahkan gambar. Berikut adalah caranya 🧵 pic.twitter.com/DuVWGJXW7W
— Google DeepMind (@GoogleDeepMind) 13 November 2025
<br>
“SIMA 2 adalah agen AI kami yang paling canggih untuk dunia 3D virtual,” tulis Google DeepMind di X. “Didukung oleh Gemini, ia melampaui mengikuti instruksi dasar untuk berpikir, memahami, dan mengambil tindakan di lingkungan interaktif–artinya Anda dapat berbicara dengannya melalui teks, suara, atau bahkan gambar.”
Dengan menggunakan model AI Gemini, Google mengatakan SIMA dapat menginterpretasikan tujuan tingkat tinggi, membahas langkah-langkah yang akan diambil, dan berkolaborasi di dalam permainan dengan tingkat penalaran yang tidak dapat dicapai oleh sistem asli.
DeepMind melaporkan generalisasi yang lebih kuat di berbagai lingkungan virtual, dan bahwa SIMA 2 menyelesaikan tugas yang lebih panjang dan kompleks, yang mencakup prompt logika, sketsa yang digambar di layar, dan emotikon.
“Sebagai hasil dari kemampuan ini, kinerja SIMA 2 secara signifikan lebih mendekati kinerja pemain manusia dalam berbagai tugas,” tulis Google, mencatat bahwa SIMA 2 memiliki tingkat penyelesaian tugas sebesar 65%, dibandingkan dengan 31% oleh SIMA 1.
Sistem ini juga menginterpretasikan instruksi dan bertindak di dalam dunia 3D baru yang sepenuhnya dihasilkan oleh Genie 3, proyek DeepMind lainnya yang dirilis tahun lalu yang menciptakan lingkungan interaktif dari satu gambar atau prompt teks. SIMA 2 mengorientasikan dirinya, memahami tujuan, dan mengambil tindakan yang berarti di dunia yang belum pernah ia temui hingga beberapa saat sebelum pengujian.
“SIMA 2 sekarang jauh lebih baik dalam melaksanakan instruksi yang detail, bahkan di dunia yang belum pernah dilihat sebelumnya,” tulis Google. “Ini dapat mentransfer konsep yang dipelajari seperti 'mining' dalam satu permainan dan menerapkannya ke 'harvesting' dalam permainan lain—menghubungkan titik-titik antara tugas yang serupa.”
Setelah belajar dari demonstrasi manusia, para peneliti mengatakan bahwa agen tersebut beralih ke permainan yang diarahkan sendiri, menggunakan trial and error serta umpan balik yang dihasilkan oleh Gemini untuk menciptakan data pengalaman baru, termasuk loop pelatihan di mana SIMA 2 menghasilkan tugas, mencoba tugas tersebut, dan kemudian memberi umpan balik data trajektori sendiri ke versi berikutnya dari model.
Sementara Google memuji SIMA 2 sebagai langkah maju untuk kecerdasan buatan, penelitian tersebut juga mengidentifikasi kekurangan yang masih perlu diatasi, termasuk kesulitan dalam tugas yang sangat panjang dan multi-langkah, bekerja dalam jendela memori yang terbatas, dan menghadapi tantangan interpretasi visual yang umum terjadi pada sistem AI 3D.
Meski begitu, DeepMind mengatakan bahwa platform tersebut berfungsi sebagai tempat percobaan untuk keterampilan yang pada akhirnya dapat bermigrasi ke dalam robotika dan navigasi.
“Penelitian SIMA 2 kami menawarkan jalur yang kuat menuju aplikasi dalam robotika dan langkah lain menuju AGI di dunia nyata,” katanya.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Agen AI Baru Google DeepMind Belajar, Beradaptasi, dan Bermain Game Seperti Manusia
Singkatnya
Pusat Seni, Mode, dan Hiburan Decrypt.
Temukan SCENE
Google DeepMind memperkenalkan SIMA 2 pada hari Kamis—sebuah agen AI baru yang diklaim perusahaan berperilaku seperti “teman” di dalam dunia virtual. Dengan peluncuran SIMA 2, DeepMind bertujuan untuk maju melampaui tindakan sederhana di layar dan bergerak menuju AI yang dapat merencanakan, menjelaskan dirinya sendiri, dan belajar melalui pengalaman.
“Ini adalah langkah signifikan menuju Kecerdasan Umum Buatan (AGI), dengan implikasi penting untuk masa depan robotika dan penggambaran AI secara umum,” kata perusahaan tersebut di situs webnya.
Versi pertama SIMA (Agen Multiworld Instructable yang Dapat Diskalakan), dirilis pada Maret 2024, mempelajari ratusan keterampilan dasar dengan menonton layar dan menggunakan kontrol keyboard dan mouse virtual. Versi baru SIMA, kata Google, membawa hal ini lebih jauh dengan membiarkan AI berpikir untuk dirinya sendiri.
— Google DeepMind (@GoogleDeepMind) 13 November 2025
<br>
“SIMA 2 adalah agen AI kami yang paling canggih untuk dunia 3D virtual,” tulis Google DeepMind di X. “Didukung oleh Gemini, ia melampaui mengikuti instruksi dasar untuk berpikir, memahami, dan mengambil tindakan di lingkungan interaktif–artinya Anda dapat berbicara dengannya melalui teks, suara, atau bahkan gambar.”
Dengan menggunakan model AI Gemini, Google mengatakan SIMA dapat menginterpretasikan tujuan tingkat tinggi, membahas langkah-langkah yang akan diambil, dan berkolaborasi di dalam permainan dengan tingkat penalaran yang tidak dapat dicapai oleh sistem asli.
DeepMind melaporkan generalisasi yang lebih kuat di berbagai lingkungan virtual, dan bahwa SIMA 2 menyelesaikan tugas yang lebih panjang dan kompleks, yang mencakup prompt logika, sketsa yang digambar di layar, dan emotikon.
“Sebagai hasil dari kemampuan ini, kinerja SIMA 2 secara signifikan lebih mendekati kinerja pemain manusia dalam berbagai tugas,” tulis Google, mencatat bahwa SIMA 2 memiliki tingkat penyelesaian tugas sebesar 65%, dibandingkan dengan 31% oleh SIMA 1.
Sistem ini juga menginterpretasikan instruksi dan bertindak di dalam dunia 3D baru yang sepenuhnya dihasilkan oleh Genie 3, proyek DeepMind lainnya yang dirilis tahun lalu yang menciptakan lingkungan interaktif dari satu gambar atau prompt teks. SIMA 2 mengorientasikan dirinya, memahami tujuan, dan mengambil tindakan yang berarti di dunia yang belum pernah ia temui hingga beberapa saat sebelum pengujian.
“SIMA 2 sekarang jauh lebih baik dalam melaksanakan instruksi yang detail, bahkan di dunia yang belum pernah dilihat sebelumnya,” tulis Google. “Ini dapat mentransfer konsep yang dipelajari seperti 'mining' dalam satu permainan dan menerapkannya ke 'harvesting' dalam permainan lain—menghubungkan titik-titik antara tugas yang serupa.”
Setelah belajar dari demonstrasi manusia, para peneliti mengatakan bahwa agen tersebut beralih ke permainan yang diarahkan sendiri, menggunakan trial and error serta umpan balik yang dihasilkan oleh Gemini untuk menciptakan data pengalaman baru, termasuk loop pelatihan di mana SIMA 2 menghasilkan tugas, mencoba tugas tersebut, dan kemudian memberi umpan balik data trajektori sendiri ke versi berikutnya dari model.
Sementara Google memuji SIMA 2 sebagai langkah maju untuk kecerdasan buatan, penelitian tersebut juga mengidentifikasi kekurangan yang masih perlu diatasi, termasuk kesulitan dalam tugas yang sangat panjang dan multi-langkah, bekerja dalam jendela memori yang terbatas, dan menghadapi tantangan interpretasi visual yang umum terjadi pada sistem AI 3D.
Meski begitu, DeepMind mengatakan bahwa platform tersebut berfungsi sebagai tempat percobaan untuk keterampilan yang pada akhirnya dapat bermigrasi ke dalam robotika dan navigasi.
“Penelitian SIMA 2 kami menawarkan jalur yang kuat menuju aplikasi dalam robotika dan langkah lain menuju AGI di dunia nyata,” katanya.