SCENEを見る
Google DeepMindは木曜日にSIMA 2を発表しました—この新しいAIエージェントは、同社が「仲間」のように振る舞うと主張するものです。SIMA 2のローンチにより、DeepMindは単純な画面上のアクションを超えて、計画を立て、自分自身を説明し、経験を通じて学ぶことができるAIへと進化することを目指しています。
「これは人工一般知能(AGI)の方向への重要なステップであり、ロボティクスとAIの具現化の未来に重要な影響を与える」と同社はウェブサイトで述べました。
最初のバージョンのSIMA (スケーラブル・インストラクタブル・マルチワールド・エージェント)は、2024年3月にリリースされ、画面を見て仮想キーボードとマウス操作を使用することで数百の基本スキルを習得しました。Googleによれば、新しいバージョンのSIMAは、AIが自分で考えることを可能にすることでさらに一歩進んでいます。
SIMA 2は、仮想3D世界のための最も優れたAIエージェントです。👾🌐 Geminiによってパワーアップされており、基本的な指示に従うだけでなく、対話型環境で考え、理解し、行動を取ることができます。つまり、テキスト、音声、さらには画像を通じてそれと話すことができます。詳細は以下の通りです🧵 pic.twitter.com/DuVWGJXW7W
SIMA 2は、仮想3D世界のための最も優れたAIエージェントです。👾🌐
Geminiによってパワーアップされており、基本的な指示に従うだけでなく、対話型環境で考え、理解し、行動を取ることができます。つまり、テキスト、音声、さらには画像を通じてそれと話すことができます。詳細は以下の通りです🧵 pic.twitter.com/DuVWGJXW7W
— Google DeepMind (@GoogleDeepMind) 2025年11月13日
<br>
「SIMA 2は、バーチャル3D世界のための最も能力の高いAIエージェントです」とGoogle DeepMindはXで書きました。「Geminiによって動かされ、基本的な指示に従うだけでなく、インタラクティブな環境で考え、理解し、行動することができます。つまり、テキスト、音声、さらには画像を通じてそれに話しかけることができるのです。」
Gemini AIモデルを使用することで、GoogleはSIMAが高レベルの目標を解釈し、取るべきステップを説明し、元のシステムが達成できなかったレベルの推論でゲーム内で協力できると述べました。
DeepMindは仮想環境全体での一般化が強化されたことを報告し、SIMA 2が論理的なプロンプト、画面に描かれたスケッチ、そして絵文字を含むより長く、より複雑なタスクを完了したことを報告しました。
“この能力の結果、SIMA 2のパフォーマンスは、幅広いタスクにおいて人間のプレイヤーに非常に近くなっています” とGoogleは記述し、SIMA 2のタスク完了率が65%であるのに対し、SIMA 1は31%であると指摘しました。
このシステムは、指示を解釈し、昨年リリースされた別のDeepMindプロジェクトであるGenie 3によって生成された全く新しい3D世界内で行動しました。Genie 3は、単一の画像またはテキストプロンプトからインタラクティブな環境を作成します。SIMA 2は自ら方向を定め、目標を理解し、テストの数瞬前まで遭遇したことのない世界で意味のある行動を取りました。
"SIMA 2は、これまで見たことのない世界でも、詳細な指示を実行する能力が大幅に向上しました"とGoogleは書いています。“それは、あるゲームで学んだ概念を「マイニング」として転送し、別のゲームで「収穫」として適用することができる—似たタスク間の関連性を結びつけています。”
人間のデモから学んだ後、研究者たちはエージェントが自己指向のプレイに切り替え、試行錯誤とGemini生成のフィードバックを使用して新しい経験データを作成したと述べました。これには、SIMA 2がタスクを生成し、それに挑戦し、その後、自身の軌道データをモデルの次のバージョンにフィードバックするトレーニングループが含まれています。
GoogleがSIMA 2を人工知能の前進と称賛する一方で、研究は依然として対処すべきギャップを特定しました。これには、非常に長い多段階のタスクに苦しむこと、限られたメモリウィンドウ内での作業、3D AIシステムに一般的な視覚解釈の課題に直面することが含まれます。
それでも、DeepMindはこのプラットフォームがロボティクスやナビゲーションに最終的に移行できるスキルのテストベッドとして機能していると述べました。
"私たちのSIMA 2研究は、ロボティクスにおける応用への強力な道を提供し、現実世界におけるAGIへのもう一歩です。"と述べています。
3.61K 人気度
6.48K 人気度
9.89K 人気度
3.79K 人気度
118.9K 人気度
Google DeepMindの新しいAIエージェントは、人間のように学習し、適応し、ゲームをプレイします。
簡単に言えば
デクリプトのアート、ファッション、エンターテインメントハブ。
SCENEを見る
Google DeepMindは木曜日にSIMA 2を発表しました—この新しいAIエージェントは、同社が「仲間」のように振る舞うと主張するものです。SIMA 2のローンチにより、DeepMindは単純な画面上のアクションを超えて、計画を立て、自分自身を説明し、経験を通じて学ぶことができるAIへと進化することを目指しています。
「これは人工一般知能(AGI)の方向への重要なステップであり、ロボティクスとAIの具現化の未来に重要な影響を与える」と同社はウェブサイトで述べました。
最初のバージョンのSIMA (スケーラブル・インストラクタブル・マルチワールド・エージェント)は、2024年3月にリリースされ、画面を見て仮想キーボードとマウス操作を使用することで数百の基本スキルを習得しました。Googleによれば、新しいバージョンのSIMAは、AIが自分で考えることを可能にすることでさらに一歩進んでいます。
— Google DeepMind (@GoogleDeepMind) 2025年11月13日
<br>
「SIMA 2は、バーチャル3D世界のための最も能力の高いAIエージェントです」とGoogle DeepMindはXで書きました。「Geminiによって動かされ、基本的な指示に従うだけでなく、インタラクティブな環境で考え、理解し、行動することができます。つまり、テキスト、音声、さらには画像を通じてそれに話しかけることができるのです。」
Gemini AIモデルを使用することで、GoogleはSIMAが高レベルの目標を解釈し、取るべきステップを説明し、元のシステムが達成できなかったレベルの推論でゲーム内で協力できると述べました。
DeepMindは仮想環境全体での一般化が強化されたことを報告し、SIMA 2が論理的なプロンプト、画面に描かれたスケッチ、そして絵文字を含むより長く、より複雑なタスクを完了したことを報告しました。
“この能力の結果、SIMA 2のパフォーマンスは、幅広いタスクにおいて人間のプレイヤーに非常に近くなっています” とGoogleは記述し、SIMA 2のタスク完了率が65%であるのに対し、SIMA 1は31%であると指摘しました。
このシステムは、指示を解釈し、昨年リリースされた別のDeepMindプロジェクトであるGenie 3によって生成された全く新しい3D世界内で行動しました。Genie 3は、単一の画像またはテキストプロンプトからインタラクティブな環境を作成します。SIMA 2は自ら方向を定め、目標を理解し、テストの数瞬前まで遭遇したことのない世界で意味のある行動を取りました。
"SIMA 2は、これまで見たことのない世界でも、詳細な指示を実行する能力が大幅に向上しました"とGoogleは書いています。“それは、あるゲームで学んだ概念を「マイニング」として転送し、別のゲームで「収穫」として適用することができる—似たタスク間の関連性を結びつけています。”
人間のデモから学んだ後、研究者たちはエージェントが自己指向のプレイに切り替え、試行錯誤とGemini生成のフィードバックを使用して新しい経験データを作成したと述べました。これには、SIMA 2がタスクを生成し、それに挑戦し、その後、自身の軌道データをモデルの次のバージョンにフィードバックするトレーニングループが含まれています。
GoogleがSIMA 2を人工知能の前進と称賛する一方で、研究は依然として対処すべきギャップを特定しました。これには、非常に長い多段階のタスクに苦しむこと、限られたメモリウィンドウ内での作業、3D AIシステムに一般的な視覚解釈の課題に直面することが含まれます。
それでも、DeepMindはこのプラットフォームがロボティクスやナビゲーションに最終的に移行できるスキルのテストベッドとして機能していると述べました。
"私たちのSIMA 2研究は、ロボティクスにおける応用への強力な道を提供し、現実世界におけるAGIへのもう一歩です。"と述べています。