ニュース
自分で考え,仮想3D世界で目的を達成する汎用AIエージェント「SIMA 2」発表。初代SIMAにGeminiを統合し,推論を可能に
仮想世界で人間の指示を理解するだけでなく,目標について考え,利用者と会話し,自ら学び成長することが可能だという。
![]() |
SIMA 2 is our most capable AI agent for virtual 3D worlds. ??
— Google DeepMind (@GoogleDeepMind) November 13, 2025
Powered by Gemini, it goes beyond following basic instructions to think, understand, and take actions in interactive environments ? meaning you can talk to it through text, voice, or even images. Here’s how ? pic.twitter.com/DuVWGJXW7W
SIMAは,幅広い仮想環境で基礎的な命令に従うことができる汎用型AIエージェントとして,2024年3月に発表された。ゲームをプレイさせることも可能である。
Google DeepMindは,SIMAについて,言語を3D世界での意味ある行動に翻訳する方法を実現するための,重要なステップであったと説明した。
Google DeepMindの3D仮想環境向け汎用型AIエージェント「SIMA」とは?[CEDEC 2024]
2024年8月21日,ゲーム開発者向けカンファレンス「CEDEC 2024」で,セッション「SIMA: Developing General AI Agents with Video Games/SIMA:ビデオゲームを用いた汎用型AIエージェントの開発」が行われた。その内容をレポートする。
その後継となるSIMA 2では,Geminiが統合され,SIMAが指示に従う存在から,一緒に遊ぶインタラクティブな仲間へと進化を果たしたという。
初代SIMAでは,「左に曲がる」「はしごを登る」「マップを開く」といった600以上のスキルを学習し,人間のように画面を認識し,キーボードとマウスを操作する方法で行動していた。
SIMA 2では,Geminiを中核に組み込み,指示の意味を考え,推論することを可能とした。さらに,人間によるデモ映像とGeminiが生成したラベルを組み合わせて学習させたことで,SIMA 2は自分がこれから何をするつもりなのか,どう目標を達成しようとしているのか,を説明できるようになったという。
指示を理解する力や汎用性能も向上し,採掘という概念を,別のゲームでの収穫に応用できるなど,柔軟な認知能力の実現に近づいているそうだ。
![]() |
Google DeepMindは,SIMA 2のもっとも画期的な点として,自己改善能力を挙げた。人間のデモから学習を始めたあと,自律的なプレイを通じて,新しいゲームのスキルを取得できる。
つまり,人間のデータなしで新しい環境に適応できるのだという。
![]() |
![]() |
また,ワールドモデル「Genie 3」を使った検証も行われ,これまで見たことない生成世界の中でも,SIMA 2は状況を把握し,利用者の指示を理解して,目的に沿った行動が取れるそうだ。
テキストプロンプトからプレイ可能な一貫性のある世界を作り出す。Google DeepMindの新たな汎用ワールドモデル「Genie 3」発表
2025年8月5日,Google DeepMindは,「Genie 3」を発表した。テキスト形式のプロンプトを与えるだけで,操作できるインタラクティブな世界をリアルタイムで生成できる。ゲームのような3D空間に限らず,火山や夜景,台風などフォトリアルな世界も生成できる汎用的なモデルとなっている。
今後の課題としては,長期的で複雑なタスクにおける多段階推論や,短期記憶の制約,マウスとキーボード操作の精密さ,複雑な3D視覚の理解の安定性などが挙げられた。
- 関連タイトル:
開発/テクノロジ - この記事のURL:



























