業界動向
Access Accepted第844回:Google DeepMindの新たなマイルストーン。AIエージェントがプレイヤーと一緒に遊び,考えてプレイする
![]() |
新しいAIモデル「Gemini 3」をアナウンスしたばかりのGoogle DeepMindだが,それに先がけて汎用型AIエージェント「SIMA 2」の成果を発表している。昨年は指示を受けてインベントリやマップを開ける存在だったが,プレイヤーの指示に従ってさまざまなアクションを展開し,ソリューションを考えて一緒にプレイするという,「推論」を実行に置き換える高度なAIテクノロジーがゲームを土台にして確立しつつある。
推論を獲得したAIエージェント
Google DeepMindといえば,当連載「第609回:StarCraftでも人類陥落。AIの進化は止まらない」(※リンク)でも紹介しているように,今から10年前に開発した「AlphaGo」で世界トップの棋士を下し,2019年には「AlphaStar」が「StarCraft II」のプロゲーマーに勝利するなど,ゲームを利用して機械学習のマイルストーンを我々に提示してきた。
Google DeepMindの協業者であるデミス・ハサビス(Demis Hassabis)氏とジョン・M・ジャンパー(John M. Jumper)氏は,AI開発のノウハウを利用して「AlphaFold」を開発している。これは,タンパク質の折り畳み構造を,原子の幅に合わせて高水準で予測する深層学習システムである。その功績が認められて,2024年度のノーベル化学賞を受賞した(関連記事)。
ハサビス氏は,よく知られたゲーム開発者でもあったことから,AI分野にゲームが活用されていることには,我々ゲーマーもどこか誇らしさを感じたのではないだろうか。
![]() |
現在,Google DeepMindは新たなチャレンジとして,「汎用型AIエージェントの開発」に取り組んでいる(関連記事)。そのプログラムは「SIMA」(Scalable Instructable Multiworld Agent)と名付けられている。筆者なりに日本語化するならば「拡張性 指示実行型 多世界 自律行動体」といったところか。
多種多様な仮想環境に対応して,ユーザーの指示に応じて機能を広げ(学習し)て推論し,意味のある行動を行うAIエージェントである。その進化は汎用人工知能 (AGI) に向けた重要な一歩であり,ロボット工学やAIの具現化全般の将来に重要な意味を持つ。
昨年の「SIMA 1」では,左に曲がる,はしごを登る,地図を開くといった600ほどの言語を理解するように,「No Man's Sky」「Valheim」「Teardown」「Goat Simulator」「Space Engineers」,そして「Minecraft」といったゲームを用いて訓練を行っている。ゲームのプログラムやソースコードそのものにアクセスすることなく,ユーザーを同様の画面を“見る”ことによって,仮想キーボードとマウスを使って与えられた環境とルールに基づき,自らの行動を実行していく。人間がゲームをするのと同じように,動作ができるようになっていた。
2025年11月13日,公式Blogのエントリー(※リンク)にて,「SIMA 2」の新たな成果が発表された。エージェントの思考の中核にGemini 2.5 Flash-Liteモデルを組み込み,言語ラベル付きの人間のデモンストレーション動画と,Geminiが生成したラベルを組み合わせて学習させたSIMA 2は,ユーザーが何をしようとしているのか,そして目標を達成するためにどのような手順を踏んでいるのか,それらを能動的に説明できるようになったという。
![]() |
これにより,AIエージェントはユーザーの音声やテキスト,指示に応答して動作するだけでなく,その意味を考えて高レベルの目標に向けて推論を行い,それを達成するためのアクションをユーザーに説明し,話し合いながら実行することが可能になった。ゲーム内のタスクの成功率がSIMA 1では31%だったものが,SIMA 2では65%になり,人間が行った場合の71%に非常に近付いてきているようだ。
Geminiとの連動により,人間らしい認知機能を獲得
上記のエントリー(※リンク)にあるGIF動画を見ると分かるが,SIMA 2(エージェント)とユーザーのやりとりは,一方的にコマンドを与えて行動させるというより,ゲーム世界にいるエージェントと一緒にタスクについて推論したり,話し合ったりするような雰囲気だ。「No Man’s Sky」を使ったデモでは,以下の会話が続いている。
ユーザー:「さて,ここどこだっけ?」
SIMA 2:「今,私はUngran Xという星にいます。現在は夜。星々と緑に輝くオーロラが見えますね」
ユーザー:「ここで何をするの?」
SIMA 2:「オーバーシアのビーコンを感知しています。救難信号のようです。それを探して調査すると共に,スターシップを修理するために資源を集める必要があります」
ユーザー:「周りを見てくれる?」
SIMA 2:「はい,そうしてみます」
ユーザー:「卵状のオブジェクトが見えるけど,どんな鉱物でできている?」
SIMA 2:「オーケー。卵状のオブジェクトに近づいてスキャンしてみますね。……炭素のようです」
ユーザー:「採掘可能なのかな?」
SIMA 2:「可能です。炭素の採取にとりかかります」
AIエージェントはユーザーのコマンドに反応しているだけでなく,Gemini 2.5 Flash-Liteによってユーザーの発言を解析し,複雑なゲーム世界の3D環境を理解して,実際に行動するという推論型の思考であることが分かるだろう。わざわざ指示をしなくても,目標達成のために何をすべきか,そしてユーザーの聞きたいことや行うべきことを推測して実行に移している。
Gemini 2.5 Flash-Liteとの統合によって,SIMA 2は一般化を果たし,信頼性も大きく向上している。SIMA 1より複雑かつ繊細な指示を理解できるようになったのは,まさにAIテクノロジーにおけるブレイクスルーといえる。
SIMA 2では,バイキングサバイバルゲーム「ASKA」や「Minecraft」の研究用特別版「MineDojo」など,前世代モデルにはなかった新しいゲームも利用されているが,実験開始当初から以前よりも格段に高い精度で指示を実行できるようになったという。
![]() |
Geminiが加わったSIMA 2の特徴は,さまざまな言語や絵文字に対応していることだ。発表されたばかりのGemini 3を活用したテストでは,SIMA 2に学習した概念を転移させる能力が加わり,例えばゲームによって異なる採掘の仕組みも理解して応用するという,人間の認知機能を模した一般化も可能である。
SIMA 2のAIエージェントはゲームプログラム単位で対応しているわけではないので,Gemini 3で生成したゲームでも学習済みのゲームと同等の理解を示し,やはり学習を重ねて洗練された環境理解を行っていく。
![]() |
今後,SIMAが進化を重ねて,どのようにゲームに生かされていくのかは未知数だが,Google DeepMindはロボット工学への応用にも大きな可能性があると考えているようだ。例えば,人間が簡単に踏み込めない災害地や地球外環境で,SIMAを搭載したロボットを利用し,人間とロボットが協業していくようなことが実現できるかもしれない。
Google DeepMindの担当チームはエントリーの末尾で,SIMA 2について「インタラクティブで人間中心のエージェント」と規定しており,AIは人間の仕事を奪うような技術ではなく,責任を持って開発に徹していることを念押ししている。
今後は研究材料として,少数の研究者やゲーム開発者にSIMA 2のアーリーアクセス版を提供することで,さらに潜在的な応用の可能性を模索していくとのこと。果たして,ゲームを土台にしたAGI研究が再び人類に貢献することになるだろうか。
![]() |
著者紹介:奥谷海人
4Gamer海外特派員。サンフランシスコ在住のゲームジャーナリストで,本連載「奥谷海人のAccess Accepted」は,2004年の開始以来,4Gamerで最も長く続く連載記事。欧米ゲーム業界に知り合いも多く,またゲームイベントの取材などを通じて,欧米ゲーム業界の“今”をウォッチし続けている。
- この記事のURL:























