Anthropicは、新しいAIモデル「Claude 3.7 Sonnet」を発表し、『ポケットモンスター 赤』を用いたテストでベンチマークテストにてマチスのクチバジムまでクリアできたことを報告しました。
Claude新モデルはクチバジムまで攻略可能!進化し続けるAI技術

今回発表された「Claude 3.7 Sonnet」はAI業界初のハイブリッド推論モデルとなっており、瞬時に応答する標準モードと、深い思考が可能な拡張思考モードを単一のモデルで備えています。
同社はAIの能力を調査するために実際のゲームをプレイさせて評価するテストを実施。基本的な記憶能力や画面ピクセル入力、ボタンを押すための関数呼び出しを新モデルと従来のモデルに搭載し、『ポケットモンスター 赤』を継続的にプレイできる状態にしてプレイさせました。
結果、新モデルの「Claude 3.7 Sonnet」は30,000回以上のインタラクションにより3人のジムリーダーに勝利し、クチバジムのマチスからバッチを入手するまで進行できました。従来のモデル「Claude 3.5 Sonnet」ではトキワの森への到達やオーキド博士への「おとどけもの」を受け取る段階で止まっている他、「Claude 3.0 Sonnet」ではマサラタウンの家から出ることすら達成できておらず、新モデルの高い能力を示す結果となりました。

AIの理解力や対応力を実用性の高い環境で確かめるという、ゲームを通じた新たなテストで目覚ましい結果を見せた「Claude 3.7 Sonnet」。昨今ではAIによるゲームプレイ補助ソフトやAI技術を取り入れたNPCなどが登場していますが、AIの進化により更に活躍の幅が広がっていくかもしれません。