機械学習でめざせ、ポ〇モンマスター!

様々なルールを考慮する必要がある対人戦であるポケモンバトル。これを攻略せんとする機械学習モデルが発表されました。

  

(画像はchatGPT作です。なんとも「惜しい」ポケモン感が味わい深く感じます。)

 

最近多くの分野で活用が進むLLM(大規模言語モデル)。

その活躍の場所は現実世界だけにとどまらず、なんとゲームの世界へも進出しているようです。

LLMを搭載した機械学習を使って、ポケモンバトル(自分が育てたポケットモンスターを使った対人戦)に勝つ方法を探る。

そしてなんと、人間相手でも50%前後の勝率で勝ってしまう。

恐ろしいAIが誕生しました。

 

論文はこちらです。

https://arxiv.org/abs/2402.01118

 

LLMと言えば、chatGPTに代表される、自然言語処理を行うことのできる機械学習モデルです。

人間と同じ言葉を(一見)理解し操り、私たちの質問にスムーズに答えてくれます。

もちろんまだまだ課題はあり、たとえばプログラミングを書いてもらうときなど嘘をつかれることもあるため、それを見抜いたり、より効率化するための基礎知識は必要ですが、たたき台を作るという意味において、これほど便利なものはありません。

 

そして今回、LLMを使ってポケモンバトルの戦略を学習することで、これまでAIによるバトルで陥りがちであった問題を解決し、条件によっては58%程の勝率をたたき出すことができるようになりました。

これは、実際の(恐らくとても強い)人間のプレイヤーの勝率が59.8%であることを考えると、恐るべき数字です。

多分私が対戦したら、勝てないに違いありません。

 

実はこの手法でのポイントは、外部の知識を使うことでした。

というのも、ポケモンには相性や覚えるべき特性がたくさんあり、それらを外部情報をとしてLLMに教え込むことで、今回のような高い勝率をたたき出すことができたというのです。

最近ではRAGと呼ばれる、検索機能を付けたLLMがとてもはやっていますが、やはりどの分野でも、単純に人工知能を用いるよりも、プラスアルファの知識を与えて上げた方が良いようです。

 

いわばLLMは、言語全体に関する知識。

そしてそこに、各種分野への知識や新しい情報が与えられることにより、より高性能なAIになることができる。

その様相は、人間もAIも変わらないようです。

 

 

P.S.

とはいえ、人間の最も強い棋士に勝つことができたAlpha碁ができたのも随分と昔であることを考えると、ポケモンの方がより複雑な問題なのでしょうか。

…おそらくそんなことはなく、これから研究途上であるだけなのだとは思います。

また、LLMを用いている、ということがこの研究の魅力であり、ここで培われた知識が他の分野でも活かされることを思うと、ゲームも捨てたものではないなあ、と思わされます。

 

 

P.P.S.

↓メルマガの新規登録はこちらから↓

https://48auto.biz/keieijinji/touroku/sp/scenario13.htm

(スマートフォンよりご登録いただけます)

 

Who is writing

大学にてデータサイエンスを学ぶ傍ら、多くの人にデータ分析の面白さを伝えたいと日々奮闘中。