chatGPTマスターを目指して vol.16 研究ではどう使われている?
GPTなどの自然言語モデルは、単純にその精度向上だけではなく、その活用方法も様々研究が進められています。たとえば何ができるのでしょうか。
2024年5月28日火曜日。
日本で人工知能を研究している学生・研究者に加え、人工知能を活用している企業人が集まる学会が、浜松で開催されました。
その名も人工知能学会。
https://www.ai-gakkai.or.jp/jsai2024/
数千人規模で開催され、連日多くの研究発表や、各分野の第一人者における講演会が開かれました。
例えば量子コンピューターに関する研究や、画像識別に関する研究。
あるいは時系列的な予測手法や、遺伝的アルゴリズムなど、その内容は多岐にわたっていたのですが、とりわけ、多くの研究で登場するものがありました。
何を隠そう、chatGPTです。
より正確に言えば、chatGPTの背後で動いているGPT-3、GPT-3.5、GPT-4 Turboなどの自然言語モデルを使って生成した文章を活かした研究が多くなされていました。
例えば、chatGPTが画像を生成するときに使う機械学習モデルがあるのですが、こちらでは、画像だけではなく画像と文章のペアとして特徴を学習しています。
例えば「草原に座っている犬」「気持ちよさそうに伸びをしている猫」といった文章と、それぞれに合致する画像が存在している、といったイメージです。
それらの組み合わせがあるからこそ、私たちが新しく言葉で指定したような画像を生成することができるようになります。
そしてこの、画像を説明する文章についてもまた、GPTのような自然言語モデルで生成してしまおう、という研究があります。
多くの場合、問題設定として画像が何を示しているかを予測する問題で扱われることがほとんどなのですが、より「犬」や「猫」であると正確に識別できるように適切な説明文を生成するような取り組みをしています。
そしてなんと、人間が付けた説明文を使うよりも、GPTが説明文を作った方が良い成績を出せることもあるそうなのです。
その理由としてはおそらく、人間による説明文付与には数の限りがあること、すなわち学習データ数の違いや、
より識別に特化した文章をGPTであれば生成できる、といったことが挙げられるかもしれません。
人間は往々にして(これは当たり前だから…)と思い不十分な描写になってしまうことがある、ということも、説明文に基づく画像生成の領域で指摘されていたりします。
例えば冒頭の猫の写真。
私が説明文を書くとしたら「鉢植えの間にかわいい猫が座っている」くらいの情報量になってしまうのですが、
おそらくGPTに説明させると「どういった見た目の猫か」「鉢植えの詳細(数や形)」「背景はどうなっているか」など、より詳細な説明文を生成するはずです。
自然言語モデルを活用した研究では他にも、チャットボットを改良するためにGPTを活用してみたり。
教育の分野で役立てよう!といった研究もあったり。
本当にいろいろな分野で活用されていました。
GPTそのものの改善だけでなく、それを使って何ができるか?という研究も両輪で進められている。
AIと人間の協業に向けて、順調にステップが進んでいるようです。
P.S.
↓メルマガの新規登録はこちらから↓
https://48auto.biz/keieijinji/touroku/sp/scenario13.htm
(スマートフォンよりご登録いただけます)