
あなたのデスクの隣にいるはずの「同僚」。
いつかその「同僚」として、AIが座っているとしたら。
どのように協業し、分担することができるでしょうか。
最近のAI業界では、「どのAIが一番賢いか?」という競争から「どのAIが一番仕事ができるか?」という競争へ変化しつつあります。
「仕事ができる」というのは、「仕事をやり切ることができる」と言い換えることもできます。
先週お送りしたメルマガ
【chatGPTマスターを目指してvol.75 人間にもAIにも求められる「やり切る力」】
https://blog.people-resource.jp/newsletter_chatgpt_vol75/
でご紹介したように、「ゴールまで頑張れるAI」が評価されるようになってきています。
これまで生成AIの能力を図るためには、どれだけ難しい問題に正解できるか?という指標が用いられていました。
大学入試レベルの問題を解かせたり、日本でも「AIは大学入試を突破できるか?」という研究が行われていたりします。
一方で、最近のOpenAIが公開したGPT-5.5やWorkspace Agentsの方向性はガラリと変わっています。
重視しているものが「知識」ではなく「実務遂行力」になってきているのです。
実際にGPT-5.5の公式リリースでは、「作業を自律的に進められ」る、「自ら計画を立て」、「作業を進め続け」ると書かれています。
【GPT-5.5が登場 -実務に応える新しいインテリジェンス-】
https://openai.com/ja-JP/index/introducing-gpt-5-5/
私たちユーザ視点だと、この変化はどのように映るのでしょうか。
例えば従来の生成AIであれば「このコードの意味は?」「この文章を翻訳して」といった単発の質問には強い一方で、業務遂行能力には限界がありました。
私たちが普段仕事で行うような、ファイルを探して情報を集め、データを整形しレポートを作成、報告可能な形にする、といった業務の流れを進めることは、AIにとって非常に困難なタスクでした。
そもそもユーザ側も、そのような使い方は期待していなかった気もします。
ところが最近は、このような「一連の流れ」を完遂できるAIが開発されています。
様々なベンチマークも公開されており、例えばSWE-bench Verifiedというデータセットでは、ソフトウェアの不具合を修正させるタスクを解かせています。
訂正してみて実行し、さらなる不具合に対応し、最終的なアウトプットを得る必要があります。
他にも、OSWordという評価では、AIが実際にPC画面を操作してタスクを完了できるか?を測っています。
これらは全て、単なるコード作成や知識だけでなく、自身の作業結果を確認し改善、再実行といったプロセスを回すことが重要なタスクです。
いわば、AIは「質問に答える存在」から、同僚のような「(一緒に)働く存在」に変わり始めている、ということもできます。
このような変化の中において、人間の「AIを使うスキル」の基準も新しくなる必要があります。
いままで「AIを使うスキル」というと、あくまでツールとして自分の能力を最大化できるか?によって測っていたスキルを、これからはAIとの協業のうまさで測る必要が出てくるのかもしれません。
P.S.
↓メルマガの新規登録はこちらから↓
https://48auto.biz/keieijinji/touroku/sp/scenario13.htm
(スマートフォンよりご登録いただけます)
