chatGPTマスターを目指してvol.76 AIが”社員”として働く日

「AIを使いこなす」という言葉の定義が、ガラッと変わるかもしれません。

  

あなたのデスクの隣にいるはずの「同僚」。

いつかその「同僚」として、AIが座っているとしたら。

どのように協業し、分担することができるでしょうか。

 

最近のAI業界では、「どのAIが一番賢いか?」という競争から「どのAIが一番仕事ができるか?」という競争へ変化しつつあります。

「仕事ができる」というのは、「仕事をやり切ることができる」と言い換えることもできます。

先週お送りしたメルマガ

【chatGPTマスターを目指してvol.75 人間にもAIにも求められる「やり切る力」】

https://blog.people-resource.jp/newsletter_chatgpt_vol75/

でご紹介したように、「ゴールまで頑張れるAI」が評価されるようになってきています。

 

これまで生成AIの能力を図るためには、どれだけ難しい問題に正解できるか?という指標が用いられていました。

大学入試レベルの問題を解かせたり、日本でも「AIは大学入試を突破できるか?」という研究が行われていたりします。

一方で、最近のOpenAIが公開したGPT-5.5やWorkspace Agentsの方向性はガラリと変わっています。

重視しているものが「知識」ではなく「実務遂行力」になってきているのです。

実際にGPT-5.5の公式リリースでは、「作業を自律的に進められ」る、「自ら計画を立て」、「作業を進め続け」ると書かれています。

【GPT-5.5が登場 -実務に応える新しいインテリジェンス-】

https://openai.com/ja-JP/index/introducing-gpt-5-5/

 

私たちユーザ視点だと、この変化はどのように映るのでしょうか。

 

例えば従来の生成AIであれば「このコードの意味は?」「この文章を翻訳して」といった単発の質問には強い一方で、業務遂行能力には限界がありました。

私たちが普段仕事で行うような、ファイルを探して情報を集め、データを整形しレポートを作成、報告可能な形にする、といった業務の流れを進めることは、AIにとって非常に困難なタスクでした。

そもそもユーザ側も、そのような使い方は期待していなかった気もします。

 

ところが最近は、このような「一連の流れ」を完遂できるAIが開発されています。

様々なベンチマークも公開されており、例えばSWE-bench Verifiedというデータセットでは、ソフトウェアの不具合を修正させるタスクを解かせています。

訂正してみて実行し、さらなる不具合に対応し、最終的なアウトプットを得る必要があります。

他にも、OSWordという評価では、AIが実際にPC画面を操作してタスクを完了できるか?を測っています。

これらは全て、単なるコード作成や知識だけでなく、自身の作業結果を確認し改善、再実行といったプロセスを回すことが重要なタスクです。

いわば、AIは「質問に答える存在」から、同僚のような「(一緒に)働く存在」に変わり始めている、ということもできます。

 

このような変化の中において、人間の「AIを使うスキル」の基準も新しくなる必要があります。

いままで「AIを使うスキル」というと、あくまでツールとして自分の能力を最大化できるか?によって測っていたスキルを、これからはAIとの協業のうまさで測る必要が出てくるのかもしれません。

 

 

P.S.

↓メルマガの新規登録はこちらから↓

https://48auto.biz/keieijinji/touroku/sp/scenario13.htm

(スマートフォンよりご登録いただけます)

 

Who is writing

大学にてデータサイエンスを学ぶ傍ら、多くの人にデータ分析の面白さを伝えたいと日々奮闘中。