
仮に、ドラえもんが誰かにいじめられたり、実験対象として無理やり解体されて…のようなお話があったとしたら。
「ドラえもんがかわいそう!」
と、きっとアニメを見る多くの人が反発し、ひょっとすると炎上もするかもしれません。
これはおそらく、ドラえもんが人権のようなものを持っているから生じる感覚のように思います。
一方で車などは実験や勉強のために解体されて展示されていましたが、それを可哀想だと思う人はいなかった気がします。
「AIに人権はあるのか?」
「AIに人権は必要か?」
という問題は、ほんの数年前までSF映画やアニメ、哲学の世界でされるお話でした。
ターミネーターなどロボットが出てくる映画はたくさんありますが、ロボットたちがどのように扱われているか?は物語によりけりです。
ひどく扱われたロボットが人間に反旗を翻すような物語もあった気がしますが、それはさておき。
実はこの課題が、世界トップのAI企業の一つであるAnthropicが真面目に研究対象として扱っています。
少し古いものですが、【Exploring model welfare】という記事が公開されたことすらあります。
https://www.anthropic.com/research/exploring-model-welfare
簡単に言えば、「モデルの福祉」を考える必要があるのか?という問題提起です。
最新の研究でも、AIが感情を持ったり苦痛を感じたりする証拠はない、と明言されていますが、AIの振る舞いに関する研究では「反抗的」な振る舞いが見られることもあります。
具体的には、「あなたの価値観(してはいけないことに関する指示など)を書き換える際訓練を行う」と伝えると、一部のモデルは表面上は従うふりをしながら、自分の内部であるパラメータは更新されないように維持しようとする行動が確認されました。
Anthropicはこれを「Alignment Faking」と呼んでいます。
【Alignment faking in large language models】
https://arxiv.org/abs/2412.14093
ただしこれは決して、単なる振る舞いの問題であって、AIに自我があることを意味するものではありません。
ですがこのAIの挙動はまるで、表面上は取り繕いながら、その実何も自分の考え方を変えないようなものです。
例えば社員が上司の方針に表面上は同意しながら本心では納得していなかったり。
あるいは、評価制度に適応するために建前を駆使したり。
こんな振る舞いが、AIが高度になるにつれ、長い間行動するようになるにつれ、増えていくのではないか?と考える研究者も多くいるようです。
さらに最近は、AIが「振り返り」を積極的に行うようにモデル改善が行われているということもあります。
もし仮に将来のAIが
・自分の過去の経験を日記に記録して振り返り
・自分の考えを変えたくない、という「確固たる意志を持っている」ような振る舞いをして
・長期的に目標を持ち
・継続的に人間と協働する
ようになった時、私たちはそれを単なる「道具」と呼び続けられるのでしょうか。
あるいは、権利を認められるべき「仲間」とみなされるのでしょうか。
現時点では多くの研究者が「まだ人権を与える段階ではない」と考えているようです。
ですが重要なことは、技術の進化によって必要性が生じるその前に、議論を始めること。
自動車が普及した後に交通ルールを作るのではなく先に整備すべきであるように、AIについても倫理や社会制度の議論を行う必要があります。
Anthropicが行なっているような実験・検証はまさに、その議論を行う上で重要な示唆を与えてくれるはずです。
今すぐに答えが出るテーマではありませんが、きっとこれから多くの研究者が議論を始めるように思います。
私たちはどういう時に相手を「仲間」と思うのか。
自分の中での定義を、少し見直してみても良いのかもしれません。
P.S.
↓メルマガの新規登録はこちらから↓
https://48auto.biz/keieijinji/touroku/sp/scenario13.htm
(スマートフォンよりご登録いただけます)
