機械学習版リバースエンジニアリング

素晴らしい何かを真似して、素晴らしいものを得る。その行動は機械学習においても研究されています。

この料理美味しい!どうやって作るんだろう…。

身近にある素敵なものは、つい真似したくなってしまいます。

美味しい料理。

素敵な歌。

私はダンスができないので踊りを真似することはほとんどないですが、思えば中学生時代、漢字ドリルのきれいな字を必死で真似したことによって、いまもそれなりに綺麗な字を書けるようになった気がします。

素敵なものを真似することは、とても有用に違いありません。

 

ただ、もちろんすべてのものを真似できるわけではありません。

身近なところで言うと、祖母が美味しく漬けたぬか床は、私の手で再現することはなかなか困難です。

お世話をさぼったことによりちょっと変な感じになってしまったぬか床も、祖母の手にかかればあっという間に元通り。

ひょっとして、祖母の手からはぬか床を美味しくする不思議パワーが出ているのではないか、と疑うほどです。

 

他にも工業の世界ではリバースエンジニアリングが行われていると聞いたことがあります。

素晴らしい製品を再現できるように、その仕組みを調べる。

特に後発的に産業を興そうとするのであれば必須のスキルです。

 

実は、機械学習においてもそのような手法が存在しています。

「逆強化学習」と呼ばれる手法で、プロフェッショナルの行動を真似してしまおう、という手法です。

さらには真似するだけでなく、その行動原理も学習してしまおう、という野望を持った手法でもあります。

 

そもそも強化学習は、碁のものすごい強いAIである、AlphaGoを生んだ技術です。

目指すべきゴールがあるときに、どのような方策を取ればいいか?を学習するモデルになっています。

碁で言えば、最終的に持っている陣地が多くするための方策を学んでいきます。

逆強化学習はその逆なので、予めわかっている方策に対して、それを真似する、あるいは行動原理を明らかにしていく手法です。

仮にその方策がプロフェッショナルによるものであるならば、真似したそのモデルも、学習された行動原理も、どちらも素晴らしいものであるはず、という前提の上に成り立っています。

まだまだ自然言語処理や画像分野と比べて論文は少ない印象ではありますが、これからひょっとして大ブレイクするのでは…。

そんな気がする、面白い分野です。

 

 

P.S.

↓メルマガの新規登録はこちらから↓

https://48auto.biz/keieijinji/touroku/sp/scenario13.htm

(スマートフォンよりご登録いただけます)

Who is writing

大学にてデータサイエンスを学ぶ傍ら、多くの人にデータ分析の面白さを伝えたいと日々奮闘中。