油揚げと決定木の共通点

油揚げと機械学習手法である決定木。一見相いれない両者ですが、実は共通点がありそうでした。

  

油揚げって本当に便利ですね!

家では買ってきた油揚げを刻んだ状態で冷凍保存しているのですが、これが本当に大助かりなのです。

なんだか味が足りないなあと思った菜っ葉のお味噌汁に投入すれば、ふんわり香りが広がって。

味がぼやけるなあと思ったピーマンのお味噌汁に投入すれば、味にアクセントが加わって。

お味噌汁を作るとき。

特に少し残ったお野菜を消費したいときの適当お味噌汁を作るときに、本当に重宝しています。

油揚げを開発した人にお礼状を書きたいくらいです。

 

ところで、機械学習でもそんな油揚げのような便利な手法が(いくつか)あります。

例えば基礎統計量の計算。

数値のデータを扱うとき、平均や分散、データの分布をみることは欠かせません。

他にも例えば言語データを見るのであれば、どんな単語が良く出現しているのかを見ることも欠かせませんし、カテゴリのデータであっても、どんな全体傾向になるのかを把握することで、様々な仮説を立てることができます。

もう少し機械学習らしいところで言えば、決定木をもう少し複雑にした、勾配ブースティング決定木と呼ばれる手法が、かなり便利なものとして知られています。

 

まず決定木は、まるで幹から枝分かれするように、Aならば左、Bならば右、というルールを繰り返して、最終的な予測をする手法です。

そして勾配ブースティング決定木は、一本の木でモデルを作るのではなく複数の木を学習する手法です。

さらに、複数の木がうまく協力できるように、お互いが別の強みを持つように学習していくことで、様々な種類のデータに対応することができます。

まさに、機械学習の便利屋さんです。

もちろん深層学習など他の手法の方が精度が良いことも多々ありますが、それでも適用範囲を考えればピカ一です。

 

ちなみにこの手法、現在作った木でうまく対応できない問題に対して適用できる木を次に学習して…と繰り返していくのですが、

まるで現在会社にいない人材をピンポイントで採用する、ジョブ型採用に近いような気がします。

…そんなことを思うのは私だけでしょうか。

同意してくださる方がいらっしゃることを祈ります。

 

 

P.S.

素敵なクリスマスをお過ごしください☆ミ

 

P.P.S.

↓メルマガの新規登録はこちらから↓

https://48auto.biz/keieijinji/touroku/sp/scenario13.htm

(スマートフォンよりご登録いただけます)

 

 

 

Who is writing

大学にてデータサイエンスを学ぶ傍ら、多くの人にデータ分析の面白さを伝えたいと日々奮闘中。