「花粉の飛散が始まりました」と言われて首を傾げた話

曖昧性を持つものについて断定するときは注意する必要があるかもしれません。もし曖昧性をそのまま表現できるとしたら…。

  

今年も花粉の飛散が始まりました!

あなたもそろそろ○○始めませんか…。

 

ある日届いたとある企業からのメールマガジン。

私は首を傾げてしまいました。

というのも、このメールを受信したのは2月も中頃になってから。

一方、私が花粉を感じ始めたのは年末年始ごろ。

確かに私は比較的早い段階で花粉症に悩まされる方であると自覚はしてしますが、それにしても「いまさら…?」と思ってしまったのは無理もないことかと思います。

ちなみに周りを見ても、花粉症に苦しんでいる人はそれなりの数いますし。

なにより、高校生の頃を思い返せば、この時期が大学受験であることを恨んでいた記憶しかありません。

一日も早く、花粉がない木が開発されることを祈ります。

 

ところでこの「花粉飛散時期」には果たして正解はあるのでしょうか。

インターネットで花粉シーズンを調べると、多くの場合、飛散開始時期からピークを過ぎて、最後飛散が終わるまでが濃淡で示されています。

そしておそらく調べて出てくるシーズン一覧表も、その年の気温等によって左右されるに違いなく、つまりは飛散時期を正確に示すことは無理、ということになるかと思います。

加えて、人によって花粉への反応度合いも違います。

少しの量から反応してしまう私のような人もいれば、ピークの時期にほんのちょっと感じる、という人もいるようです。

…心の底から羨ましい限りです。

以上を考えると、花粉の飛散時期を正確に表すことはできず、かつどんな情報も「正解とは限らない」という、とても曖昧な状況であると言えるに違いありません。

 

そんな「正解かどうかわからない」データを扱うモデルが機械学習にもいくつか存在します。

例えば弱ラベル学習と呼ばれる手法では、データに与えられた「正解」ラベルについて「もしかしたら間違っているかもしれない」という仮定の元学習を進めていくことになります。

他にも「ゆらぎ」を確率的に扱うことを可能にするガウス過程といったモデルや、「ゆらぎ」の度合いを推定するモデルも存在しています。

これらを使うことで、例えばビジネスにおける不確実性の評価を行うことができる…というのが利点の一つです。

 

そう考えると、曖昧性を持つものに対して明言してしまうのは望ましくないのでは、という気もしてしまいます。

例えば花粉の飛散時期、人事評価、仕事の最適なやり方。

人や環境によって「正解」が変わるものがたくさんあります。

そのゆらぎをうまく評価してあげることが、マーケティングでも機械学習でも人間関係でも重要なのかもしれません。

 

 

P.S.

特に花粉についてはかなり悩まされているため、目くじらを立て過ぎた感は否めません。。。

メールマガジンの担当者さま、大変失礼いたしました!

 

P.P.S.

↓メルマガの新規登録はこちらから↓

https://48auto.biz/keieijinji/touroku/sp/scenario13.htm

(スマートフォンよりご登録いただけます)

 

Who is writing

大学にてデータサイエンスを学ぶ傍ら、多くの人にデータ分析の面白さを伝えたいと日々奮闘中。