「みんなに人気の〇〇です!」

「ベストな選択!」とウェブサイトは言うのですが、果たして本当にそうなのでしょうか。機械学習で推定できるか考えてみました。

  

「ユーザに人気の画像です!」

メルマガやブログ用に画像を探している時。

自分がイメージする画像が得られるようにキーワードを入力し、出てきた画像を最初から眺めて「これだ!」というものを探すのですが、多くの場合に上のような言葉が記載されています。

恐らく「目を引くために、あなたの選択は正しいですよ!(だからダウンロードしてくださいね)」ということを言いたいのだとは思いますが、続く言葉に、思わず懐疑的になってしまいます。

「ベストな選択!」

果たして本当にそうでしょうか。

 

もちろん、私はこの画像サイトの推薦アルゴリズムを知りません。

もしかするとその画像を見たときの人間の脳がどう反応するかをモデル化していて、本当に「目を引く」画像になっているのかもしれません。

ただ、どうもそうは思えないのです。

その根拠は「ベストな選択」という言葉と「需要が高くユーザに人気がある」という言葉が並べられているということです。

ここでいうユーザはあくまでこの画像サイトのユーザなので、画像を使う側のお話です。

一方、私が欲しいものは、私の文章を読んでくださる方の目を引く画像です。

文章を書く側が「良い!」と思うものと、文章を見る側が「良い!」と思うものが一致しているとは限りませんし、むしろ違っていることが多いのではないかという気すらします。

 

であれば、本当にベストな画像というのはどうすればわかるのでしょうか?

機械学習が使えないか、考えてみます。

例えば各画像を利用したサイトの閲覧数を見て、多くの人に閲覧されている画像が「ベストな画像」になるのでしょうか。

このモデル化にはいくつか問題があります。

・閲覧数は画像だけに依存しない

むしろ、文章を書いた人や広告の有無、知名度などの方が影響が高そうです

・そもそも使われている回数が少ない画像についてはデータが取れない

借りに取れたとしても、利用数が少ない場合には「たまたま」閲覧数が多い/少ない場合の影響が大きくなってしまいます

・新しい画像については全く考慮できない

他にもいろいろ問題がありそうです。

 

...他の手法も考えてみたのですが、うまく思いつけません。

一見万能に見える機械学習ですが、あくまで機械学習は手元のデータの構造を明らかにするものでしかない、ということを考えると、やはりデータの収集や問題設定がとても重要であるようです。

 

P.S.

 

↓メルマガの新規登録はこちらから↓

https://48auto.biz/keieijinji/touroku/sp/scenario13.htm

(スマートフォンよりご登録いただけます)

 

 

Who is writing

大学にてデータサイエンスを学ぶ傍ら、多くの人にデータ分析の面白さを伝えたいと日々奮闘中。