増え行く積読

溜まって行く積読を片付けるように、データも片付ける方法があります。それは皆さまも使ったことがあるだろう〇〇を調べる方法でした。

  

これ、面白そうだから後で読んでおこう!

あ。こっちも面白そう。

…これは自分の研究に関係あるから、絶対後で読まなきゃいけないでしょ。

最近こういうのが流行ってるのかあ…把握しておかないと。

 

インターネット上でお勧めされていたとある本に書かれていた、何かを習慣化するためのとっておきの方法。

小さな習慣を継続する、という取り組みを7月下旬に始めて、はや4か月強が経過しました。

いくつか達成したい「小さな習慣」があるのですが、そのうちのひとつが「論文を読むこと」です。

実はこのチャレンジ以前も挑戦したことがあるのですが、失敗してしまっていました。

その理由はおそらく、「論文を読む」ことがとても大変なことだからでした。

本当はもっと、簡単な習慣から始めなければいけなかったということをこの数か月、実感しています。

というのも、習慣化すべき「小さなToDo」を「論文が載っているサイトを開くこと」という、どんなに疲れていても達成できるような簡単なものに変えたのです。

すると本当に不思議なのですが、「サイトを開く」という行動だけで終わることはなく、気づけば論文の概要や本文を読んでいました。

そして今では基本的に一日数本の論文の概要を読む習慣がつくまでになっています。

「小さな習慣」、恐るべしです。

 

ですが最近、困ったことが出てきました。

というのも、気になる論文が多すぎて、冒頭のように積読ばかりが増えてしまうのです。

せっかく論文を見つけても、きちんと読まなければ身になりません。

一大事です。

その為に今度は「積読を解消する」という習慣をつける必要があるかもしれません。

 

ところで積読というのはある意味、処理されていないまま保存されているデータと言えるかもしれません。

例えば「ひとまず社員全員のTOEICの点数は把握しているけれど、それだけ」という状況があるとします。

全体的にどうなっているのかを把握するためには、データの分析が必要不可欠です。

一方、統計処理を行うことで、保存されているデータを表現するパラメータのみを保存することが可能になります。

例えば(部署ごとの)平均や分散を計算する、といったことができます。

このようにした場合、生データそのものを保持しておく必要がなくなり、メモリの容量を節約できるというメリットも発生したりします。

 

もちろん、点数のような保存が容易なデータであればそのまま保存しておいても問題ないとは思いますが、昨今の機械学習で使われるような大規模なデータでは、いかにメモリを節約するかも重要な問題です。

データをいかに効率的に保存するか、というのも実は、コストを考える上では重要な課題になってくるのかもしれません。

 

P.S.

私が習慣付けのために活用した書籍は「小さな習慣」です。

習慣を身につけることによるメリットだけでなく、習慣を実行することによる意志の力も磨かれるとかなんとか…。

少なくとも私はこの本のおかげで、勉強がはかどるようになりました。

さくっと読める分量ですので、ご興味のある方はぜひ読んでみてください。

(個人的なお勧めであり広告等では一切ありませんのであしからず…。)

 

P.P.S.

↓メルマガの新規登録はこちらから↓

https://48auto.biz/keieijinji/touroku/sp/scenario13.htm

(スマートフォンよりご登録いただけます)

 

Who is writing

大学にてデータサイエンスを学ぶ傍ら、多くの人にデータ分析の面白さを伝えたいと日々奮闘中。