スモール・データ活用ラボ

普通のビジネスマンがいろんな勘違いでデータサイエンス部門へ異動になり四苦八苦。自己学習で学んだことをブログにまとめます。

ビッグデータ vs スモールデータ

昨年あたりからビッグデータという言葉が氾濫するようになりました。関連業界内ではもっと前から言われていたと思いますが、マス的に広がったのはこの1~2年でしょうか。統計やR、機械学習に関する書籍も乱立するようになりました。

ビッグデータというと単に大量データを指すのではなく、大量、多様、高頻度なデータのことを意味するようです。ITやネットワークの発展で、こうしたデータが蔓延しているから活用しよう!…という話がメジャーになりつつあります。例えば、ビッグデータと言えば、電子マネーによる購買データや、Web広告に関するデータ、TwitterなどのSNSデータなどが連想されます。確かにこうしたデータを活用できれば、「何か」新しいことができそうな予感がしますね。

しかし、上に挙げたようなデータは一部の企業が有するデータであり、そう簡単に入手することはできません。また、仮にデータリセラーに高額を払って入手したとしても、「どうやって活用して元を取るのか?」ということを考えても、多くの企業はピンとこないのではないでしょうか。私も異動前の職場の同僚に「データ分析してるんだよ」と言っても、それ美味しいの的な反応が返ってくる程度です。多くのビジネスにとっては、ビッグデータバズワードに見えるかもしれません。

しかし、元ビジネスマンとして、

   データ・サイエンスをバズワードとして片付けるのはもったいない!

と思います。データビジネス最先端で扱う「ビッグデータ」がなくても、どのビジネス現場にもあるありふれたデータ…いわばスモールデータを上手く使うことで、仕事がもっと楽になるのではないかと思っています。データ・サイエンスに詳しい方には笑われるかも知れませんが、現職場に異動し、同僚が機械学習を操る姿を見て「魔法使いかよ!」と何度思ったことか…。

ビジネスデータの「分析」は実は古くからあるテーマなのですが、オープンソースであるRが登場して統計的処理が手軽に行えるようになったり、機械学習が実用レベルになったりしたことで、より身近になってきたと思います。また、仕事の多くがITシステムを利用するようになり、売上や在庫情報、クレーム内容といった情報が電子化されているというのも大きな要素です。

そこで、私自身、身近にあるデータをもっと上手く使うための勉強をしています。なので、このブログではビッグデータというより、スモールデータの活用を念頭において進めていこうと思います。