スモール・データ活用ラボ

普通のビジネスマンがいろんな勘違いでデータサイエンス部門へ異動になり四苦八苦。自己学習で学んだことをブログにまとめます。

何をしている人?

自己紹介を少し。

現在、私は某企業のデータ・サイエンスに関連する部門に所属して、日々データと格闘しています。

もともと統計学とかデータ分析を専門に学んだ経験はなく、今の部門に異動してから仕事を通じてデータ・サイエンスを学ぶことになりました。異動前は、普通のビジネスマン(SE)でした。SEといっても、コーディングなどはほとんどせず、製品の企画やプロマネ、プリセールス中心の日々を送っていました。

しかし、あるときにデータサイエンス部門に異動になり職種もチェンジ。いろんな人の、いろんな勘違いが重なった結果でしたが、以後は激動の日々を過ごすことになりました。何せ当時の私の技術スペックは…

  • トウケイガク何それ?状態。工学系出身だけど、統計学の講義は記憶なし。
  • ITツールといえば、パワポとエクセルと秀丸! 設計書は全部エクセルだよね。
  • コーディングは学生以降ほとんど経験せず。新人の頃にCOBOLを触ってた。システムはif-thenの組み合わせ(=ルールベース)という認識。

…だったのです。自宅の本棚にはマネジメントや経営戦略の本が並び、技術書はまったくないという状況でした。

それが異動になってから、Perlでテキスト処理をし、英語の論文を読み、Rでデータ分析をやることになりました。更に、言語処理や機械学習も必要になりました。こうさらっと書くと何でもないようなことに思えますが、異動してすぐの頃は「現代にタイムスリップした江戸時代の農民」の如く、強烈なカルチャーショックを受けたのでした。(今でも慣れきっていません…)

 たった20行程度のPerlの魔法のようなコードを読むのに1週間かかり、スクリプト言語正規表現のパワーに驚き、初めて聞く「ゆーい差」という言葉に戸惑う日々。。気がつくと、統計学の本やオライリーの技術書に埋もれていました。

それから数年が経過し、ようやくデータ・サイエンスを楽しめるようになってきました。また、元ビジネスマンの立場で考えると、「この手法はビジネスに使える!」と思うことも多々ありました。そこで、ビジネスとデータ・サイエンスの両方の経験を活かし、自分の勉強も兼ねつつ、このブログを書くことにしたのです。