今勉強していること
職場でデータ分析の仕事をしているとはいえ、かなり偏ったタスクをこなしてきたために、土台となる基礎が安定していないのが悩みです。とても、自分のことを「データ・サイエンティストだ!」ということなどできません。
そのため、今更感はあるのですが、もう一度古典的な統計学を学び直しているところです。単にデータを機械学習につっこんだり、適当に重回帰分析をするのではなく、例えば、
- 各種検定手法はどのように選択し、どのように応用するのか。
- 統計モデルはどのように組み立て、チューニングしていくのか。
- テキストマイニングの前処理ではどのようなことに気をつける必要があるのか。
ということを、基本的な参考書を元に勉強しています。つまり、統計的なものの見方をもう一度固めているところです。
しかし、工学系の出身のため、数式だらけの基本書を読んでも、サッパリ頭に入ってきませんしモチベーションも上がりません。やはり、「どんな風に役に立つのか?」ということがクリアに分からないと何とも面白くなありません。しかも、ビジネス経験の方が長いので、商売目線(とくに製品マーケティング的な話が好物)での旨味を探しがちです。
そんな風に思いつつ、よいテキストはないかと探してきました。理想は、ビジネス的な観点で語られていて、実ビジネスを思わせるデータを使いながら学べる本です。なかなか見つけることができませんでしたが、最近よい本が幾つか出版されてきました。
もう、タイトルからしてど真ん中の本でした! データを触りながらビジネス視点でのデータ分析を学べる本です。しかも、Web/ソーシャル業界は、自分の属する業界とは少し経路が違うので、いろいろと参考になりそうです。各種事例のデータを触ってトレースしつつ、勉強していく予定ですが、このブログでも幾つか紹介していきたいと思います。
また、統計学の基礎勉強をやり直しているところですが、参考にしている本を以下にあげます。主に「統計モデリング」に関する本です。
データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)
- 作者: 久保拓弥
- 出版社/メーカー: 岩波書店
- 発売日: 2012/05/19
- メディア: 単行本
- 購入: 16人 クリック: 163回
- この商品を含むブログ (19件) を見る
実務でも参考にさせていただいています。順を追って統計モデルを学ぶことができます。仕事で使ったときには、とにかく時間がなくてつまみ読みしてしまったので、もう一度通して読んでいるところです。
- 作者: Michael J.Crawley,野間口謙太郎,菊池泰樹
- 出版社/メーカー: 共立出版
- 発売日: 2008/05/08
- メディア: 単行本
- 購入: 53人 クリック: 2,292回
- この商品を含むブログ (32件) を見る
装丁は地味ですが、とても勉強になります! 統計モデルの構築方法がとても丁寧に書かれていて、眼から鱗的なこともあり、過去の過ちを認識して汗がでたり…。A4版でなければ持ち歩きたい。
最後に青木先生の本を。統計手法で詰まったら、とにかく青木先生のWebページ(統計学)を見よ!と先輩に言われていました。そこで、数年前にこの本を購入したのですが、初めは自分の理解が追いつかず…。今改めて読んでみると、すごい本だということが分かりました。統計モデルを扱う上で抑えておかなければならないことが、ぎゅうぎゅうに詰まっています。
統計の専門家の方は当たり前だと思っていることでも、私のようにキャリアの途中から統計に関わることになった人間にとっては、ものの見方や注意すべきことがサッパリ分からないということになってしまいます。そういった意味で、上に挙げた3冊はとても丁寧に指導していただける「先生」のような本で、大変感謝しています。
このような基礎が完成したら、再びベイズ関連に進みたいと思っています。(ベイズは実務でも使用していますが、網羅的な理解に乏しい)
それなりにボリュームがありますが、基礎固め頑張ります!