世界を目指すIT少年の学習記録

世界を股にかけITを武器に暮らしていく!ことを目指す少年の備忘録。本のレビュー、勉強したこと、学んだことなどを記録していきます。

基礎からのベイズ統計学は神本だと思ったよ 8月振り返り

ちょっと並読しすぎている感、、

とりあえず、MCMC Yeahとか思っていた私は間違いだったようだ。おそらくね。

 

8月読んだ本

読んだ本リスト

4月 8冊 

5月 5冊

6月 4冊

7月 4冊

8月 4冊

平均 5冊⇒年間60冊程度見込み

 

 

 読んだ本

 

状態空間時系列分析入門

状態空間時系列分析入門

 

 おススメ度:4

時系列勉強するならまず沖本本 みたいな流れあるけど、個人的にはこっちのほうがいいんじゃないかなって思う。

状態空間モデル っていう名前だけ聞くと、なんか超むずそー って感じだけど、実際は観測するデータの裏側に実は真の状態があって、それをきちんと推測していくことが大事なんやで。っていう話なだけです。

 

毎回ですが、TJOさんのブログのこの以下の図が最もよく状態空間モデルを表していますね。(まあよくこの図で説明されますけどね)

f:id:kenjioda:20160828202159p:plain

参照 

Rでベイジアン動的線形モデルを学ぶ(2):まずは状態空間のコンセプトと基本のローカルレベル・モデルから - 六本木で働くデータサイエンティストのブログ

 数式的には全然難しくないので、まず時系列やるならこの本がいいんじゃないかなとか思ったり。

 

基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門

基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門

 

 おすすめ度:5

今まで読んだ統計系の本の中でも最も良い本のうちの一つな気がする。

理由は三つ

  1. 文系の先生が書いたので、理系本によくあるここは知ってるっしょwみたいなノリで式展開が飛ばされがちなことがなく、非常に丁寧
  2. 章末問題がちゃんとしていて、しかも答えもちゃんとある。理系本は答えないとか、答え適当とかよくあるけど、正直僕のような答えないとわかんないよぉ~ えーん みたいなアホには必要なんです。
  3. コードの解説もあってしっかり実装できる。まあ最近は理論だけで実装例がないという本は減ってきたけどね。とりあえずこの本はRstanのコードの解説なども丁寧

 

内容は

統計基礎→ベイズ推定→MCMCMCMCの実例

って感じです。そしてMCMCの各サンプリング手法がきちんと解説されていて良いです。RstanでMCMC、BugsでMCMCとりあえずやってみた→サンプリング手法についてよくわかってないまま使うの気持ち悪い!

って方は読むと良いかと。

メトロポリス・ヘイスティング法は久保本(データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学))にも書いてあったと思いますが、Rstanに実装されているハミルトニアンモンテカルロ法(厳密にはNUTS:No-U-Turn Samplerが実装されてるのかな?)が理解できます。

ハミルトニアンモンテカルロ法は物理出身者は特にわかりやすいんじゃないかな。

 

 

英文履歴書の書き方と実例集

英文履歴書の書き方と実例集

 

 おすすめ度:3

ということで、もともと日本で一緒に起業しようとしていたアメリカの友人が、スタンフォード大のPh.D課程にいて(人工知能専攻かな)

よくわからんがスタンフォード発のスタートアップにやや関わることになったので、そのためにVCに送るレジュメを書いたんご!って感じですね。

 

案外ちゃんと学んだことなかったんで、基本レジュメ書くときは以下のようなことを気をつけるんだってさ。

  1. 主語入れたりしないよーとか I managed the team,,,ではなくManaged the team,,,
  2. 過去行ったことは過去形、現在やっていることは現在形
  3. まどろっこしい書き方しない。よくある日本人の例では I think that,,, I might,,,などと書くけど、そんなじゃなくて能動態で書け

とかかな。知っていることも多かったけどさ。

 

なぜ、あなたの仕事は終わらないのか スピードは最強の武器である

なぜ、あなたの仕事は終わらないのか スピードは最強の武器である

 

おススメ度:4

社内の尊敬する先輩にいただいた。一瞬で読み切った。

仕事の8割は最初の2割の時間に終わらせる!

界王拳モードを発動させる気持ちで超最強集中モードを作り出せ!

みたいな本。w 

 

 読んでいる途中本

 Kindle Unlimitedな子たち

知っている人多いと思うけどKindle Unlimitedパイセンやばいっすね。特にマーケ系の本が充実しているとかで、登録した。

amzn.to

 おすすめ度:2~3

正直うーむな感じかも。コンマってまあ正解ないから仕方ないのかもだけど、なんというかすごい感覚論みたいになっている気もしなくもない。

このシリーズは他が良いからそのギャップかな。

 

夢をかなえるゾウ

夢をかなえるゾウ

 

 おすすめ度:5

色々な人に勧められるので、読み始めたけど面白いね。なんか内容がいわゆる啓発本Yeahみたいなノリじゃなくて、小説チックでおもろい。

 

 ちょっとまだあんま読めてない。。

 

 読んでいる本リスト

文章は接続詞で決まる (光文社新書)

文章は接続詞で決まる (光文社新書)

 

 おススメ度:4

このブログを読めばわかると思うけど、基本何言っているかわかんねぇ みたによく言われるんで、もっとわかりやすい文章話せ&書けや!ということで先輩に教わった。

まだ一ミリも自分に落としこめていないので、しっかり読んでまとめて落とし込む。

(それならもっとましな文章書けよ)

 

 おススメ度:5

衝動買い。お酒好きだけど、意外と知らないかもなぁと思って買った。面白いね。

 

ハッカーと画家 コンピュータ時代の創造者たち

ハッカーと画家 コンピュータ時代の創造者たち

 

 引き続き。発想力と洞察力は神ですね。この人はやっぱ。

 

 

Rによるベイジアン動的線形モデル (統計ライブラリー)

Rによるベイジアン動的線形モデル (統計ライブラリー)

 

 おススメ度:1~5(レベルによる)

一言でいうと苦行。読むのがつらい。がためになる本。正直理解度50%くらいで読み進めている感。

だけど最近思うのは、実務で使えるレベルと研究者のレベルは理解度に圧倒的な差があること。

実務家はある程度理論的背景、メリデメを理解して使えればよい。

対して研究者は、理論的背景をほぼ100%把握し、式の表面的な意味に限らないところまで理解し、理論の欠点を把握しそれを発展させる。必要がある。

もしかしたら、理論屋さんと工学よりの人は全然違うかもだけど。工学は実務に近いのかもね。

 

 

なぜこれを読み始めたかといえば、単純に

Rstanが時間がかかりすぎる&その割に収束しない

という問題に突き当たったから。(まあモデルが悪いんでしょうけど)

 

TJOさんが以下記事内で述べていることに、激しく同意という感じです。

そもそもいちいちモデル式立ててStanコード書いて、Stan上で毎回C++コンパイラ走らせて、収束しないand/or推定結果が妥当でないと思ったらやり直す、というのを繰り返していたらあっという間にジジイになってしまうので

tjo.hatenablog.com

 以下は理解度50%の前提で話しますので違ったら指摘してください。

そもそもMCMCやらずに、時系列の場合はカルマンフィルタというものを使うと、点推定だけど断然早いっすよ。という話と(ただし使用できる場面は限られる)

時系列みたいにどんどんデータが追加されているものは毎回毎回MCMC走らせるみたいなことになっちゃうので、逐次できる逐次モンテカルロ法というものが適しているらしいです

 

ってなわけで苦行だけどこの本を読むことはためになりそうだね

という次第です。

今月中に理解度浅くても一旦最後までは読み切りたい。そんで実装してみたい。

 

以上。

 

 

来月もがんばろ。