まったりAI勉強記

AI(人工知能)について、特にゆかりがあるわけでもない社会人が、まったりとAIについて勉強していく勉強日記です。

【ひとり読書会】ディープラーニングの数学(第1回)

どうも、カタミチです。

さて今日は、ゼロから作るDeepLearningのニューラルネットワーク編に突入…

のはずだったんですが、気になる本を見つけてしまいました。

最短コースでわかるディープラーニングの数学

数学についてはこれまでの勉強でもちょこちょこ出てきていますが、断片的な感じになってしまっています。ここらで「数学」って切り口で勉強しといた方がいいかなー。ということで…

ゼロから作るDeepLearningでの勉強はいったん中断して、この本でディープラーニングの数学の基本知識を勉強をしたいと思います!

ちなみにこの本、発売日は2019年4月11日となっていて「3年くらい前の本かー」とは思いましたが、私が勉強したいレベル…つまり、基本的な数学理論は3年やそこらで変わるようなものではないと思いますので、この本で行ってみたいと思います。

今回は「ひとり読書会」ってタイトル付けて、アツく議論しながらやって行きたいと思います。…ひとりで(議論とは)

この本を手元に持って記事を読んでいただけると、読書会に参加した気分に…なれるかも。(ただし参加者は2人)

 

まえがきと目次

主催者「主催者のカタミチです。第1回読書会、始めまーす。今日は『まえがきと目次』のページをになります。皆さん、事前に読んできましたかー?」
参加者「参加者のカタミチと申します。読んできましたー。あ、やべ、本持ってくるの忘れた。」(茶番)

…ということでひとまず、まえがきと目次の感想から。まず著者がこの本を書いた思いとしてディープラーニングを勉強しようと思った時、初心者向けの全く数学に触れてない本か、逆にいきなり数学バリバリの難しい本のどっちかばっかりやん!」というのがあったようです。その間を埋めてくれる本だと言うことで、期待に胸を膨らませています。

解説の出発点は「高校1年(数Ⅰ)の復習から」というレベル設定のようですが、まぁ問題ないでしょう。ちょこちょこ数学の講義動画なんかも見てたりしますので、きっとついていける…はず。…ところで、今も「数Ⅰ」とか言う言い方なんですねー。私が高校生だった約30年前と変わらないのか(ふむ)

本書全体の構成は、導入編→理論編→実践編→発展編という4部構成のようですね。なぜか唐突にジョジョの奇妙な冒険を思い出しました(なんでやねん)。…さて、それぞれについて簡単に説明があったので見てみました。

導入編

導入編は、機械学習とは?的な部のようですね。宿命のライバルとの出会いがあったりするんですかねー(ありません)

まぁ、さすがにここはサラッと読めるでしょう(ドキドキ)

理論編

理論編が、今回一番私が興味のあるところです。数学の理論が書かれた部ですね。出てくるのは、おおくくりにすると「微分積分」「ベクトル・行列」「指数関数・対数関数」「確率・統計」って感じです。

微分積分」のところは「積分」の項もあったのでちょっと「むむっ」となってます。これまで勉強してきた限りだと、積分を使うことは無かったので、まったく勘所がないです(汗)。まぁしかし、ページ数的には微分の1割にも満たない量っぽいので、そんなもんかー、くらいなノリで行けるかなー(希望的観測)。あと、章が別なんですが、偏微分や全微分といった項もあり、この辺りは正しい理解をしておいた方が良さそうですかねー。

ベクトル・行列」のところは、基本的に大丈夫かなー、と思いながら項を見てたんですが、よく見ると「三角関数」とか「内積」って部分がありました。…ノーマークでした。さらに「コサイン類似度」って項がありました。確かに、G検定でもしっかり出たわこれ…。この辺りはキッチリ勉強し直さないとダメっぽいですね。

指数関数・対数関数」のところは、割と最近動画とか見て勉強し直したんですが、改めて書籍で勉強しようと思います。後半には、シグモイド関数、softmax関数といった、ちょっと実践編寄りの項もあるようなので、実際の使い方も少し触れられるんですかねー。

確率・統計」は…なんか、あんまりページ数割かれてないですね。まぁ、一応統計検定2級持ちとしてはサラッと行きたいところです。

ということで、第2部の理論編はハートを震わせてオーバードライブで疾走したいですねー。

実践編

第3部の実践編では、どうやら理論編で出てきた武器を使って機械学習のモデルを構築するようです。オラオラで行きたいと思います。

「線形回帰モデル」と「ロジスティック回帰モデル(2値分類)」「ロジスティック回帰モデル(多値分類)」「ディープラーニングモデル」の章がありますね。

回帰と分類の基本的なモデルと、ディープラーニングについて…ってことで、それほど多くのモデルを取り扱うわけではないみたいですね。まぁ、この本から知りたいことのほとんどは理論編に詰まってそうなので、その知識を定着させるために機械学習のモデルを使うよー、くらいの気持ちで見てみますかねー。

 

発展編

第4部は発展編。この本を読んだ後の勉強の方向性みたいなものを教えてくれる部みたいですね。CNNとかRNN、LSTMといった、複雑なモデルの話にも触れるようですが、ページ数的には「読みもの」的な雰囲気ですかねー。

ということで

いずれは、避けては通れないであろう数学。この辺りで、基本的なところは押さえておきたいところですねー。

ではまた。