どうも、カタミチです。
今日も「ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版」(以降、『当書』)で勉強していきたいと思います。
代表的な手法(教師あり学習)
さて、教師あり学習の具体的な方法について見ていくことにしましょう。本書で紹介されているのは7つです。この記事では最初の2つを見てみますかねー。
線形回帰
まずは線形回帰。統計でも用いられる手法で、最もシンプルなモデルの1つです。
データの分布があったときに、そのデータに最も当てはまる直線を考えるというものです。なんか、こんな感じのやつです。
この直線は回帰直線と呼ばれるもので、新しくx軸のデータが来た際に、その直線上のyの値を返すことで予測する事ができる…というものですね。統計検定のときやりましたよ、これは。単回帰分析ってやつですね。徐々に思い出してきました。
ちなみに、上の例は2次元ですが、もっと次元が大きくても大丈夫らしいです。説明変数が増える重回帰分析ってやつですね。図ではちょっと表現しにくくなって行きますが(汗)
こんな時に使えるよ!という活用例を書いておいたほうが覚えやすそうなので書いておきますかね。
・身長のデータから体重を推測したい。
・駅からの距離、部屋の広さから、家賃を推測したい。
ロジスティック回帰
次にロジスティック回帰。線形回帰の分類問題版…だそうです。
…えーっと、分類問題ってなんだっけ(もう忘れてる)
連続値を予測する問題のことを回帰問題といい、離散値を予測する問題のことを分類問題といいます。
はい、離散値…つまり、飛び飛びの値を取るものを予測するのが分類問題ですね。名前に「回帰」と付いてるけど回帰問題じゃないよ!というのがポイントのようです。…なぜそんな名付けをしてしまったのか(ふむ)
シグモイド関数という関数をモデルの出力に用いるそうです。
…まずい、そろそろ実践やらないとイメージつかなくなってきました(汗)
与えられたデータを、シグモイド関数を用いた確率算出によって2種類に分類する方法だそうです。閾値を用いて、算出された確率をどっちに分類するかを調整できるみたいですね。基本的には閾値は0.5に設定するようです。50%…って事で真ん中ですね。
ウマたんさんという方のYouTubeの動画で、少し理解を補強してみました。
【9分で分かる】ロジスティック回帰分析を分かりやすく解説! - YouTube
まだまだ掴みきれてはいないですが、動画は理解が進みますね。積極的に活用していきたいです。
ちなみに、シグモイド関数の代わりにソフトマックス関数を用いれば、2種類ではなくもっとたくさんの種類の分類が行えるようです。
活用例は…
・総勉強時間、模試の点数から大学に合格するかどうかを推測したい。
・体積、重さ、硬さから、それが「メロン」なのか「みかん」なのか「くるみ」なのかを推測したい。
って感じですかね。
ということで
本当は、3つ目の手法までやろうと思ったんですが、力尽きました(汗)
しかし、内容が徐々に地に足が付き始めてきましたね。どんな場合にどんな手法が使えるのか?について、しっかり学んでいきたいと思います。
ではまた。
勉強に使ってる書籍はこちら↓
深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版