確率・統計の基礎まとめ
E資格試験や機械学習の基礎に必須となる、代表的な分布とベイズの定理を整理しました。
直感的なイメージ+数式で理解を深めましょう。
目次
■ ベルヌーイ分布(Bernoulli distribution)
- 概要: 「成功」か「失敗」かの 2値だけ をとる確率分布。
- 例: コイン投げ(表=1, 裏=0)
確率質量関数:
$$
P(X=x) = p^x (1-p)^{1-x}, \quad x \in {0,1}
$$
- (p): 成功(1)の確率
- (1-p): 失敗(0)の確率
平均・分散:
$$
E[X] = p, \quad Var[X] = p(1-p)
$$
語呂合わせ: 「ベルは2音(におん)=0か1か」
図解イメージ: 🎲 コイン(表=1, 裏=0)
■ マルチヌーイ分布(Multinoulli distribution / Categorical distribution)
- 概要: ベルヌーイ分布を 多クラスに拡張 したもの。
- 例: サイコロ(1〜6の目のどれか1つが出る)
確率質量関数:
$$
P(X=i) = p_i, \quad i \in {1,2,\dots,K}, \quad \sum_{i=1}^K p_i = 1
$$
- ベルヌーイとの関係: K=2の場合はベルヌーイ分布と同じ。
語呂合わせ: 「マルチでサイコロ」
図解イメージ: 🎲 サイコロ(6つの面のどれか1つ)
■ 正規分布(Normal distribution / Gaussian distribution)
- 概要: 自然界や人間の測定データでよく現れる「釣鐘型」の分布。
確率密度関数:
$$
f(x|\mu,\sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
$$
- (\mu): 平均(分布の中心)
- (\sigma^2): 分散(広がり)
特徴:
- 中心極限定理により、多くの独立確率変数の和が正規分布に近づく
- 統計学・機械学習で最重要の分布
語呂合わせ: 「正しい釣鐘(正規分布)」
図解イメージ: ⛰️ 山型グラフ(平均を中心に左右対称)
■ ベイズの定理(Bayes’ theorem)
- 概要: 条件付き確率を逆に計算できる公式。
式:
$$
P(A|B) = \frac{P(B|A) P(A)}{P(B)}
$$
- (P(A)): 事前確率(仮説Aが起きる確率)
- (P(B|A)): 尤度(Aが起きたときBが観測される確率)
- (P(A|B)): 事後確率(Bを観測した後にAが起きている確率)
- (P(B)): 周辺確率(Bが起きる全体の確率)
直感例:
病気の検査 → 「検査が陽性だったときに、実際に病気である確率」を計算できる。
語呂合わせ: 「ベイ検査で確率更新」
図解イメージ: 🧪 検査結果 → 事前 → 観測 → 事後の更新
■ まとめ(暗記カード風)
- ベルヌーイ=コイン → 2値
- マルチヌーイ=サイコロ → 多値
- 正規=釣鐘 → 中心
- ベイズ=検査 → 更新
■ 株式分析アプリでの応用例
- ベルヌーイ分布: 株価が「上がる / 下がる」
- マルチヌーイ分布: セクター分類や格付け(A/B/C…)
- 正規分布: 株価変動やリターンの近似
- ベイズの定理: ニュースを見た後の予測確率を更新
コメント