目次
正規分布(Normal Distribution)
正規分布(Normal Distribution)は、平均値をてっぺんに持つ左右対称の釣鐘型の分布です。山の高さの中心が平均、横方向の広がりを決めるのが標準偏差(ばらつきの大きさ)。山が細いほどデータは平均の近くに集まり、山が広いほど平均から離れた値もよく出ます。
実務で便利なのが「68–95–99.7 則」。平均から標準偏差1つぶんの範囲に約68%、2つで約95%、3つで約99.7%のデータが入ります。これで「どれくらい珍しい値か」を素早く見積もれます。
正規分布がよく現れる理由は、たくさんの小さな影響が足し合わさると、結果がこの形に近づきやすいからです(測定誤差、身長、テストの合計点など)。この性質のおかげで、統計や機械学習の多くの手法が正規分布を前提に設計されています。
分析では値を標準化して、平均から何個分の標準偏差だけ離れているか(Zスコア)で比べます。これにより、単位や尺度が違う指標でも同じ物差しで評価可能。機械学習では、回帰の誤差を正規とみなすと二乗誤差を小さくする方法が理にかない、時系列推定ではカルマンフィルタがうまく働く、クラスタリングでは「正規の混ぜ合わせ」で複雑な分布を表せる、など実務面の恩恵が大きいです。
ただし、すべてが正規とは限りません。歪みが強い、外れ値が多い、裾が重いデータでは、変換(対数変換など)やロバストな方法、別の分布(たとえば t 分布)を検討しましょう。
正規分布(Normal Distribution)関連用語
正規分布(Normal Distribution)に関連する単語は以下の通りです。
- 標準正規分布
- 中心極限定理(CLT)
- ガウス混合モデル(GMM)
正規分布(Normal Distribution)やさしい解説
テストの点みたいに「真ん中の人がいちばん多く、両端は少ない」形の分布が正規分布。山のてっぺんは平均点、山の広がりはばらつき(標準偏差)を表します。
平均から1つぶん広がったところまでにだいたい7割、2つぶんでほぼ全部(約95%)が入ると覚えると便利。点数を「平均からどれだけ離れているか」で表すZスコアに直せば、いろんなテストを同じ物差しで比べられます。
AI関連の用語集【まとめ】
AI関連の用語集が気になる方のために、用語集一覧を作成しました。AIに関する学びを深めたいとお考えの方はぜひご覧ください。
\AIの導入・開発・相談なら【クラベルAI】に相談しよう!/

