不偏分散(Unbiased Variance)
不偏分散(Unbiased Variance)は、手元のデータから“本当のばらつき(母分散)を偏りなく見積もるための分散の出し方です。
通常は、データの平均からのズレを集めて平均的な散らばりを測りますがその平均値自体も同じデータから作っているため、散らばりを少し小さめに見積もってしまう癖があります。
そこで不偏分散では、その甘さを打ち消すために割り方を少し厳しくする(人数そのままではなく、人数より1だけ小さい数で割る)という約束をします。これをベッセル補正と呼びます。
直感的には下記の通りです。
-
平均を使うとデータの中心をその場で最も都合よく選んだことになりズレの合計が控えめに出る
-
その控えめ分を補うため、計算の最後にひと押しだけ厳しくして、真のばらつきに近づける
この出し方にすると、たくさん同じ作業を繰り返して平均を取ったとき、ちょうど母集団の分散に当たるという良さがあります。統計で「集団全体の散らばりを推定したい」ときの標準的な分散が、この不偏分散です。
豆知識:データが非常に少ないときや、別の目的(たとえば将来の誤差を最小にしたい)では、別の計算方法を使うこともありますが、まずは不偏分散=偏りなく見積もるための分散と覚えておけば大丈夫です。
不偏分散(Unbiased Variance)関連用語
不偏分散(Unbiased Variance)に関連する単語は以下の通りです。
- 標本分散
- 母分散
- ベッセル補正
不偏分散(Unbiased Variance)やさしい解説
クラスの平均点からどれくらいバラバラかを調べるとき、みんなの点と平均の差を二乗して足してから人数で割ると言いたい所ですが平均点もクラスのデータから作った推測なので、少し甘く出てしまいます。
そこで人数より1小さい数(n−1n-1n−1)で割り直すと、ほんとうのバラつきにちょうどよく近づく。これが不偏分散です。
AI関連の用語集【まとめ】
AI関連の用語集が気になる方のために、用語集一覧を作成しました。AIに関する学びを深めたいとお考えの方はぜひご覧ください。
\AIの導入・開発・相談なら【クラベルAI】に相談しよう!/

