標本分散(Sample Variance)
標本分散(Sample Variance)は、手元のデータ(標本)がどれくらい散らばっているかを表す指標です。各データと標本平均の差(残差)を二乗して足し、データ数 − 1 で割るのがポイント(これをベッセル補正といい、母集団の分散を偏りなく推定するための調整です)。
単位は元データの二乗(円²、℃² など)になり、外れ値の影響を受けやすい性質があります。実務では、散らばりを元の単位で直感的に示すために標準偏差(標本分散の平方根)も併用します。
小例:データ {2,4,6} の平均は 4。二乗残差の和は 8。標本分散は 8/(3−1)=4。
標本分散(Sample Variance)関連用語
標本分散(Sample Variance)に関連する単語は以下の通りです。
- 母分散(Population Variance)
- 標準偏差(Standard Deviation)
- 自由度(Degrees of Freedom)
標本分散(Sample Variance)やさしい解説
クラスのテストの点を思い浮かべてみよう。みんなの平均点から、各自の点数がどれだけ離れているかを調べるとクラス全体のバラつきがわかるよ。離れ具合を二乗して平均に近い値を出したものが標本分散。
ただし平均を同じクラスのデータから作っているので、少しだけ割り方を厳しく(人数−1で割る)して、ほんとうのバラつきに近づけているんだ。数が大きいほど点数がバラバラ、小さいほどそろっている。元の単位に戻して分かりやすくしたいときは、平方根をとって標準偏差を見る。
AI関連の用語集【まとめ】
AI関連の用語集が気になる方のために、用語集一覧を作成しました。AIに関する学びを深めたいとお考えの方はぜひご覧ください。
\AIの導入・開発・相談なら【クラベルAI】に相談しよう!/

