バリアンス(Variance)
バリアンス(Variance)とは、統計学で「データのばらつきの大きさ」を表す指標です。
機械学習においては、モデルの予測結果が学習データの違いによってどれくらい変動するかを示します。
具体的には、同じ問題を解くAIを別々のデータセットで学習させたとき、予測が大きく変わる場合はバリアンスが高いと言えます。
バリアンスが高いモデルは学習データに敏感でノイズまで覚えてしまい、過学習(Overfitting)を起こしやすくなります。
逆に、バリアンスが低すぎる場合はデータの特徴を十分に捉えられず、アンダーフィッティング(Underfitting)になります。
バリアンスは、バイアス(Bias)とともにモデルの性能を左右する重要な要素で、
これらのバランスを取ることをバイアス-バリアンスのトレードオフと呼びます。
バリアンス(Variance)関連用語
バリアンス(Variance)に関連する単語は以下の通りです。
- 分散(Variance)
- 標準偏差(Standard Deviation)
- 過学習(Overfitting)
バリアンス(Variance)やさしい解説
バリアンス(Variance)は「答えのバラつきの大きさ」です。
例えば…
- クラスで同じ計算問題を出したら、人によって答えがバラバラになる → バリアンスが高い
- みんなほぼ同じ答えを出す → バリアンスが低い
AIでは、バリアンスが高すぎると「そのときのデータにだけ合っている答え」しか出せず、新しい問題に弱くなります。
反対に低すぎると「どの問題もざっくりな答え」しか出せません。
AI関連の用語集【まとめ】
AI関連の用語集が気になる方のために、用語集一覧を作成しました。AIに関する学びを深めたいとお考えの方はぜひご覧ください。
\AIの導入・開発・相談なら【クラベルAI】に相談しよう!/