正規化(Normalization)
正規化(Normalization)は、データの値を一定の範囲(多くは0〜1)に変換する前処理方法です。
これは、特徴量のスケール(大きさ)が異なる場合、機械学習モデルが偏った学習をするのを防ぐために行われます。特に距離ベースのアルゴリズム(K近傍法、K-meansクラスタリングなど)やニューラルネットワークでよく使われます。
正規化は外れ値の影響を受けやすいという欠点があります。最大値や最小値が極端に大きい(小さい)と他のデータが圧縮されてしまうため、外れ値除去やロバストなスケーリング手法(Robust Scaler)と組み合わせることもあります。
正規化(Normalization)関連用語
正規化(Normalization)に関連する単語は以下の通りです。
- 最小最大正規化(Min-Max Normalization)
- 標準化(Standardization)
- スケーリング(Scaling)
正規化(Normalization)やさしい解説
正規化(Normalization)は、「データを0〜1の間におさめる作業」です。
例えば、AIにテストの点数(0〜100点)と身長(150〜180cm)を渡すと、数字の大きさが全然違います。そこで、それぞれのデータを「最小の値を0、最大の値を1」にしてそろえます。
これでAIは「点数」と「身長」を同じくらいの重要度で見てくれるようになります。
AI関連の用語集【まとめ】
AI関連の用語集が気になる方のために、用語集一覧を作成しました。AIに関する学びを深めたいとお考えの方はぜひご覧ください。
\AIの導入・開発・相談なら【クラベルAI】に相談しよう!/