特徴量(Feature amount)
特徴量(Feature amount)とは、データの中から予測や分類に役立つ性質を数値やカテゴリで表したものです。モデルは生データ(文章、画像、ログなど)をそのまま理解できないことが多く、役立つ情報だけを抽出・変換・要約して入力します。
例:テキスト→単語頻度・長さ・感情スコア、画像→エッジ量・色ヒストグラム、表データ→売上の移動平均・曜日・地域ダミー。良い特徴量は、目的変数と関係が強く、冗長でなくリーケージ(未来情報の混入)がないことが重要です。
作成はドメイン知識と統計・信号処理・NLP/画像処理の技法を組み合わせ、スケーリングやエンコーディング、欠損処理など前処理も含みます。
近年は深層学習が自動で表現(埋め込み)を学習しますが、特徴量設計の発想(何が効くか)は依然として性能・説明可能性を左右します。
特徴量(Feature amount)関連用語
特徴量(Feature amount)に関連する単語は以下の通りです。
- 埋め込み(Embedding)
- スケーリング(標準化・正規化)
- ワンホットエンコーディング
特徴量(Feature amount)やさしい解説
写真の「犬らしさ」や文章の「ポジティブさ」を、0〜1の数やいくつかの数字で表した手がかりが特徴量。AIはこの手がかりを見て、「犬だ」「いいね」と判断します。
AI関連の用語集【まとめ】
AI関連の用語集が気になる方のために、用語集一覧を作成しました。AIに関する学びを深めたいとお考えの方はぜひご覧ください。
\AIの導入・開発・相談なら【クラベルAI】に相談しよう!/

