目次
ベルヌーイ分布(Bernoulli Distribution)
ベルヌーイ分布(Bernoulli Distribution)は、結果が2つだけの出来事を表す一番シンプルな確率モデルです。例えば、成功・失敗、ON・OFF、YES・NO、1・0 のような二択の事象を1回だけ観測する状況を想像してください。
必要なのは「成功する確率がどれくらいか」という1つの数(0〜1)だけ。この数が大きいほど1(成功)が起きやすく、小さいほど0(失敗)が起きやすくなります。
この分布の平均は「成功する確率」そのものだと捉えられます。つまり、何度も同じ条件で試すと長い目で見た平均値は「成功の起こりやすさ」に一致します。ばらつきは、成功確率が真ん中(50%)に近いほど大きく、0%や100%に近いほど小さくなります。直感的には、「起こるか起こらないかが拮抗しているほど結果が読みにくい=揺れが大きい」ということです。
実務では、A/Bテストのコンバージョンの有無、メールの開封/未開封、分類モデルの正解/不正解など、二値の出来事をまずベルヌーイで表します。これをたくさん繰り返して「成功回数」を数えると、今度は二項分布になります。成功回数から「成功しやすさ」を推定するのが基本の分析フローです。
機械学習との関係では、二値ラベルの確率を学ぶ ロジスティック回帰 の土台がベルヌーイです。そこで使う損失関数(クロスエントロピー)は、「観測された二値データをもっともらしく説明できるように確率を調整する」手続きだと考えればOK。ベイズ推定では、Beta分布を事前知識として置くと、観測を足すたびに自然に確率が更新でき、データが少ない初期でも安定します。
注意点として、同じユーザー内での相関(完全に独立とは限らない)、計測の定義ブレ(分母の数え方)などで推定が歪むことがあります。必要に応じて層別・階層化やデータ品質の見直しを行い、二値化の境界や観測条件を明確に保つことが大切です。
ベルヌーイ分布(Bernoulli Distribution)関連用語
ベルヌーイ分布(Bernoulli Distribution)に関連する単語は以下の通りです。
- ベルヌーイ試行
- 二項分布(Binomial)
- ロジスティック回帰
ベルヌーイ分布(Bernoulli Distribution)やさしい解説
コインを投げて「表か裏か」を記録すると結果は2つだけ。これと同じで、ベルヌーイ分布は「起きる(1)か起きない(0)か」を表すためのルールです。たとえば「当たる確率が30%」なら、1が出る確率が0.3、0が出る確率が0.7。何回も繰り返すと当たった回数の合計は二項分布というルールに従います。
AI関連の用語集【まとめ】
AI関連の用語集が気になる方のために、用語集一覧を作成しました。AIに関する学びを深めたいとお考えの方はぜひご覧ください。
\AIの導入・開発・相談なら【クラベルAI】に相談しよう!/

