目次
モンテカルロ木探索(Monte Carlo Tree Search)
モンテカルロ木探索(Monte Carlo Tree Search)は、ゲームや意思決定の問題で、「最善の手」を見つけるための探索アルゴリズムです。
特に囲碁や将棋など、選択肢が膨大な場面で有効で、AlphaGoでも使用されたことで有名です。
モンテカルロ木探索の特徴は下記の通りです。
-
完全な読み切り(全通りの探索)が困難な問題に対して有効
-
計算資源に応じて性能が上がる(「思考時間」が長いほど強くなる)
-
ランダムにプレイアウト(試し打ち)して「良さそうな選択肢」を見つける
モンテカルロ木探索(Monte Carlo Tree Search)の4ステップ(基本ループ)
-
選択(Selection)
→ すでに探索済みの木から、次に探索するノードを選ぶ(例:UCB1でバランス調整) -
展開(Expansion)
→ 新しい選択肢(ノード)を木に追加する -
シミュレーション(Simulation)
→ そのノードからランダムにゲームを最後までプレイして勝敗を見る(モンテカルロ法) -
バックプロパゲーション(Backpropagation)
→ シミュレーション結果(勝ち・負け)を親ノードに伝えて評価を更新
このプロセスを何千回、何万回と繰り返して、最も勝率が高い選択を見つけます。
モンテカルロ木探索(Monte Carlo Tree Search)関連用語
モンテカルロ木探索(Monte Carlo Tree Search)に関連する単語は以下の通りです。
- 状態空間(State Space)
- 探索木(Search Tree)
- UCB1(Upper Confidence Bound)
モンテカルロ木探索(Monte Carlo Tree Search)やさしい解説
モンテカルロ木探索(Monte Carlo Tree Search)は、「どの選択肢が良さそうか、試しに何回もシミュレーションしてみる方法」です。
例えば、遊園地で「どのアトラクションに行くのが一番楽しいか」を決めたいとします。
全部行く時間はないけど、いくつか試してみて、一番よかったところにまた行くような感じです。
AIもこれと同じで、「この手を打ったらどうなるか?」をランダムに何度も試して、「勝てそうな手」を選んでいくわけです。
AI関連の用語集【まとめ】
AI関連の用語集が気になる方のために、用語集一覧を作成しました。AIに関する学びを深めたいとお考えの方はぜひご覧ください。
\AIの導入・開発・相談なら【クラベルAI】に相談しよう!/