今度はAIが「直観」を学習 ポーカーでもプロに圧勝

1997年にはAIがチェスで人間のプロに勝利し、2010年には将棋のトッププロがAIに敗れ、そして昨年3月には、「アルファ碁」がりイ・セドル九段を破った。さらにはアルファ碁の進化形の「Master」がネット上の囲碁でプロ棋士たちを相手に60戦無敗という結果を残し1月5日にプロジェクトを終了した。

このように、ボードゲームにおけるAIの進化のスピードには目を見張るものがあるが、今度は運がゲームの勝敗を左右するポーカーにおいてもAIが人間に圧勝した。

カナダ・アルバータ大などの研究チームは、機械学習によってポーカーの展開を学んだソフト「ディープスタック」を開発。ディープスタックは1千万を超えるゲームから学習して「直観」ともよべる技術を習得した。

ポーカーは相手の手札が見えず、可能性のある展開は無数にあることから、判断はある程度直観に頼らざるをえない。同研究では、プロ対AIの1対1で勝負を行い、2枚ずつ配られた手札は相手に見えない状態。

これとテーブルに広げられた5枚の共通札とを組み合わせ役を完成させていき、段階的に賭けチップを増やしていくルール。昨年11~12月、17カ国のプロ33人と約4万5千回の勝負をこなし、獲得したチップ総数で一般に圧勝とされるポイントの10倍を獲得したとのこと(運が勝負を左右するため勝ち越せなかった相手もいた)。

今回は1対1の勝負だったが複数人で行うポーカーでは、さらに予想が複雑になるため、同様の成績を上げるにはさらなる研究が必要とのこと。

従来の囲碁や将棋でのAIは、盤面の情報をすべて持った状態で複雑な判断が可能だったのに対し、ディープスタックでは不十分な情報をもとに判断し、高い確率で勝利を収めた。このことはAI開発において重要な意味を持つ。現実世界では完全情報が得られる場面はまれで、得られる情報を使って直観を働かせ、最適な判断を行う技術が求められている。

たとえば自動運転技術ではセンサー・カメラでとらえられる周りの車の動き、障害物、標識や信号といったものだけでなく、天候や路面の状態・道幅、イレギュラーなドライバーや歩行者の挙動など無数の直接測定できない情報があり、実用を難しくしている。

不完全情報からより正確な判断を行う技術は、現実世界でのAI実用可能性を高めるものだ。ディープスタックで研究されている技術は、情報が限定されるなかでの軍事戦略の立案や、病気の治療方針の決定に役立てられることが期待されている。

※エキサイト ニュースより転載

Share on Facebook

カテゴリー ● カジノ・ポーカーニュース