スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

ほぼ最強のポーカーマシーン

近年ロボットの知能の発達は著しく、97年にチェスの世界王者がIBMのDeep Blueに敗れて、人間の知能が機械に負けたと話題になりました。それ以降、機械対人間の頭脳戦は行われており、将棋でも最近は、プロが負け越したりしており、ロボットの知能はますます上がっていく一方です。今回、カードゲームでも最強のマシーンができました。公平なルールならほぼ負けないポーカーのアルゴリズムが作られました。

チェスや将棋と違ってポーカーの問題を解く難しさは、相手がどんなカードを持っているかわからないという不確定な要素にあります。こういった不確定な要素が含まれる問題を解くために、経済学の分野ではゲーム理論というのがあります。基本的にはこの考えに則っています。今回、対象としたルールはテキサス・ホールデムとよばれる一般的なポーカーのルールです。今回はプレーヤー2人とし、割と計算はしやすい条件を選んでいます。アルゴリズムの中身の詳細は避けますが、基本的には counterfactual regret minimizationというアルゴリズム(あの時こうしておけばよかったという後悔を最小化するアルゴリズム)を改良した物です。もう一つの今回のチームが改良したのはそのデータ容量で、そのまま解こうとすると 262 terabytesのデータが必要となり、計算が遅くなってしまうのですが、これを圧縮することで11テラバイトまで下げることに成功しました。もちろん絶対に負けないわけではないのですが、一生のうちにできるポーカーの回数を考えると、負ける回数は0回以下になるそうです。

現実世界ではこのような不確定な要素が混じることが多く、ギャンブラーだけでなく、ゲーム理論の研究をしている経済学者にとっても、ビジネスマンにとっても興味深い内容だと思います。私がこのアルゴリズムの開発者だったらすぐにカジノに向かっていたでしょう。開発者の人はそうしなかったようなので、きっと人間ができているのでしょう。

元の論文
Heads-up limit hold’em poker is solved
スポンサーサイト
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。