AIポーカーボットがプロを驚かせた

人間は、人工知能が習得するには難しすぎると考えられていたさらに別のゲームで、コンピューターに打ち負かされてきました。





過去3週間にわたって、Libratusと呼ばれるAIポーカーボットは、ピッツバーグのRivers Casinoで、トッププロのプレーヤーの幹部に対して何千ものヘッズアップのノーリミットテキサスホールデムをプレイしてきました。そして、それはそれらすべてを打ち負かしました。

私たち自身のウィルナイトは最近、カーネギーメロン大学の2人の研究者によって建てられたLibratusの勝利がなぜそんなに大したことになるのかを説明しました:

ポーカーには、マシンが模倣するのが難しいことが証明されている推論とインテリジェンスが必要です。対戦相手の手がプレイ中に見えないようになっているため、チェッカー、チェス、ゴーとは根本的に異なります。不完全情報ゲームでは、対戦相手がとる可能性のあるすべての可能なアプローチを考えると、理想的な戦略を理解することは非常に複雑です。



ヘッズアップ、ノーリミットテキサスホールデムでは、それは事実上不可能です。なぜなら、正しいプレーは1つもないからです。代わりに、AIはゲーム理論を使用して、不確実性を考慮して最適なプレイを計算する必要があります。

結局、それは近くさえありませんでした:Libratus 180万ドルのチップで稼いだ 、4人のプロ全員が赤字に終わった。人工知能は、ゲームでトッププレーヤーを打ち負かしたことがないため、テキサスホールデムのように情報が不足しています。その前のDeepMindのGoの勝利のように、勝利は機械学習コミュニティにとって重要な瞬間です。

しかし、人間が対戦するのはどのようなものでしたか?少し意気消沈します」と、専門家の1人であるジェイソンレスは 言った ガーディアン 。 「人間を演じて負けたら、やめて休憩することができます。ここでは、1日11時間、毎日殴打するために現れなければなりません。あなたがそれほど頻繁に失うことに慣れていないとき、それは本当に異なる感情的な経験です。



別の専門家であるダニエル・マコーレイ、 に説明 有線 AIの記憶にさまざまな演劇を保持する能力により、AIは人間の競争相手とは一線を画しています。それは賭けを3、4、5つの異なるサイズに分割する、と彼は説明した。人間にはそれをする能力がありません。それでも、打ち負かされた人間にはそれほどひどく感じないでください。負けたにもかかわらず、トーナメントでの成績に基づいて、彼らは20万ドルを分配しています。

ただし、AIの場合、これはほんの始まりにすぎません。自分のゲームでプロを打ち負かすことが可能であることが証明されたので、今や非常に明確な次の挑戦があります。それは、マルチプレイヤーのノーリミットテキサスホールデムです。しかし、現在のソフトウェアで使用されているゲーム理論は、複数の対戦相手がいる場合に失敗し、代わりにどの手法を使用するかが明確ではありません。

それでも、機械学習が現在進行中であり、他のAIポーカーボットも開発されているという事実を考えると、一見不可能と思われる挑戦は長い間不可能ではないかもしれません。



(続きを読む: ブルームバーグ 有線 The ガーディアン 、ポーカーが人工知能にとって大きな問題である理由、ポーカーは人工知能に対抗する最新のゲーム、AlphaGoの歴史的な勝利からの5つの教訓)

隠れる