Cheza Poker Mtandaoni na Ushinde Pesa Halisi.

WPT Global

https://wptglobal.com/

打了一辈子德州,居然输给了新手AI!(中篇) 打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html 完美信息博弈类游戏 对于围棋

打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html

完美信息博弈类游戏

对于围棋游戏来说,是一场零和完美信息博弈,这是指在任何时刻,双方玩家都知道前面游戏的全部状态(完美信息),并且在有限步数之后游戏的结果非胜即负(零和)。

知道了游戏的有限状态,计算机就可以通过暴力枚举的方法来计算后面所有可能的下法,形成一颗巨大的搜索树,这颗搜索树可以列举出在当前状态下所有可能的下法,每个子搜索树都能独立求解,计算机就可以根据计算的结果安排对应的策略,从而达到最终的胜利。

举个栗子,比如,小明是一个普通中国家庭长大的小孩,在他的一生中,面临着很多个选择,如何才能在未来走向人生巅峰呢?如果可以列举出他未来所有的可能性,把每一步的选择拆解成“子未来”,那么就可以计算出成功胜算最大的选择了。(例子可能不够恰当,理解意思就好,嘻嘻)

小明同学的人生探险

所以,假设我们有无限大的计算资源,就可以将一局游戏的博弈拆解成一个一个的子博弈(列举出所有的可能性),从而计算出胜算最大的打法,就可以打赢比赛了。但是,以棋类游戏中比较简单的西洋棋来说,它的分支因子大概是40左右,这表示预测之后20步的动作需要计算40的20次方(这是多大,就算是1GHz的处理器,也要计算3486528500050735年),请注意,这还是比较简单的西洋棋。

所以,科学家们利用一些剪枝、搜索等算法以缩减计算范围,从而在有限的游戏时间内找出最佳策略。

不完美信息博弈类游戏

终于讲到了今天的主角,口袋德州。口袋德州(德州扑克)就是很典型的不完美信息博弈类游戏,它的策略设置中存在隐藏的信息。这类模型也有大量的应用场景,比如谈判、拍卖等等。不完美信息博弈不能如完美信息博弈那样通过分解而进行求解,因为一个子博弈的最佳策略可能依赖于其它尚未得到的子博弈的策略和输出。换句话说,我们无法通过预测到对方下注的多少从而猜测到对方手里的牌是什么,因为也许对方的牌并不好,但他通过下注欺骗你,让你选择弃牌。

所以,这件事对于没心机的计算机是相当困难的,对手第一手就all in了,但是他的牌到底好不好呢?

因此,当我看到AI在德州上也打败了人类,还些许有些小激动,maybe未来,机器人也可以具有女人的第六感了。那AI到底是如何打败人类的呢?论文中提及和很多很难理解(其实自己也看不太懂,逃)的算法,为了方便理解德州怎么玩,我们以一个简单的博弈模型来举例,试图理解聪明的AI。

我们来设计一个简单的游戏。

游戏玩家有A和B两人。A可以抛一次硬币,正反面都只有自己才可以看到,抛完后他有两个选择:①sell,卖掉硬币;②play,和B玩游戏。

if : A选择了sell:

if : 硬币落在正面,A卖掉后得到五毛钱;

else:硬币落在反面,A卖掉后输掉五毛钱。

if : A选择了play:

游戏继续,接下来由B来猜硬币是落在正面还是反面:

if : B猜对了,A赔一元,B赚一元;

else:B猜错了,A赚一元,B赔一元。

打了一辈子,居然输给了新手AI!(下篇):https://www.moshike.com/a/354.html

FAQ

大衡村大瓜の読み方は?

〒981-3601 みやぎけんくろかわぐんおおひらむらおおうり 宮城県黒川郡大衡村大瓜

吃瓜什么梗?

2016年,有人将“不发言只围观”的普通网民称为“吃瓜群众”,用来表示一种不关己事、不发表意见仅围观的状态。 2016年12月14日,入选语言文字规范类刊物《咬文嚼字》杂志社发布的“2016年十大流行语”。

黑料网是什么?

黑料网- 今日黑料独家爆料正能量黑料网是一家专注于独家爆料的新闻网站,每天为大家带来最新鲜、独家的黑料消息。 正能量是黑料网的独特标签,不仅会揭发一些黑暗的现象,更会积极传递正能量,引导社会风气的向好的方向发展。 作为一家优秀的媒体,黑料网立足于提供真实的新闻信息,为公众揭露一些不为人知的**。

吃瓜是什么梗?

“吃瓜群众”是一个网络用语,指在网络论坛中,人们发帖讨论问题,后面排队跟帖,不着边际地闲扯的人,因为他们的常用语就是“前排出售瓜子”“前排吃瓜子”。 2016年,有人将“不发言只围观”的普通网民称为“吃瓜群众”,用来表示一种不关己事、不发表意见仅围观的状态。

拉瓜迪机场有几个航站楼?

拉瓜迪亚机场以其高效的服务和前往纽约市各区的便捷交通而闻名。 该机场共有四个航站楼(A、B、C 和D),每个航站楼都提供一系列便利设施,如餐饮选择、购物商店和休息室。 B 航站楼是最大的航站楼,最近进行了大规模翻修,为乘客提供了现代化的设施和更舒适的体验。

🎹 最新文章 🎤 🎵 熱門文章 🎡
🎮 推薦文章 🎶

扑克策略:用Minraise吓唬对手 扑克策略:用Minraise吓唬对手 ✪ 在$2-$5的无限注德州扑克中,我位于枪口位,筹码为$700,拿到手牌K♥10♥,我开牌加注到$20。

示弱性的领先下注 示弱性的领先下注 我们知道有些玩家并不会总是过牌给加注者,有时他们会下注。 假设你还是用A9在翻牌前加注,一个盲注玩家跟注,翻牌同样是Ac9d3

起手一对JJ在翻牌前和翻牌后的打法策略 在许多在拉斯维加斯玩现场$1/$2游戏的玩家心中,口袋J非常不招人待见。我经常听人说“我讨厌JJ!”这种话,但却很少听人这样说口袋Q或口袋T

超紧玩家怎么对付 本篇文章共2000字,读完只需3分钟 几乎每个牌桌上都坐着一名超紧玩家,所以我们必须得掌握打败他们的规律,以及如何相应地调整自己的行动线。 首先

顶级职牌的打法也存在可剥削的漏洞 顶级职牌的打法也存在可剥削的漏洞 Daniel Negreanu可谓是全球最成功的牌手之一,但就连这样段位的职牌,打法中也存在可剥削的漏洞。 这点从Dani

强牌慢打的3个正确时机和3个错误情况 强牌慢打的3个正确时机和3个错误情况 无限注德州扑克中的术语“慢玩”(slow play)可不是指玩家在做决定前要思索很久的那种慢玩,或是拿不定

德州扑克的探注技巧 德州扑克的探注技巧 首先来科普一下,什么是探注? 当你有一定牌力,但是并不认为自己当前是牌力最强的,依然有各种动机使你下注,而这个下注的数量相对

德州扑克中小对子怎么打 德州扑克中小对子怎么打 大多数德州扑克初学者对于如何游戏大对子有所了解,但他们发到小对子和中对子时有些挣扎。有些牌手过度游戏他们的牌,而有些牌

《艦B娘》3/28(五)维护公告 亲爱的领航员会社社长: 为了带给大家更优质的游戏体验, 伺服器将于 2025/3/28(五)14:00-17:00 进行停服维护, 还请各位玩家做好维

A6o、A7o、A8o、A9o、AXo牌型的打法 A6o、A7o、A8o、A9o、AXo牌型的打法 中等AXo包含A6o、A7o、A8o和A9o这几手牌。 想要玩好这类牌型是比较难的,就算对于有

深筹码打法的不同 深筹码打法的不同 许多人经常问我如何游戏深筹码扑克。深筹码一般是指200BB、300BB甚至更深的筹码量。这种筹码量现场牌手通常比较熟悉。深筹

短码时的加注 短码时的加注 当你的筹码减少到30个大盲注以下时,你就得到了德州扑克中最有力量的几个工具。每次你进入底池时,对手都必须担心你是否有能全下的手牌

你有这几个德州扑克坏习惯吗? 你有这几个德州扑克坏习惯吗?所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。

所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。 下面