Jouez au Poker en Ligne et Gagnez de l'Argent Réel.

WPT Global

打了一辈子德州,居然输给了新手AI!(中篇) 打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html 完美信息博弈类游戏 对于围棋

打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html

完美信息博弈类游戏

对于围棋游戏来说,是一场零和完美信息博弈,这是指在任何时刻,双方玩家都知道前面游戏的全部状态(完美信息),并且在有限步数之后游戏的结果非胜即负(零和)。

知道了游戏的有限状态,计算机就可以通过暴力枚举的方法来计算后面所有可能的下法,形成一颗巨大的搜索树,这颗搜索树可以列举出在当前状态下所有可能的下法,每个子搜索树都能独立求解,计算机就可以根据计算的结果安排对应的策略,从而达到最终的胜利。

举个栗子,比如,小明是一个普通中国家庭长大的小孩,在他的一生中,面临着很多个选择,如何才能在未来走向人生巅峰呢?如果可以列举出他未来所有的可能性,把每一步的选择拆解成“子未来”,那么就可以计算出成功胜算最大的选择了。(例子可能不够恰当,理解意思就好,嘻嘻)

小明同学的人生探险

所以,假设我们有无限大的计算资源,就可以将一局游戏的博弈拆解成一个一个的子博弈(列举出所有的可能性),从而计算出胜算最大的打法,就可以打赢比赛了。但是,以棋类游戏中比较简单的西洋棋来说,它的分支因子大概是40左右,这表示预测之后20步的动作需要计算40的20次方(这是多大,就算是1GHz的处理器,也要计算3486528500050735年),请注意,这还是比较简单的西洋棋。

所以,科学家们利用一些剪枝、搜索等算法以缩减计算范围,从而在有限的游戏时间内找出最佳策略。

不完美信息博弈类游戏

终于讲到了今天的主角,口袋德州。口袋德州(德州扑克)就是很典型的不完美信息博弈类游戏,它的策略设置中存在隐藏的信息。这类模型也有大量的应用场景,比如谈判、拍卖等等。不完美信息博弈不能如完美信息博弈那样通过分解而进行求解,因为一个子博弈的最佳策略可能依赖于其它尚未得到的子博弈的策略和输出。换句话说,我们无法通过预测到对方下注的多少从而猜测到对方手里的牌是什么,因为也许对方的牌并不好,但他通过下注欺骗你,让你选择弃牌。

所以,这件事对于没心机的计算机是相当困难的,对手第一手就all in了,但是他的牌到底好不好呢?

因此,当我看到AI在德州上也打败了人类,还些许有些小激动,maybe未来,机器人也可以具有女人的第六感了。那AI到底是如何打败人类的呢?论文中提及和很多很难理解(其实自己也看不太懂,逃)的算法,为了方便理解德州怎么玩,我们以一个简单的博弈模型来举例,试图理解聪明的AI。

我们来设计一个简单的游戏。

游戏玩家有A和B两人。A可以抛一次硬币,正反面都只有自己才可以看到,抛完后他有两个选择:①sell,卖掉硬币;②play,和B玩游戏。

if : A选择了sell:

if : 硬币落在正面,A卖掉后得到五毛钱;

else:硬币落在反面,A卖掉后输掉五毛钱。

if : A选择了play:

游戏继续,接下来由B来猜硬币是落在正面还是反面:

if : B猜对了,A赔一元,B赚一元;

else:B猜错了,A赚一元,B赔一元。

打了一辈子,居然输给了新手AI!(下篇):https://www.moshike.com/a/354.html

FAQ

吃瓜的瓜是什么瓜?

追本溯源,「吃瓜」中的瓜,指的其實是「西瓜」。Nov 11, 2023

吃瓜的瓜是什么意思?

吃瓜,网络流行词,其含义为在网络环境中,用来表示一种不关己事、不发表意见仅围观的状态。 普通网友们常常戏称自己为“吃瓜群众”。 而“瓜”则表示某个热点八卦事件。 “吃瓜”一词的源于“吃瓜群众”,大概是由戏院火车上推售等地“前排出售瓜子,前排吃瓜子,前排吃瓜”广告词演变而来的。

古代有西瓜吗?

古代的西瓜可能并不甜 根据各地的研究和考证资料显示,古代的西瓜,可能并不红,也不甜,甚至还有点苦味。 根据考古发现,人类食用西瓜的历史已经非常久远了。 在利比亚的西南部,研究人员曾发现5000年前的西瓜籽。 公元前1500年的苏丹遗址,也出现了西瓜的踪迹。16 ก.ค. 2566

什么是胡瓜?

黄瓜(学名:Cucumis sativus)也称胡瓜、青瓜、刺瓜、瓜仔哖,属葫芦科黄瓜属植物。 广泛分布于中国各地,是中国夏季主要蔬菜,且为温室产品之一。

三黑料是什么意思?

料:主要指银行卡账号、密码,持卡人身份证号及绑定手机号四大类信息(又称CVV四大件)。 内料:指境内卡的四大件。 外料:指境外卡的四大件。 轨道料:指通过改装POS机得到的银行卡信息,这种信息一般非常精准。

🎗️ 最新文章 😉 🎊 熱門文章 🎲
🎪 推薦文章 🎷

留意牌桌上的反常打法 留意牌桌上的反常打法 留意牌桌上的反常打法,这样你就会在第一次见到反常情形时不会过于惊讶和困惑。如果你在不打牌时也会思考各种可能情形的话,你也

黑料吃瓜网app下载-黑料吃瓜网安卓版下载-漫漫看 ​黑料吃瓜网app是一款集娱乐新闻、明星八卦、影视剧集和综艺动态于一体的手机应用程序。它为用户提供了丰富多样的娱乐内容,涵盖了当今娱乐圈的所

黑料吃瓜网699点su - YouTube 网红明星黑料实时分享,全站免费纯净无毒,我们致力于研究网络中最尖端的复习资料,现已攻克各种网红资源难题,备受全国爱好学习的同学们爱戴。699

啥时候应该把小口袋对当成诈唬来打 啥时候应该把小口袋对当成诈唬来打 当你用小的口袋对入局,大部分时候在翻牌都是不中牌的,但这并不意味着你就只能走过牌-弃牌这条路,除了直接举白旗

陷“私生子”风波,刘涛被女星曝大瓜扒黑历史,“人设崩塌”? 天啦撸!这个瓜太劲爆!一个知名女星当众爆料已婚人妻女星刘涛!称:她技术很好,为了上位是真的不择手段!早先为了角色和制片人“交易”拍戏期间和男

KK对AA,看顶级现场扑克大神如何从冤家牌中逃脱 KK对AA,看顶级现场扑克大神如何从冤家牌中逃脱 今天分析的这手牌,是德州扑克中最好的起手牌AA和KK的碰撞。而主角Garrett Adelst

德州扑克锦标赛的打法技巧 德州扑克锦标赛的打法技巧 10、坚持。即使筹码很少,也不要放弃。相反,你要寻找最好的机会来偷池或筹码翻倍。另外,当你的名次总是徘徊在钱圈之外时

世界上最好的无限德州扑克单挑牌手是谁 世界上最好的无限德州扑克单挑牌手是谁 在很长一段时间里,单挑扑克被认为是最苛刻、最纯粹的游戏形式,也是一种对高水平牌手有利可图的扑克变体。 伟大

德州扑克诱捕对手的方法 德州扑克诱捕对手的方法 提到诱捕,一些无限德州扑克牌手马上会想到“慢玩”(slow play)。事实上,有些人错误地认为,翻后诱捕对手的唯一方式

如何回应对手不合常理的反主动下注? 在无限注德州扑克中,当我们和对手进入翻牌圈,牌面结构有时对我们的范围有利,有时更利于对手的范围。 当牌面显然更有利于对手的范围时,他们有资格下

牌面覆盖率是什么意思? 牌面覆盖率是什么意思? 牌面覆盖率是现代扑克理论中比较新的一个概念。 随着GTO软件的盛行,这个概念也变成了高手间的热门话题,不过并不是所有人都

德州扑克什么时候应该加注? 德州扑克什么时候应该加注? 除了“check“、”下注“和”跟注“,扑克牌手最常用到的另一个基本术语就是”加注“。加注其实很简单,就是做规则允

你有这几个德州扑克坏习惯吗? 你有这几个德州扑克坏习惯吗?所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。

所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。 下面