Spielen Sie Online-Poker und Gewinnen Sie Echtes Geld.

WPT Global

德扑游戏和Alpha Go之间的密切联系关系 Alpha Go的行动是根据对手的行动实时计算的,因为不可能让AI记住所有的可能场景。但是一般德扑游戏AI的办法不一样,因为实时计算的计算量庞大,但是

Alpha Go的行动是根据对手的行动实时计算的,因为不可能让AI记住所有的可能场景。但是一般德扑游戏AI的办法不一样,因为实时计算的计算量庞大,但是AI遇到的场景种类比围棋少。所以冷扑和其他德扑游戏AI的主要打法都是事先算好的,比赛时拿到什么牌,对手怎么行动很大程度是靠着之前算好的游戏行动规则执行就好了。不过要让AI知道当前处于什么口袋德扑博弈情形是一大难点。

首先,一般AI都会缩减德州游戏的复杂度,德扑游戏有10亿种牌型组合,但是不少游戏牌型其实是一样的,比如5红桃6黑桃其实和5方块6梅花没什么区别。之前德扑AI把A黑桃5梅花和A红桃5方块这样的牌也归为一类,这就有些危险。因为在3个黑桃牌面中,前者是阻断牌,后者不是两种牌的打法其实并不一样,用前者去咋呼更可行。这里冷扑做了改进,使得决策更科学。

一般的德扑游戏AI也会将玩家下注额度进行四舍五入,比如你下注101元和下注100元在AI眼中是一样的。这种下法有时候会有非常大的潜在漏洞,很多聪明的玩家都会利用AI的这个漏洞剥削AI,我们后面再解析。

冷扑对前两个下注轮(翻牌前和翻牌后)手牌牌型不做任何缩减,也就是德州游戏规则5红桃6黑桃其实和5方块6梅花是不同手牌。这两轮中冷扑计算对手10种下注大小。而且这两个下注轮,冷扑的行动会完全按照自己之前算好的游戏行动一览表游戏,不会做实时计算。

▲ 冷扑的机房

冷扑对后两轮下注(转牌与河牌圈)手牌进行很大的缩减。一个是上面提到的牌型缩减,另外它只把对手的下注简单归类为2到3种下注类型。后面这两轮,冷扑只利用行动一览表计算EV(刨除运气成分的盈利),并不利用行动一览表来指导具体操作。这样做是为了减少计算量,因为翻牌前和翻牌圈(前两轮下注)都是预先设计好的,但是后两轮下注如果场景太多,会让计算难度指数增长。

经过这样的简化,冷扑每手牌的计算量为5万G大小。(看来在自己家电脑跑一个冷扑是不可能的了)

其次,在缩减了游戏复杂度后,AI利用一种叫做“蒙特卡罗虚拟事实模拟后悔最小化”(MCCFR)的算法,来计算纳什均衡。

具体算法就不详细解释了,免得文章太无聊。这算法大致有点像人类讨论牌局,打个比方:我拿了AK翻牌前平跟,在带A的翻牌下了注,河牌出了同花面,面对别人下注,我选择all in结果对手拿同花跟注,我输掉了牌局。

事后我后悔说:我应该翻牌前加注10个大盲,而不是平跟。

对手说:那你下10个大盲,我翻牌就fold掉咯,你也没拿到什么德州下载价值。

我再后悔说:那我翻牌加注3个大盲,你call,我翻牌下重注保护,你肯定弃牌。

这样每次把后悔降到最低,对手针对自己的改动再做改动,一次次推演,最后达到一个自己的最优方案。

这个算法本身不是冷扑发明的,但是冷扑改进了这个算法,把一些明显不合理的打法排除在外,比如拿27非同花这种最弱的牌翻牌前加注或者拿AA这种强牌翻牌前弃牌。如果某种打法一直都是负EV,那么之后冷扑会越来越少地去考虑这种打法。之前的德扑AI会反复考虑这种不合理打法,从而挤占了大量的计算资源。有数学论文证明刨除这种不合理打法并不影响纳什均衡的正确性。通过这种改进,冷扑计算纳什均衡的速度提升了100多倍。

FAQ

古代有西瓜吗?

古代的西瓜可能并不甜 根据各地的研究和考证资料显示,古代的西瓜,可能并不红,也不甜,甚至还有点苦味。 根据考古发现,人类食用西瓜的历史已经非常久远了。 在利比亚的西南部,研究人员曾发现5000年前的西瓜籽。 公元前1500年的苏丹遗址,也出现了西瓜的踪迹。16 ก.ค. 2566

吃瓜的瓜是什么瓜?

追本溯源,「吃瓜」中的瓜,指的其實是「西瓜」。Nov 11, 2023

瓜州在今什么省?

瓜州,在今甘肅省境內設立的一個州。

吃瓜什么梗?

2016年,有人将“不发言只围观”的普通网民称为“吃瓜群众”,用来表示一种不关己事、不发表意见仅围观的状态。 2016年12月14日,入选语言文字规范类刊物《咬文嚼字》杂志社发布的“2016年十大流行语”。

什么是胡瓜?

黄瓜(学名:Cucumis sativus)也称胡瓜、青瓜、刺瓜、瓜仔哖,属葫芦科黄瓜属植物。 广泛分布于中国各地,是中国夏季主要蔬菜,且为温室产品之一。

🎠 最新文章 🎬 🥳 熱門文章 🎈
😈 推薦文章 👄

盲注位置怎么玩 盲注位置怎么玩 你应该听说过:在德州扑克里,位置就是力量。如果一个玩家能让对手先动,那么这个玩家就有很大的优势。在你动之前,能够知道你的对手做

送给爱玩同花连张的牌友们 每个人打牌都会犯错误,这些错误直接影响着牌手的真人德扑圈胜率。有些错误偶尔犯一下无伤大雅。而有些错误我们常常犯,这里把那些错误称之为“习惯性

摸清对手的德州扑克下注套路:抓不到马脚时学学这个 下注套路和马脚是扑克桌上施展读人技术的两大数据来源。筹码越浅,下注套路越不明显,就越要依靠马脚;但是,一旦筹码深到一定程度,对下注套路的理解

7到Q的起手对子,应该怎么打? 相信大部分玩家拿到中等牌力的起手对是又爱又恨、喜忧参半,原因大多是翻牌前牌力不弱,但是却不知道如何去进行合理操作,可谓战战兢兢、如履薄冰。推

推测手牌范围最容易犯的错误 推测手牌范围最容易犯的错误 顶级职业牌手擅长于把对手的底牌推测到一个范围。这种千锤百炼的实战技能也促使他们做出更有利可图的决策。 与之相比,那些

McKeehen和Negreanu的德州游戏 McKeehen 但如果跟注,他就还有可能从McKeehen那里得到更多的筹码。这么做的同时还降低了风险,就算他没击中牌面(比如翻牌发出类似K-8-7的牌面

皇家同花顺的概率是多少? 皇家同花顺的概率是多少? 我们都知道,德州扑克中最大的牌形是皇家同花顺,如果哪位玩家能击中一次皇家同花顺,估计他会永生难忘,立即截图留念吧。 世

德州扑克浅筹码的玩法 德州扑克浅筹码的玩法 在标准的常规桌上,常见的筹码量从40大盲到200大盲不等。浅筹码时你的游戏策略会和深筹码时大不相同。不要在对抗不同筹码量

德扑术语SPR(Stack-Pot Ratio)是什么意思? 德扑术语SPR是什么意思?SPR全称Stack-Pot Ratio,SPR就是玩家剩余的有效筹码与桌面上筹码的比例。 举两个例子说明: 1,你手上

德州扑克如何理解赔率的概念 德州扑克如何理解赔率的概念 玩德州的人都知道赔率这个概念,赔率并非德州扑克中需要学习的高级概念,它是用来帮助我们在几乎所有类型的扑克游戏中做决

德州扑克价值牌型、诈唬牌型、摊牌牌型 德州扑克价值牌型、诈唬牌型、摊牌牌型 今天这节课先来复习一下德州扑克有哪些牌型 价值牌型(最好的牌):翻牌前的AA,翻牌后的坚果,不管对手如何下