在線玩撲克,贏取真錢。

WPT Global全球微扑克

https://wptglobal.com/

德扑游戏和Alpha Go之间的密切联系关系 Alpha Go的行动是根据对手的行动实时计算的,因为不可能让AI记住所有的可能场景。但是一般德扑游戏AI的办法不一样,因为实时计算的计算量庞大,但是

Alpha Go的行动是根据对手的行动实时计算的,因为不可能让AI记住所有的可能场景。但是一般德扑游戏AI的办法不一样,因为实时计算的计算量庞大,但是AI遇到的场景种类比围棋少。所以冷扑和其他德扑游戏AI的主要打法都是事先算好的,比赛时拿到什么牌,对手怎么行动很大程度是靠着之前算好的游戏行动规则执行就好了。不过要让AI知道当前处于什么口袋德扑博弈情形是一大难点。

首先,一般AI都会缩减德州游戏的复杂度,德扑游戏有10亿种牌型组合,但是不少游戏牌型其实是一样的,比如5红桃6黑桃其实和5方块6梅花没什么区别。之前德扑AI把A黑桃5梅花和A红桃5方块这样的牌也归为一类,这就有些危险。因为在3个黑桃牌面中,前者是阻断牌,后者不是两种牌的打法其实并不一样,用前者去咋呼更可行。这里冷扑做了改进,使得决策更科学。

一般的德扑游戏AI也会将玩家下注额度进行四舍五入,比如你下注101元和下注100元在AI眼中是一样的。这种下法有时候会有非常大的潜在漏洞,很多聪明的玩家都会利用AI的这个漏洞剥削AI,我们后面再解析。

冷扑对前两个下注轮(翻牌前和翻牌后)手牌牌型不做任何缩减,也就是德州游戏规则5红桃6黑桃其实和5方块6梅花是不同手牌。这两轮中冷扑计算对手10种下注大小。而且这两个下注轮,冷扑的行动会完全按照自己之前算好的游戏行动一览表游戏,不会做实时计算。

▲ 冷扑的机房

冷扑对后两轮下注(转牌与河牌圈)手牌进行很大的缩减。一个是上面提到的牌型缩减,另外它只把对手的下注简单归类为2到3种下注类型。后面这两轮,冷扑只利用行动一览表计算EV(刨除运气成分的盈利),并不利用行动一览表来指导具体操作。这样做是为了减少计算量,因为翻牌前和翻牌圈(前两轮下注)都是预先设计好的,但是后两轮下注如果场景太多,会让计算难度指数增长。

经过这样的简化,冷扑每手牌的计算量为5万G大小。(看来在自己家电脑跑一个冷扑是不可能的了)

其次,在缩减了游戏复杂度后,AI利用一种叫做“蒙特卡罗虚拟事实模拟后悔最小化”(MCCFR)的算法,来计算纳什均衡。

具体算法就不详细解释了,免得文章太无聊。这算法大致有点像人类讨论牌局,打个比方:我拿了AK翻牌前平跟,在带A的翻牌下了注,河牌出了同花面,面对别人下注,我选择all in结果对手拿同花跟注,我输掉了牌局。

事后我后悔说:我应该翻牌前加注10个大盲,而不是平跟。

对手说:那你下10个大盲,我翻牌就fold掉咯,你也没拿到什么德州下载价值。

我再后悔说:那我翻牌加注3个大盲,你call,我翻牌下重注保护,你肯定弃牌。

这样每次把后悔降到最低,对手针对自己的改动再做改动,一次次推演,最后达到一个自己的最优方案。

这个算法本身不是冷扑发明的,但是冷扑改进了这个算法,把一些明显不合理的打法排除在外,比如拿27非同花这种最弱的牌翻牌前加注或者拿AA这种强牌翻牌前弃牌。如果某种打法一直都是负EV,那么之后冷扑会越来越少地去考虑这种打法。之前的德扑AI会反复考虑这种不合理打法,从而挤占了大量的计算资源。有数学论文证明刨除这种不合理打法并不影响纳什均衡的正确性。通过这种改进,冷扑计算纳什均衡的速度提升了100多倍。

FAQ

什么是胡瓜?

黄瓜(学名:Cucumis sativus)也称胡瓜、青瓜、刺瓜、瓜仔哖,属葫芦科黄瓜属植物。 广泛分布于中国各地,是中国夏季主要蔬菜,且为温室产品之一。

「大瓜」の読み方は?

大瓜(オウリ)はどこ?

拉瓜迪机场有几个航站楼?

拉瓜迪亚机场以其高效的服务和前往纽约市各区的便捷交通而闻名。 该机场共有四个航站楼(A、B、C 和D),每个航站楼都提供一系列便利设施,如餐饮选择、购物商店和休息室。 B 航站楼是最大的航站楼,最近进行了大规模翻修,为乘客提供了现代化的设施和更舒适的体验。

吃瓜的瓜是什么瓜?

追本溯源,「吃瓜」中的瓜,指的其實是「西瓜」。Nov 11, 2023

微短剧是什么?

尽管叫法不同,本文探讨的短剧,更多是当下颇为流行的微短剧。 根据国家广电总局的定义,微短剧,全称为网络微短剧,是指“单集时长从几十秒到15分钟左右、有着相对明确的主题和主线、较为连续和完整的故事情节”的剧集。 这类形式此前更常见于长视频平台,如此前爆火的《招惹》《授她以柄》。Mar 15, 2024

🎪 最新文章 🎁 🎮 熱門文章 🎤
🎡 推薦文章 🎭

德州扑克GTO视频课程 德州扑克GTO视频课程 首先让我们来科普一下,什么是GTO策略? GTO是英文GameTheory Optimal的缩写,翻译成直白的中文意思就是

葫芦和四条都能弃掉? 葫芦和四条都能弃掉? 玩德扑的时候,当面对很大诱惑的情况下,如果我们还能非常自律的弃牌,长久以往我们在游戏中就能比对手多一份优势。要做到这点的

对抗过牌加注的能力测试 对抗过牌加注的能力测试 对抗翻牌圈的过牌-加注,是牌手策略的一个重要组成部分。如果你不知道如何去防范过牌-加注,每次你做持续下注时都为对手打开

转牌圈拿到强听牌,check还是bet 转牌圈拿到强听牌,check还是bet 牌局背景及过程 这手牌来自一个无限德州扑克锦标赛。桌上玩家筹码量如图所示。翻前,UTG玩家、UTG+1玩

德州扑克怎么判断对手的范围 德州扑克怎么判断对手的范围 有人把德扑说成是“范围之战”,如果一个牌手拥有很强的范围解读能力,这意味着他已经具备了成为成功牌手的能力。精确解读

德州扑克新手怎么读牌 德州扑克新手怎么读牌知道对手底牌的类型是一种能力,而这种能力能够让你在德扑中脱颖而出。 看透对手的心理,解读他们深层次的想法,然后诈唬! 我们经

保持侵略性:学会打压对手(下篇) 保持侵略性:学会打压对手(上篇):https://www.moshike.com/a/392.html 我应该加注到多少? 如果你使用这种打法,

翻牌圈诈唬加注频率的价值 翻牌圈诈唬加注频率的价值 如果我们的范围不是完美两极化的,在翻牌圈下注或加注时,没有任何一种尺度适合下注尺度。但是,仍然有一些下注尺度我们应该

熱銷排行榜 瓜瓜園官方購物網 瓜瓜園官方購物網讓您在家即可輕鬆購買瓜瓜園農場特選優質台農57號黃地瓜-冰烤蕃薯,冰熱兩吃帶給您不同層次的口感,團購熱銷商品值得您一再品嚐。

如何推测对手的手牌 如何推测对手的手牌 搞清楚对手的底牌是打好德州扑克的核心,但是这个重点常常遭到误解。因为大部分人认识之所以要搞清楚对手的底牌的目标只是为了精确