Play Poker Online and Win Real Money.

WPT Global

https://wptglobal.com/

德扑游戏和Alpha Go之间的密切联系关系 Alpha Go的行动是根据对手的行动实时计算的,因为不可能让AI记住所有的可能场景。但是一般德扑游戏AI的办法不一样,因为实时计算的计算量庞大,但是

Alpha Go的行动是根据对手的行动实时计算的,因为不可能让AI记住所有的可能场景。但是一般德扑游戏AI的办法不一样,因为实时计算的计算量庞大,但是AI遇到的场景种类比围棋少。所以冷扑和其他德扑游戏AI的主要打法都是事先算好的,比赛时拿到什么牌,对手怎么行动很大程度是靠着之前算好的游戏行动规则执行就好了。不过要让AI知道当前处于什么口袋德扑博弈情形是一大难点。

首先,一般AI都会缩减德州游戏的复杂度,德扑游戏有10亿种牌型组合,但是不少游戏牌型其实是一样的,比如5红桃6黑桃其实和5方块6梅花没什么区别。之前德扑AI把A黑桃5梅花和A红桃5方块这样的牌也归为一类,这就有些危险。因为在3个黑桃牌面中,前者是阻断牌,后者不是两种牌的打法其实并不一样,用前者去咋呼更可行。这里冷扑做了改进,使得决策更科学。

一般的德扑游戏AI也会将玩家下注额度进行四舍五入,比如你下注101元和下注100元在AI眼中是一样的。这种下法有时候会有非常大的潜在漏洞,很多聪明的玩家都会利用AI的这个漏洞剥削AI,我们后面再解析。

冷扑对前两个下注轮(翻牌前和翻牌后)手牌牌型不做任何缩减,也就是德州游戏规则5红桃6黑桃其实和5方块6梅花是不同手牌。这两轮中冷扑计算对手10种下注大小。而且这两个下注轮,冷扑的行动会完全按照自己之前算好的游戏行动一览表游戏,不会做实时计算。

▲ 冷扑的机房

冷扑对后两轮下注(转牌与河牌圈)手牌进行很大的缩减。一个是上面提到的牌型缩减,另外它只把对手的下注简单归类为2到3种下注类型。后面这两轮,冷扑只利用行动一览表计算EV(刨除运气成分的盈利),并不利用行动一览表来指导具体操作。这样做是为了减少计算量,因为翻牌前和翻牌圈(前两轮下注)都是预先设计好的,但是后两轮下注如果场景太多,会让计算难度指数增长。

经过这样的简化,冷扑每手牌的计算量为5万G大小。(看来在自己家电脑跑一个冷扑是不可能的了)

其次,在缩减了游戏复杂度后,AI利用一种叫做“蒙特卡罗虚拟事实模拟后悔最小化”(MCCFR)的算法,来计算纳什均衡。

具体算法就不详细解释了,免得文章太无聊。这算法大致有点像人类讨论牌局,打个比方:我拿了AK翻牌前平跟,在带A的翻牌下了注,河牌出了同花面,面对别人下注,我选择all in结果对手拿同花跟注,我输掉了牌局。

事后我后悔说:我应该翻牌前加注10个大盲,而不是平跟。

对手说:那你下10个大盲,我翻牌就fold掉咯,你也没拿到什么德州下载价值。

我再后悔说:那我翻牌加注3个大盲,你call,我翻牌下重注保护,你肯定弃牌。

这样每次把后悔降到最低,对手针对自己的改动再做改动,一次次推演,最后达到一个自己的最优方案。

这个算法本身不是冷扑发明的,但是冷扑改进了这个算法,把一些明显不合理的打法排除在外,比如拿27非同花这种最弱的牌翻牌前加注或者拿AA这种强牌翻牌前弃牌。如果某种打法一直都是负EV,那么之后冷扑会越来越少地去考虑这种打法。之前的德扑AI会反复考虑这种不合理打法,从而挤占了大量的计算资源。有数学论文证明刨除这种不合理打法并不影响纳什均衡的正确性。通过这种改进,冷扑计算纳什均衡的速度提升了100多倍。

FAQ

黑料网是什么?

黑料网- 今日黑料独家爆料正能量黑料网是一家专注于独家爆料的新闻网站,每天为大家带来最新鲜、独家的黑料消息。 正能量是黑料网的独特标签,不仅会揭发一些黑暗的现象,更会积极传递正能量,引导社会风气的向好的方向发展。 作为一家优秀的媒体,黑料网立足于提供真实的新闻信息,为公众揭露一些不为人知的**。

吃瓜的瓜是什么意思?

吃瓜,网络流行词,其含义为在网络环境中,用来表示一种不关己事、不发表意见仅围观的状态。 普通网友们常常戏称自己为“吃瓜群众”。 而“瓜”则表示某个热点八卦事件。 “吃瓜”一词的源于“吃瓜群众”,大概是由戏院火车上推售等地“前排出售瓜子,前排吃瓜子,前排吃瓜”广告词演变而来的。

吃瓜是怎么来的?

该词源于2016年网络热词“不明真相的吃瓜群众”(或简写为“吃瓜群众”),更早则来自百度贴吧中“前排出售瓜子”、“吃瓜子看戏”等用语,而“不明真相”是网民用来反讽中国官方话语中常见的“少数别有用心”、“不明真相的群众”等固定短语。

吃瓜什么梗?

2016年,有人将“不发言只围观”的普通网民称为“吃瓜群众”,用来表示一种不关己事、不发表意见仅围观的状态。 2016年12月14日,入选语言文字规范类刊物《咬文嚼字》杂志社发布的“2016年十大流行语”。

瓜州在今什么省?

瓜州,在今甘肅省境內設立的一個州。

😏 最新文章 🎹 🎠 熱門文章 🎡
😚 推薦文章 🎁

德州扑克策略:利用对手的游戏倾向 德州扑克策略:利用对手的游戏倾向 虽然你的大多数扑克收益来自从你的强牌那儿获取最大价值,但偶尔你也需要做一些时机恰当的诈唬。我最近在百佳塔WP

卡顺和两头顺是什么意思 卡顺和两头顺是什么意思 在德州扑克里,顺子是比较大的牌形了,而形成顺子则必须是5张连续的牌,比如A,2,3,4,5,或者8,9,T,J,Q等等

德州扑克读牌方法 德州扑克读牌方法 虽然读牌看似是一种凡人无法掌握的超能力,但事实却完全相反。读牌是在逻辑推理之下得出的科学。德州扑克玩家观察玩家如何打牌的数据

什么样的牌不适合3bet诈唬 下面来看下,哪些牌不适合用来做3-bet诈唬。 首先,我觉得用来做3-bet诈唬非常差的牌包括了22-66这样的小对子,这些牌总是要面对一个非

起手牌AK打法,起手AK怎么玩? 起手牌AK打法,起手AK怎么玩? AK在德州扑克中是一手让人又爱又恨的牌。关于如何正确游戏AK似乎有许多不同的理论,尽管其中一些理论没有任何数

GTO玩法 vs 剥削性玩法 GTO玩法 vs 剥削性玩法 如果你已经读过这个系列的前两篇文章,你已经知道什么是Solver软件以及它们是如何运作的,而且对于它们能够告诉你什么、

应该在哪些下注圈做价值下注 应该在哪些下注圈做价值下注 既然我们已经对一手牌虽然多少牌力才能在有利位置做两条街或三条街的下注有了了解,那么我们接下来必须判断当我们不想在所

影视短剧 我们拥有一支强大的宣发团队,提供从宣发路径策划到执行的全方位服务,确保影视作品获得最大的曝光和观众关注。我们的团队凭借深厚的行业资源和丰富的

什么时候3Bet胜率最高 什么时候3Bet胜率最高 大多数在微注额打牌的新手会犯通过跟注而不是3bet进入太多底池的错误。他们只用强牌 3bet,而不增加其他牌到他们的3

对付业余玩家的翻牌后策略 对付业余玩家的翻牌后策略 翻牌前策略和翻牌后策略同等重要,但翻牌后才是真正意义上的开局。很多业余玩家会在翻牌前犯错误,但他们会在翻牌后犯更多错

德州扑克诈唬的秘诀 德州扑克诈唬的秘诀 在德州扑克的一些场合中,你可以选择假装一手强牌,即使你拿的只是一手非常边缘的牌。在本文中,我们将讨论一些你推测对手只是一手