立即玩

Cheza Poker Mtandaoni na Ushinde Pesa Halisi.

德州AI和贝叶斯法则的利用 之前的德州游戏AI会利用贝叶斯法则(一种概率反演算的定律)来推断对手的手牌范围,这种办法会导致AI产生极大的漏洞。冷扑用的办法是不预先假定对

之前的德州游戏AI会利用贝叶斯法则(一种概率反演算的定律)来推断对手的手牌范围,这种办法会导致AI产生极大的漏洞。冷扑用的办法是不预先假定对手的手牌范围,而是考虑对手如果拿着某手牌做出这样的行动合理不合理,按照他自己的纳什均衡,这样的动作会让他损失多少EV,从而调整自己的行动最大化对手的损失。

举个例子,这也是一般人类和AI很棘手的问题。一个人上桌第一手牌就翻牌前推了你200个盲注,你拿A9同花应该跟注还是弃牌。一般人类和之前的德扑AI往往会推测对手手牌范围,然后考虑平均来说跟注值不值得。推测对手手牌范围的行为会让自己打法产生漏洞,容易被高手钻空子。冷扑利用了2014年发明的一种新算法,他不推测对手平均手上拿什么牌,而是针对每种手牌考虑德扑规则:假如对手拿27它应不应该全压,如果按照他自己的纳什均衡策略,他全压27损失巨大。那如果他拿AA应不应该全压,按照他的纳什均衡策略,AA全压太浪费了,损失也是巨大。一个一个的考察他每种手牌这样打会损失多少EV。然后我们选择一种打法让他长期来说损失EV最大的打法。也就是说,你可以每把拿烂牌推我,但是万一我拿到好牌call你,你损失巨大。所以我不怕你这样打。(注意冷扑不会考虑之前玩家游戏历史,所以连续翻牌前推10次和翻牌前推1次对冷扑是一样的)

第四,之前德扑AI会把对手的下注大小简单的四舍五入,这是一个大漏洞,一来会导致纳什均衡计算出错,二来会导致人类利用AI这点来剥削AI。冷扑的做法是如果人类做出了不寻常的奇怪下注,冷扑不会简单的四舍五入,而是会针对这种下注方法独立的展开纳什均衡计算。他们的实验发现,使用这种算法,可以让德扑玩法冷扑被人类高手剥削的可能性降低为原来的1/12. 但是这个方法只用在转牌和河牌圈(后两轮)前两轮还是简单四舍五入。

最后,也是让冷扑变得强大的一个重要系统,就是冷扑能总结一整天下来的游戏,修补自己的漏洞。它会优先考察自己最常见的错误,每个晚上冷扑大概能修补自己3个漏洞(其实还有更多漏洞,不过电脑的计算量限制下冷扑只能修补两三个漏洞)。

冷扑的弱点

开发者承认冷扑最大的弱点是不会考虑对手打法。就算你从来不咋呼,或者每手牌都咋呼,冷扑以及现在主流的德扑AI都不会利用你的漏洞。德扑AI只会坚持纳什均衡打法,利用人类偏离纳什均衡的错误来盈利。这点和人类玩家很不一样。

冷扑即使在晚上的自我进化阶段也不会去寻找人类的漏洞。

不过开发者说,这个弱点也恰好同时是冷扑的优点。因为假如你要去剥削对手的弱点,那么你自己就会卖出破绽,这样人类高手反而会利用你的破绽来剥削你。比如你看对手把把咋呼,下一把你想着要去抓对手咋呼,那你必然会拿弱牌跟注对手。这时你自己就卖了个漏洞出来,对手有可能利用这个漏洞来反打你。而抓漏洞的游戏上,AI肯定玩不过人类高手。真正好的打法是不管对手有没有漏洞,AI寻找纳什最优打法的能力肯定比人类强,只要AI按照最优打法来打,人类一犯错,AI就能盈利。

事实上人类顶尖高手的明显漏洞非常小,AI尝试去抓人类漏洞是危险的行为。AI和普通人类玩家交手也能取得很大的优势。但是剥削弱玩家的德扑教学能力上,AI是比不过人类高手的。(不过反正坚持按照GTO(最优打法)玩都能赢,为什么一定要想着去剥削对手呢)

此外很多人类以为AI会侦查他们的漏洞,所以故意卖漏洞给AI,这也造成了他们进一步偏离纳什均衡,反而承受更大的损失。

FAQ

吃瓜的瓜是什么瓜?

追本溯源,「吃瓜」中的瓜,指的其實是「西瓜」。Nov 11, 2023

「大瓜」の読み方は?

大瓜(オウリ)はどこ?

拉瓜迪机场有几个航站楼?

拉瓜迪亚机场以其高效的服务和前往纽约市各区的便捷交通而闻名。 该机场共有四个航站楼(A、B、C 和D),每个航站楼都提供一系列便利设施,如餐饮选择、购物商店和休息室。 B 航站楼是最大的航站楼,最近进行了大规模翻修,为乘客提供了现代化的设施和更舒适的体验。

大衡村大瓜の読み方は?

〒981-3601 みやぎけんくろかわぐんおおひらむらおおうり 宮城県黒川郡大衡村大瓜

吃瓜是什么梗?

“吃瓜群众”是一个网络用语,指在网络论坛中,人们发帖讨论问题,后面排队跟帖,不着边际地闲扯的人,因为他们的常用语就是“前排出售瓜子”“前排吃瓜子”。 2016年,有人将“不发言只围观”的普通网民称为“吃瓜群众”,用来表示一种不关己事、不发表意见仅围观的状态。

🎮 最新文章 🔥 🎺 熱門文章 🎊
🌟 推薦文章 📹

河牌All in强势偷鸡,AA会被吓跑吗? 河牌All in强势偷鸡,AA会被吓跑吗? 扑克直播有时会变得很疯狂,特别是在成千上万观众的注视下打高注额扑克。有些牌手喜欢在娱乐观众时采用非常

五分钟内让你盈利的10个小技巧之二 五分钟内让你盈利的10个小技巧之二 五分钟内让盈利翻倍的10个扑克小技巧之一:https://www.moshike.com/a/609.ht

德州扑克的下注方式 德州扑克的下注方式 德州扑克的下注方式分为两种,分别是:价值下注和诈唬下注。 价值下注是指玩家在领先的情况下,为了扩大底池,以求获得最大的收益而

《艦B娘》2/21 维护 亲爱的玩家您好: 为了带给大家更优质的游戏体验将进行维护, 还请各位玩家做好维护准备,提早完成不另通知。 维护时间:2月21日下午13点~17点(

AA和KK平跟3bet的情况 AA和KK平跟3bet的情况 不懂得怎么在深码状态下(150bb+)把游戏玩好或是处理深码的时候不自信? 没事,看完这篇文章你就懂了。 文章主要包

幻之妖姬 《幻之妖姬》是一款以末日废土为题材的二次元卡牌放置游戏,游戏讲述了在公元2582年, 人工智能危机爆发,指挥官学院毕业的少年带领拥有各种能力的

玩德州扑克要面无表情——德扑十大基本攻守策略 玩德州扑克要面无表情——德扑十大基本攻守策略 德州扑克的规则简单,要成为高手却并不容易。真正的德扑高手,应该集运气、与玩家斗智斗勇的气势、耐性

如何计算PLO的底池赔率与胜率 如何计算PLO的底池赔率与胜率 就追逐PLO的听牌来说,持续关注底池赔率和你的胜率很重要。现在我们进一步明确这两个术语。 底池赔率 在扑克中,底池

德州扑克小盲位的打法 德州扑克小盲位的打法 和其他所有位置不同,小盲位会在整手牌里处于不利位置。在本章节里,我会讨论除了两人底洒对抗大盲外(这个情形会在之后讨论)的

德扑多桌锦标赛前期阶段的打法策略 到目前为止我已经写了几篇关于影响多桌德扑锦标赛策略的更广泛的更概念,比如锦标赛跟现金游戏的区别、锦标赛中筹码量的重要性,以及筹码累积和保命存

《龍女郎》8/21 金流系统维护通知 亲爱的玩家您好 : 将于 08/21(三) 07:00 ~ 08:00 停机进行系统升级服务 届时所有金流将无法使用,恢复后将于第一时间告知。 造成您的困扰,敬请见谅 也感谢您

《腥城》3.3.20版本更新 親愛的主人: 全新版本登場,眾多英雄皮膚更新,請主人不容錯過喔~ 3.3.20版本更新 新內容 1.更新【副手專屬裝備】功能 玩家可以通過消耗金幣解鎖