立即玩

Main Poker Dalam Talian dan Menang Wang Sebenar.

德州AI和贝叶斯法则的利用 之前的德州游戏AI会利用贝叶斯法则(一种概率反演算的定律)来推断对手的手牌范围,这种办法会导致AI产生极大的漏洞。冷扑用的办法是不预先假定对

之前的德州游戏AI会利用贝叶斯法则(一种概率反演算的定律)来推断对手的手牌范围,这种办法会导致AI产生极大的漏洞。冷扑用的办法是不预先假定对手的手牌范围,而是考虑对手如果拿着某手牌做出这样的行动合理不合理,按照他自己的纳什均衡,这样的动作会让他损失多少EV,从而调整自己的行动最大化对手的损失。

举个例子,这也是一般人类和AI很棘手的问题。一个人上桌第一手牌就翻牌前推了你200个盲注,你拿A9同花应该跟注还是弃牌。一般人类和之前的德扑AI往往会推测对手手牌范围,然后考虑平均来说跟注值不值得。推测对手手牌范围的行为会让自己打法产生漏洞,容易被高手钻空子。冷扑利用了2014年发明的一种新算法,他不推测对手平均手上拿什么牌,而是针对每种手牌考虑德扑规则:假如对手拿27它应不应该全压,如果按照他自己的纳什均衡策略,他全压27损失巨大。那如果他拿AA应不应该全压,按照他的纳什均衡策略,AA全压太浪费了,损失也是巨大。一个一个的考察他每种手牌这样打会损失多少EV。然后我们选择一种打法让他长期来说损失EV最大的打法。也就是说,你可以每把拿烂牌推我,但是万一我拿到好牌call你,你损失巨大。所以我不怕你这样打。(注意冷扑不会考虑之前玩家游戏历史,所以连续翻牌前推10次和翻牌前推1次对冷扑是一样的)

第四,之前德扑AI会把对手的下注大小简单的四舍五入,这是一个大漏洞,一来会导致纳什均衡计算出错,二来会导致人类利用AI这点来剥削AI。冷扑的做法是如果人类做出了不寻常的奇怪下注,冷扑不会简单的四舍五入,而是会针对这种下注方法独立的展开纳什均衡计算。他们的实验发现,使用这种算法,可以让德扑玩法冷扑被人类高手剥削的可能性降低为原来的1/12. 但是这个方法只用在转牌和河牌圈(后两轮)前两轮还是简单四舍五入。

最后,也是让冷扑变得强大的一个重要系统,就是冷扑能总结一整天下来的游戏,修补自己的漏洞。它会优先考察自己最常见的错误,每个晚上冷扑大概能修补自己3个漏洞(其实还有更多漏洞,不过电脑的计算量限制下冷扑只能修补两三个漏洞)。

冷扑的弱点

开发者承认冷扑最大的弱点是不会考虑对手打法。就算你从来不咋呼,或者每手牌都咋呼,冷扑以及现在主流的德扑AI都不会利用你的漏洞。德扑AI只会坚持纳什均衡打法,利用人类偏离纳什均衡的错误来盈利。这点和人类玩家很不一样。

冷扑即使在晚上的自我进化阶段也不会去寻找人类的漏洞。

不过开发者说,这个弱点也恰好同时是冷扑的优点。因为假如你要去剥削对手的弱点,那么你自己就会卖出破绽,这样人类高手反而会利用你的破绽来剥削你。比如你看对手把把咋呼,下一把你想着要去抓对手咋呼,那你必然会拿弱牌跟注对手。这时你自己就卖了个漏洞出来,对手有可能利用这个漏洞来反打你。而抓漏洞的游戏上,AI肯定玩不过人类高手。真正好的打法是不管对手有没有漏洞,AI寻找纳什最优打法的能力肯定比人类强,只要AI按照最优打法来打,人类一犯错,AI就能盈利。

事实上人类顶尖高手的明显漏洞非常小,AI尝试去抓人类漏洞是危险的行为。AI和普通人类玩家交手也能取得很大的优势。但是剥削弱玩家的德扑教学能力上,AI是比不过人类高手的。(不过反正坚持按照GTO(最优打法)玩都能赢,为什么一定要想着去剥削对手呢)

此外很多人类以为AI会侦查他们的漏洞,所以故意卖漏洞给AI,这也造成了他们进一步偏离纳什均衡,反而承受更大的损失。

FAQ

黑料网是什么?

黑料网- 今日黑料独家爆料正能量黑料网是一家专注于独家爆料的新闻网站,每天为大家带来最新鲜、独家的黑料消息。 正能量是黑料网的独特标签,不仅会揭发一些黑暗的现象,更会积极传递正能量,引导社会风气的向好的方向发展。 作为一家优秀的媒体,黑料网立足于提供真实的新闻信息,为公众揭露一些不为人知的**。

吃瓜的瓜是什么瓜?

追本溯源,「吃瓜」中的瓜,指的其實是「西瓜」。Nov 11, 2023

三黑料是什么意思?

料:主要指银行卡账号、密码,持卡人身份证号及绑定手机号四大类信息(又称CVV四大件)。 内料:指境内卡的四大件。 外料:指境外卡的四大件。 轨道料:指通过改装POS机得到的银行卡信息,这种信息一般非常精准。

吃瓜的瓜是什么瓜?

追本溯源,「吃瓜」中的瓜,指的其實是「西瓜」。Nov 11, 2023

拉瓜迪机场有几个航站楼?

拉瓜迪亚机场以其高效的服务和前往纽约市各区的便捷交通而闻名。 该机场共有四个航站楼(A、B、C 和D),每个航站楼都提供一系列便利设施,如餐饮选择、购物商店和休息室。 B 航站楼是最大的航站楼,最近进行了大规模翻修,为乘客提供了现代化的设施和更舒适的体验。

📺 最新文章 🎭 🔥 熱門文章 🎺
🎈 推薦文章 📺

德州扑克中不能诈唬的情况 德州扑克中不能诈唬的情况 诈唬是无限德州扑克风靡世界的一个原因。虽然诈唬是所有德州扑克形式的游戏的一部分,但无限德州扑克把它提升到了一个级别。

翻前这10种情况,只有真正的德州扑克高手才能处理好 翻前这10种情况,只有真正的德州扑克高手才能处理好 都说想要在德州扑克中盈利主要是看翻后技术,可要是连翻前打不好,翻后再强也白搭。所以今天我们

《三國志侵略版》7/4 (四) 维护 07/04(四)10:00-11:30服務器將會停機維護, 維護前請記得領取獎勵,並且提早下線,感謝您的支持。 ★SP蝕龍煉血.關羽卡池返場 ★勵

《龍女郎》10/30 (三) 维护 各位玩家, 我们将于2024年10月30日(三) 上午10:00 GMT+8 进行维护更新, 预计于中午12:00 GMT+8完成维护过程,请耐心等候。 期间玩家

3种牌例可以不弃牌 许多玩家在刚开始学习扑克时,经常会有“紧就是一切”和“不中牌就跑”这种心态。这种打法确实能让他们远离麻烦,甚至可能赚到一点钱,尤其当他们的对

德州扑克GTO测试题 德州扑克GTO测试题 1)2K/4K/8K 8人桌,有效筹码400K Linus在MP用8♥8♣加注20K,身后的HJ对手贴身跟注,其他人弃牌,底

翻前多人平跟入池,该怎么打? 翻前多人平跟入池,该怎么打? 在低级别德扑游戏中,平跟溜入底池并不罕见,所以制定策略应对溜入玩家是很有必要的。 当然,在某些时候,翻牌前平跟溜入

德州扑克锦标赛新手参赛指南 本文阅读提示:谨供会玩德州扑克(至少知道规则)但从未参加过或很少参加德州扑克锦标赛(无论是SNG单桌锦标赛或MTT多桌锦标赛)的朋友参考,我

《女神轉生》8/1 (二) 维护完成 親愛的玩家您好: 為了帶給大家更優質的遊戲體驗,我們將於8月1日(週二)09:00-15:00 進行伺服器更新維護作業,請於維護前提早做好離線準

中等口袋对子在翻牌前的打法 中等口袋对子在翻牌前的打法 中等口袋对子(77-JJ)是强牌,但它们经常让许多牌手感到头痛。这类牌的问题是,我们知道它们通常能赢下底池,但玩起

《幻之妖姬》iOS掉签排除方法 亲爱的冒险者您好: iOS如遇到无法启动APP状况,再请依照下面步骤排除 1.请至平台官网重新下载 2.下载完成请至设置->通用->V

松凶玩家的打法 松凶玩家的打法 松凶的打法要求在你没拿到大牌时仍要去偷底池,优秀的松凶玩家为了实现这一目的必须准备好各种有用的战术,这里我们列出了松凶玩家拿着