立即玩

Maglaro ng Poker Online at Manalo ng Totoong Pera.

德州AI和贝叶斯法则的利用 之前的德州游戏AI会利用贝叶斯法则(一种概率反演算的定律)来推断对手的手牌范围,这种办法会导致AI产生极大的漏洞。冷扑用的办法是不预先假定对

之前的德州游戏AI会利用贝叶斯法则(一种概率反演算的定律)来推断对手的手牌范围,这种办法会导致AI产生极大的漏洞。冷扑用的办法是不预先假定对手的手牌范围,而是考虑对手如果拿着某手牌做出这样的行动合理不合理,按照他自己的纳什均衡,这样的动作会让他损失多少EV,从而调整自己的行动最大化对手的损失。

举个例子,这也是一般人类和AI很棘手的问题。一个人上桌第一手牌就翻牌前推了你200个盲注,你拿A9同花应该跟注还是弃牌。一般人类和之前的德扑AI往往会推测对手手牌范围,然后考虑平均来说跟注值不值得。推测对手手牌范围的行为会让自己打法产生漏洞,容易被高手钻空子。冷扑利用了2014年发明的一种新算法,他不推测对手平均手上拿什么牌,而是针对每种手牌考虑德扑规则:假如对手拿27它应不应该全压,如果按照他自己的纳什均衡策略,他全压27损失巨大。那如果他拿AA应不应该全压,按照他的纳什均衡策略,AA全压太浪费了,损失也是巨大。一个一个的考察他每种手牌这样打会损失多少EV。然后我们选择一种打法让他长期来说损失EV最大的打法。也就是说,你可以每把拿烂牌推我,但是万一我拿到好牌call你,你损失巨大。所以我不怕你这样打。(注意冷扑不会考虑之前玩家游戏历史,所以连续翻牌前推10次和翻牌前推1次对冷扑是一样的)

第四,之前德扑AI会把对手的下注大小简单的四舍五入,这是一个大漏洞,一来会导致纳什均衡计算出错,二来会导致人类利用AI这点来剥削AI。冷扑的做法是如果人类做出了不寻常的奇怪下注,冷扑不会简单的四舍五入,而是会针对这种下注方法独立的展开纳什均衡计算。他们的实验发现,使用这种算法,可以让德扑玩法冷扑被人类高手剥削的可能性降低为原来的1/12. 但是这个方法只用在转牌和河牌圈(后两轮)前两轮还是简单四舍五入。

最后,也是让冷扑变得强大的一个重要系统,就是冷扑能总结一整天下来的游戏,修补自己的漏洞。它会优先考察自己最常见的错误,每个晚上冷扑大概能修补自己3个漏洞(其实还有更多漏洞,不过电脑的计算量限制下冷扑只能修补两三个漏洞)。

冷扑的弱点

开发者承认冷扑最大的弱点是不会考虑对手打法。就算你从来不咋呼,或者每手牌都咋呼,冷扑以及现在主流的德扑AI都不会利用你的漏洞。德扑AI只会坚持纳什均衡打法,利用人类偏离纳什均衡的错误来盈利。这点和人类玩家很不一样。

冷扑即使在晚上的自我进化阶段也不会去寻找人类的漏洞。

不过开发者说,这个弱点也恰好同时是冷扑的优点。因为假如你要去剥削对手的弱点,那么你自己就会卖出破绽,这样人类高手反而会利用你的破绽来剥削你。比如你看对手把把咋呼,下一把你想着要去抓对手咋呼,那你必然会拿弱牌跟注对手。这时你自己就卖了个漏洞出来,对手有可能利用这个漏洞来反打你。而抓漏洞的游戏上,AI肯定玩不过人类高手。真正好的打法是不管对手有没有漏洞,AI寻找纳什最优打法的能力肯定比人类强,只要AI按照最优打法来打,人类一犯错,AI就能盈利。

事实上人类顶尖高手的明显漏洞非常小,AI尝试去抓人类漏洞是危险的行为。AI和普通人类玩家交手也能取得很大的优势。但是剥削弱玩家的德扑教学能力上,AI是比不过人类高手的。(不过反正坚持按照GTO(最优打法)玩都能赢,为什么一定要想着去剥削对手呢)

此外很多人类以为AI会侦查他们的漏洞,所以故意卖漏洞给AI,这也造成了他们进一步偏离纳什均衡,反而承受更大的损失。

FAQ

吃瓜是怎么来的?

该词源于2016年网络热词“不明真相的吃瓜群众”(或简写为“吃瓜群众”),更早则来自百度贴吧中“前排出售瓜子”、“吃瓜子看戏”等用语,而“不明真相”是网民用来反讽中国官方话语中常见的“少数别有用心”、“不明真相的群众”等固定短语。

吃瓜的瓜是什么意思?

吃瓜,网络流行词,其含义为在网络环境中,用来表示一种不关己事、不发表意见仅围观的状态。 普通网友们常常戏称自己为“吃瓜群众”。 而“瓜”则表示某个热点八卦事件。 “吃瓜”一词的源于“吃瓜群众”,大概是由戏院火车上推售等地“前排出售瓜子,前排吃瓜子,前排吃瓜”广告词演变而来的。

吃瓜的瓜是什么瓜?

追本溯源,「吃瓜」中的瓜,指的其實是「西瓜」。Nov 11, 2023

中国什么时候有西瓜?

宋末元初,西瓜由元军带入广州,随后迅速传遍岭南地区。 元代,西瓜在北方已经形成规模化种植,并且成为农民创收的重要经济作物;东南的江淮、闽浙地区也开始大范围推广栽培,只是品质较北方稍差。 明代,西瓜种植在我国南北各地继续推进,栽培面积和规模显著增长,品质也快速提升。 李时珍《本草纲目》记载:“(西瓜)今则南北皆有”。26 ส.ค. 2566

吃瓜什么梗?

2016年,有人将“不发言只围观”的普通网民称为“吃瓜群众”,用来表示一种不关己事、不发表意见仅围观的状态。 2016年12月14日,入选语言文字规范类刊物《咬文嚼字》杂志社发布的“2016年十大流行语”。

🌟 最新文章 🎠 👀 熱門文章 🎼
🎊 推薦文章 📺

如何处理反常加注大小 如何处理反常加注大小 你偶尔会遭遇对手不正常的下注,要么过大要么过小。你需要快速辨认出对手下注失小的含义,并对此作出相应得调整。你还需要注意,

德州扑克3bet底池在翻牌圈的玩法 德州扑克3bet底池在翻牌圈的玩法 如果我们翻前3bet到12BB,初始加注玩家跟注,翻牌圈的底池大小约为25BB。如果我们的范围完美两极化,

德州扑克游戏动态、创造力、下注尺度和伪薄价值下注 德州扑克游戏动态、创造力、下注尺度和伪薄价值下注 在上文:杠杆效应、心态、死钱,大家学习到德州扑克中的杠杆效应是冒最小的资金风险让对手冒最大的

拉瓜迪机场有几个航站楼? 拉瓜迪亚机场以其高效的服务和前往纽约市各区的便捷交通而闻名。 该机场共有四个航站楼(A、B、C 和D),每个航站楼都提供一系列便利设施,如餐饮选

我在桓台一中学习过,这个校长在我们当地黑料不少的_风闻 默谚 2021-11-26 08:11 2021-11-26 08:11 【本文来自《山东桓台一中要求高一完成所有课程教学、每日早早读,当地教体局通报》评论区,标题为小编添加】 母校莫名因为这个校长火了?

德州扑克跟注的三个最佳时机 德州扑克跟注的三个最佳时机 德州扑克中的“跟注”是最具有隐蔽性的行动,尤其是占据位置优势的跟注,往往令前面的对手非常难过。虽然跟注不能直接获得

如何辨别对手是否在慢玩一手强牌? 如何辨别对手是否在慢玩一手强牌? 提问者:我有一个顶对,一名牌手转牌圈check-call,然后在河牌圈check-raise我。公共牌有许多

德州扑克阅读公共牌面技巧 德州扑克阅读公共牌面技巧 玩家们在玩德州扑克时,有没有在阅读公共牌面的环节中多分出一些注意?其实这里也有一些技巧需要玩家掌握哦~小编带来了德州

对手的底牌是什么才是最重要的 越发富豪有钱人心理状态承受能力越强。有的真人版德扑游戏玩家便是跟得起,要是翻牌略微打中点什么,给了他一点牌力,他就不容易弃牌了,他有一大把的

德州扑克高级策略:持续下注 德州扑克高级策略:持续下注 自从《哈灵顿在德州扑克卷一》首次提出持续下注以来,这个概念已经有了很大的进化。这个概念的大意,按照哈灵顿的解释是,

check-raise策略 check-raise策略 最近Upswing Lab的一个学员在我们的私人讨论组提交了这手牌,并问我他应该如何游戏自己的范围: Online $1/$2. 6-Handed. Effective Stacks $200. Hero is

王座之慾 本作是一款魔幻题材的战争策略游戏, 在权利与欲望交织的大陆中, 玩家扮演一位指挥官,招募统帅组建军队, 与盟友一起在沙盒世界中自由战斗,攻城略地,