Çevrimiçi Poker Oyna ve Gerçek Para Kazan.

WPT Global

德州AI和贝叶斯法则的利用 之前的德州游戏AI会利用贝叶斯法则(一种概率反演算的定律)来推断对手的手牌范围,这种办法会导致AI产生极大的漏洞。冷扑用的办法是不预先假定对

之前的德州游戏AI会利用贝叶斯法则(一种概率反演算的定律)来推断对手的手牌范围,这种办法会导致AI产生极大的漏洞。冷扑用的办法是不预先假定对手的手牌范围,而是考虑对手如果拿着某手牌做出这样的行动合理不合理,按照他自己的纳什均衡,这样的动作会让他损失多少EV,从而调整自己的行动最大化对手的损失。

举个例子,这也是一般人类和AI很棘手的问题。一个人上桌第一手牌就翻牌前推了你200个盲注,你拿A9同花应该跟注还是弃牌。一般人类和之前的德扑AI往往会推测对手手牌范围,然后考虑平均来说跟注值不值得。推测对手手牌范围的行为会让自己打法产生漏洞,容易被高手钻空子。冷扑利用了2014年发明的一种新算法,他不推测对手平均手上拿什么牌,而是针对每种手牌考虑德扑规则:假如对手拿27它应不应该全压,如果按照他自己的纳什均衡策略,他全压27损失巨大。那如果他拿AA应不应该全压,按照他的纳什均衡策略,AA全压太浪费了,损失也是巨大。一个一个的考察他每种手牌这样打会损失多少EV。然后我们选择一种打法让他长期来说损失EV最大的打法。也就是说,你可以每把拿烂牌推我,但是万一我拿到好牌call你,你损失巨大。所以我不怕你这样打。(注意冷扑不会考虑之前玩家游戏历史,所以连续翻牌前推10次和翻牌前推1次对冷扑是一样的)

第四,之前德扑AI会把对手的下注大小简单的四舍五入,这是一个大漏洞,一来会导致纳什均衡计算出错,二来会导致人类利用AI这点来剥削AI。冷扑的做法是如果人类做出了不寻常的奇怪下注,冷扑不会简单的四舍五入,而是会针对这种下注方法独立的展开纳什均衡计算。他们的实验发现,使用这种算法,可以让德扑玩法冷扑被人类高手剥削的可能性降低为原来的1/12. 但是这个方法只用在转牌和河牌圈(后两轮)前两轮还是简单四舍五入。

最后,也是让冷扑变得强大的一个重要系统,就是冷扑能总结一整天下来的游戏,修补自己的漏洞。它会优先考察自己最常见的错误,每个晚上冷扑大概能修补自己3个漏洞(其实还有更多漏洞,不过电脑的计算量限制下冷扑只能修补两三个漏洞)。

冷扑的弱点

开发者承认冷扑最大的弱点是不会考虑对手打法。就算你从来不咋呼,或者每手牌都咋呼,冷扑以及现在主流的德扑AI都不会利用你的漏洞。德扑AI只会坚持纳什均衡打法,利用人类偏离纳什均衡的错误来盈利。这点和人类玩家很不一样。

冷扑即使在晚上的自我进化阶段也不会去寻找人类的漏洞。

不过开发者说,这个弱点也恰好同时是冷扑的优点。因为假如你要去剥削对手的弱点,那么你自己就会卖出破绽,这样人类高手反而会利用你的破绽来剥削你。比如你看对手把把咋呼,下一把你想着要去抓对手咋呼,那你必然会拿弱牌跟注对手。这时你自己就卖了个漏洞出来,对手有可能利用这个漏洞来反打你。而抓漏洞的游戏上,AI肯定玩不过人类高手。真正好的打法是不管对手有没有漏洞,AI寻找纳什最优打法的能力肯定比人类强,只要AI按照最优打法来打,人类一犯错,AI就能盈利。

事实上人类顶尖高手的明显漏洞非常小,AI尝试去抓人类漏洞是危险的行为。AI和普通人类玩家交手也能取得很大的优势。但是剥削弱玩家的德扑教学能力上,AI是比不过人类高手的。(不过反正坚持按照GTO(最优打法)玩都能赢,为什么一定要想着去剥削对手呢)

此外很多人类以为AI会侦查他们的漏洞,所以故意卖漏洞给AI,这也造成了他们进一步偏离纳什均衡,反而承受更大的损失。

FAQ

吃瓜的瓜是什么瓜?

追本溯源,「吃瓜」中的瓜,指的其實是「西瓜」。Nov 11, 2023

吃瓜是怎么来的?

该词源于2016年网络热词“不明真相的吃瓜群众”(或简写为“吃瓜群众”),更早则来自百度贴吧中“前排出售瓜子”、“吃瓜子看戏”等用语,而“不明真相”是网民用来反讽中国官方话语中常见的“少数别有用心”、“不明真相的群众”等固定短语。

黑料是什么意思?

在自媒体行业中,“黑料”通常指博主们私下的不光彩行为或者隐藏的敏感信息。 在聚氨酯组合料中,异氰酸酯组份被称为“黑料”,组合聚醚组份被称为“白料”。 在法律上,洗钱领域中,“洗钱白料”指合法资金或财产通过非法手段进行洗钱、掩饰其来源的行为,“洗钱黑料”则指非法资金或财产通过一系列交易和操作将其合法化的行为。

什么是胡瓜?

黄瓜(学名:Cucumis sativus)也称胡瓜、青瓜、刺瓜、瓜仔哖,属葫芦科黄瓜属植物。 广泛分布于中国各地,是中国夏季主要蔬菜,且为温室产品之一。

微短剧是什么?

尽管叫法不同,本文探讨的短剧,更多是当下颇为流行的微短剧。 根据国家广电总局的定义,微短剧,全称为网络微短剧,是指“单集时长从几十秒到15分钟左右、有着相对明确的主题和主线、较为连续和完整的故事情节”的剧集。 这类形式此前更常见于长视频平台,如此前爆火的《招惹》《授她以柄》。Mar 15, 2024

🎊 最新文章 👄 🎊 熱門文章 🥁
🎗️ 推薦文章 🎁

四条撞四条!这种活久见的牌局看得人喷血 四条撞四条!这种活久见的牌局看得人喷血 1 人物介绍 Andrew Robl:1986年生,美国著名职业扑克牌手,锦标赛收入超过$400w,2013 Aussie Million $10

什么是隔离打法? 如果我说,大家都是喜欢玩大底池的人,这句话没说错吧?不管是在任何形式牌桌上,看到大底池,没人会不心动吧?可有时候,不管底池是大是小,能够赢下

《夢姬》如何回报客服? 请于客服信箱: email protected 回复您的游戏问题,我们将依来信顺序尽速处理您的问题。 回复格式如下: 1. 角色名 2. 游戏名 3. 帐号(可于悬浮钮最上方查看) 4. ID(可

紧到爆!99.99%的人都不可能做到的弃牌 紧到爆!99.99%的人都不可能做到的弃牌 今天我们来分析一个难打到没朋友的情况。这个倒霉的主人公是罗马尼亚的Dany Parlafes。这是2

同色AT的打法技巧 同色AT的打法技巧当你低头看到同花AT时,你会想到什么?有些人喜欢它,有些人讨厌它,但毫无疑问,如果你打好了,同花AT可能是一副非常有利可图

德州扑克获胜概率的计算方法 德州扑克获胜概率的计算方法 概率计算 所谓德克萨斯扑克的概率,简单说,就是等来某种获胜牌型的可能性(成牌概率),与底池提供筹码(底池概率)之间的

扑克结果论!99%扑克人都有过此病 世界的竞争,一律以结果为导向,以结果论论英雄,我们不可能说,一个人练习跑步很努力,结果奥运会比跑得比别人慢,我们把金牌发给那些花时间比较长的

Ed Miller谈德州扑克多回合诈唬 Ed Miller谈德州扑克多回合诈唬 在无限德州扑克$2/$5级别常规局,许多牌手开始尝试诈唬,包括多回合诈唬(multi-street bluf

拿到强牌是赶走对手还是让他们留在底池? 拿到强牌是赶走对手还是让他们留在底池? 引言:Jonathan Little是两次WPT冠军,锦标赛奖金超过600万美元,同时他还是一位16本畅

调整下注尺度的好处是什么? 调整下注尺度的好处是什么?如需系统地学习德州扑克最优下注尺度,请点击查看视频课程:https://www.moshike.com/a/469

拿到好牌翻前无人跟注怎么办 拿到好牌翻前无人跟注怎么办 上周,我又在桌上最紧的家伙那儿听说了这种事。 他说:“我就知道,我最终拿到了一手好牌,但每个人都弃牌了。”把牌还给荷

德扑大师Negreanu经典牌局分析 德扑大师Negreanu经典牌局分析 1 牌局分析 这手牌简直是经典杰作。你在真人德扑圈历史上不会看到很多这样的牌,我们可以好好感受一下大师的风采