立即玩

Play Poker Online and Win Real Money.

GTO与纳什均衡 GTO与纳什均衡 一、 什么是GTO? GTO(Game Theoretical Optimum),首先要了解这个词汇,中文直译是博弈理论最优(策略),直白点说也就是博弈

GTO与纳什均衡

一、 什么是GTO?

GTO(Game Theoretical Optimum),首先要了解这个词汇,中文直译是博弈理论最优(策略),直白点说也就是博弈论中的最优策略。那么我们如果要了解GTO,那就必须了解博弈理论。

博弈论(Game Theory)本身是一门学科,而且是比较前沿的那种,那么我这里就一笔带过,讲一些最基本的原理。用一个比较简单的定义:博弈论是二人(或者更多人)在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略(以上没看懂的话问题也不大)。

1658280496716940.

二、 纳什均衡

说到博弈论,就必须得提到纳什均衡。纳什均衡是这样一种状态:博弈中的每一方都不能通过单方面改变自己的策略来增加收益。现在一些扑克pro热衷于讨论的GTO,其实就是纳什均衡的一部分。那么除了装逼以外,纳什均衡在扑克中有什么其他意义吗?我们可以从两个角度来看这个问题:

1、 对手不能通过调整打法来剥削我们的EV;

2、 面对对手的策略,我们做出了最优对策。

由此看来,纳什均衡可以在扑克中帮助我们实现“绝对的防御”。而其实所谓的GTO,就是求解扑克中的纳什均衡解。关于如何求解纳什均衡,我不在这篇文章中过多讨论。目前大部分的扑克pro会借助各类软件来直接计算纳什均衡范围,帮助他们复盘学习。我这里想谈一下纳什均衡意味着什么。

从之前的描述其实已经可以看出,纳什均衡是不能通过一个人来实现的:你可以做出纳什均衡解中的你的部分的行动(通俗来讲就是你是GTO的),但如果对手不按照纳什均衡解来行动(通俗来讲就是对手部GTO),就不能实现纳什均衡。

而扑克中的纳什均衡,几乎都是混合策略纳什均衡。这里我们不深入讲纯策略和混合策略,大概意思就是:你拿着同一手牌,纯策略是你必须100%bet或者100%check,而混合策略可以让你bet一部分,check一部分。总之,从定义上看,混合策略纳什均衡解意味着你让对手陷入了这样一个状态:对手无论选择哪一种纯策略,他的EV都是相同的——当然这也意味着他无论采取什么样的混合策略来应对,他的EV也是相同的。

1596446805157211

三、 有关GTO的一些错误观点

从上一节末的结论出发,再结合德州扑克是一个零和博弈(不考虑抽水),于是很多人会得出这样一个结论:

在德州扑克中,如果我是GTO的,那么不管对手是不是GTO,我都会长期保持不输不赢的状态。

他们还会列举一个剪刀石头布的游戏来加以佐证:剪刀石头布中,如果我分别以1/3的概率出剪刀、石头和布,那么无论你怎么应对,我们长期的EV都是0(在这个例子中确实是完全正确的)。

而在扑克中,也有一些例子可以“证明”一个类似的结论:在河牌我们用2/3的nuts和1/3的bluff做一个底池的下注,此时对手的中等牌无论怎么call,他的EV都是0,而我们的EV恒为一个底池(这也是一个完全正确的例子)

1587436568141108

我的观点是:在德州扑克中,这都是一些过于草率的错误结论,只有在非常严格的限定条件下才可能成立。

我们追根溯源,谈一谈纳什均衡的求解:在求解纳什均衡的过程中,我们必须首先剔除严格下策。

什么叫严格下策?在扑克中,fold掉nuts,用完全空气跟注就是明显的严格下策。在剪刀石头布当中,出剪刀、石头、布都不是严格下策,因为他们总是有可能赢的。而在经典的类扑克博弈模型AKQ游戏中,跟注Q就是严格下策。在扑克中,大部分情况下我们的范围内都会存在一些严格下策决定。换句话说,对手的范围完全由中等牌力构成,而你的范围完全两极化的范围这个假设太过于理想化了。既然你不能保证你的对手不会做出严格下策的决定(类似27o call 3bet,hit or fold这样),那么你就不能应用所谓的EV相同法则。而显然,采取了严格下策的对手会使得你的整体GTO策略自动获利。

总之,以上结论只有在对手的策略集完全剔除了严格下策以后才是正确的。

FAQ

拉瓜迪机场有几个航站楼?

拉瓜迪亚机场以其高效的服务和前往纽约市各区的便捷交通而闻名。 该机场共有四个航站楼(A、B、C 和D),每个航站楼都提供一系列便利设施,如餐饮选择、购物商店和休息室。 B 航站楼是最大的航站楼,最近进行了大规模翻修,为乘客提供了现代化的设施和更舒适的体验。

「大瓜」の読み方は?

大瓜(オウリ)はどこ?

黑料是什么意思?

在自媒体行业中,“黑料”通常指博主们私下的不光彩行为或者隐藏的敏感信息。 在聚氨酯组合料中,异氰酸酯组份被称为“黑料”,组合聚醚组份被称为“白料”。 在法律上,洗钱领域中,“洗钱白料”指合法资金或财产通过非法手段进行洗钱、掩饰其来源的行为,“洗钱黑料”则指非法资金或财产通过一系列交易和操作将其合法化的行为。

古代有西瓜吗?

古代的西瓜可能并不甜 根据各地的研究和考证资料显示,古代的西瓜,可能并不红,也不甜,甚至还有点苦味。 根据考古发现,人类食用西瓜的历史已经非常久远了。 在利比亚的西南部,研究人员曾发现5000年前的西瓜籽。 公元前1500年的苏丹遗址,也出现了西瓜的踪迹。16 ก.ค. 2566

大衡村大瓜の読み方は?

〒981-3601 みやぎけんくろかわぐんおおひらむらおおうり 宮城県黒川郡大衡村大瓜

🎨 最新文章 😉 👄 熱門文章 🎰
🎨 推薦文章 🎬

你有打德扑圈的天赋吗? 有位网友在知乎上问到关于玩德扑APP下载是否需要天赋的问题,跟大家分享两位支持率最高的玩家的答案。 子曰吧博主的回答曾经有人说过打NL200(

德州扑克中的数学有多重要? 德州扑克中的数学有多重要? ● 我需要学数学才能够盈利吗? 不,不是必要。可能你不学习数学也可以赢。 然而,不学数学的话你很难成为一个持续盈利的牌手

10月第3周榜单丨飞瓜数据B站UP主排行榜榜单(B站平台)发布!-CSDN博客 文章浏览阅读104次。等维度来体现UP主账号成长的情况,为用户提供B站号综合价值的数据参考,根据UP主成长情况用户能够快速找到。本榜单来源于

两对在同花转牌面该如何游戏? 两对在同花转牌面该如何游戏? 牌局背景及过程 这手牌来自一场无限德州扑克锦标赛。盲注100/200,无前注。桌上玩家筹码量如图。翻前,你在CO位

翻牌圈和转牌圈游戏同花听牌的技巧 翻牌圈和转牌圈游戏同花听牌的技巧 每次你翻前用同花底牌跟注,就有11%的机会在翻牌圈拿到一副同花听牌。能不能玩好这些同花听牌,对你的扑克盈利有

德州中的盲抓是什么意思?盲抓是一种好的策略还是糟糕的行为? “抓一下”这个概念在跟新手玩家解释时很容易迷糊。它的本质其实就是选择性的盲注(一个人在发牌之前就投入底池的筹码)。 抓的数目是大盲注的两倍,算

德州扑克盲注位对战 德州扑克盲注位对战 在中低级别的现场常规桌上,当之前玩家全部弃牌时,盲注位玩家之间通常同意分锅,或者互相之间不打。他们宣称是为了让游戏变快一些

德州口袋对JJ的打法是什么?对子JJ的策略是什么? 大家好,我是喜欢JJ林俊杰不喜欢JJ这手牌的莎莫姐姐。 今天我们要说的JJ,当然跟林俊杰没什么关系。 J俗称钓鱼钩,这个名字真是深得牌手之心,可

《萌娘侵略版》Sideloadly安裝IPA教學 苹果IPA安裝流程 安装前准备工作: * 建议使用WIN10 以上安装 * 安装苹果 iTunes 下载位置 (MAC版无须安装) * 下载对应版本 Sideloadly 。 *【萌娘侵略版】IP

在德州扑克锦标赛成为筹码王之后的打法策略 在德州扑克锦标赛成为筹码王之后的打法策略 在一场扑克锦标赛的任何阶段成为筹码王都会让你感觉爽翻天。除此之外,成为筹码王还有重大的经济效益:你在

德州扑克在有利位置的打法策略 德州扑克在有利位置的打法策略 这一节将详述在大多数扑克场合下如何在有利位置游戏,具体地说,作为按钮玩家在大盲玩家跟注你的率先加注之后的打法。虽

当诈唬或被诈唬时的思考 当诈唬或被诈唬时的思考 1 小的诈唬效果和大的诈唬效果是一样的 牌技欠佳的对手在考虑是否跟注的时候常常都不会考虑底池成败比。因此,面对这类对手,来