立即玩

オンラインでポーカーをプレイしてリアルマネーを獲得しよう。

什么情况下应该咋唬 什么情况下应该咋唬 预期回报和纯策略 首先,让我们追溯到最初始的问题。我们打扑克的目标是什么?是赢钱。更准确地说,是赢尽可能多的钱。在做决定的时

什么情况下应该咋唬

预期回报和纯策略

首先,让我们追溯到最初始的问题。我们打扑克的目标是什么?是赢钱。更准确地说,是赢尽可能多的钱。在做决定的时候,我们要问问自己,哪个行动会有最大的预期回报?

1663636507718588.

在我们的例子中,如果你有一手能获胜的牌,你会做价值下注。在你下注以后,你的对手可能跟注(y),也 可能弃牌(1 – y)。当他跟注时,你会赢下现有的底池,加上你的对手跟注的钱,也就是P + B。当他弃牌时,你只会赢得现有的底池,也就是P。(现有底池 通常指在你下注之前,初始的底池大小。) 因此,如果你有一手获胜牌,你的预期回报Ew (w代表获胜winning)会是

Ew = y(P + B) + (1 – y)P.

如果是一手会失利的牌(你的听牌失败了),情况就会变得更复杂一些。你有可能咋唬(x),也可能过牌放弃这手牌(1 – x)。

如果你选择咋唬,你的对手还是有可能跟注(y),或弃牌(1 – y)。当他跟注时,你会损失这次下注,所以你的净回报是负的,也就是–B。 当他弃牌时,你会赢得现有底池,也就是P。所以当你咋唬时,你的预期回报由这两部分组成:

(1 – y)P – yB.

如果你选择过牌(放弃这手牌),你不会赢到一分钱,所以这种情况你的预期回报是0.综合这些,在你持有一手会失利的牌时,你的预期回报 El (l代表失败losing)会是

El = (1 – x)0 + x(1 – y)P – yB

(综合以上几种情况的可能性).

第一部分是0,我们可以直接忽略,公式变为

El = x(1 – y)P – yB.

如果你知道你的对手从来不跟注(y = 0),你的预期回报公式会简化为:

El, y=0 = xP

为了最大化你的预期回报,你必须让x = 1,这意味着你应该一直咋唬。

而如果你的对手总是跟注(y = 1),你的预期回报公式变为

El, y=1 = – xB

在这种情况下,为了最大化你的预期回报,你必须让x = 0,也就意味着你应该永远不要咋唬。(记住这条法则永远不要咋唬一个跟注站)

用博弈论的方法,我们只计算了你的最佳状况,知道你的对手在两种特殊情况时的策略。但是这是两种非常极端的情况,所以这被称为纯策略。在现实的扑克游戏中,对手们会更加难以预料。他会有一定的概率跟注你的下注(y不是0也不是1)。他会有一种混合策略。

1663203097655925.

最佳策略

你的对手可以选择一个跟注频率y,可以让你无论使用什么策略时(也就是无论x是多少),你的预期回报都不会改变。我们用yopt表示这个跟注频率(在某种意义上yopt是y的最佳值).

yopt很容易计算。你可以在后面的附录里找到它的计算公式:

yopt = P/(P + B).

在我们的例子中,P = B = $100,所以yopt = 1/2。如果你的对手有恰好一半的时候会跟注,你就不能在策略上战胜他了。如果你的对手根据y = yopt的策略打牌,你的预期回报将会是

El,y=yopt = xPB/(P + B) – PB/(P + B) = 0.

(就是把yopt带入求El的一般公式中). 如果x没有出现在公式中,结果也不会发生变化,还是0,所以无论你选择什么策略(无论x是多少),你都不能提高或降低你的预期回报。

有趣的是yopt只取决于底池大小和下注大小,不受q的影响。这表明yopt并不总是y的最佳值。例如当 q=1时,也就是你的对手确定你有一手获胜牌,他就不会有一半的次数跟注,事实上他根本不会跟注。他会使用y=0的策略。我们会在以后的内容中看到,在什 么意义上yopt才是最佳值。

同样的,你也可以选择一个x,而无论对手选择什么样的策略(无论y是多少),他的预期回报都是一样的。我们用xopt表示这个x的特殊值。但是,求xopt的值会更复杂一些,它的公式是

xopt = qB/(1 – q)(P + B).

(如果你对细节感兴趣,请参考下面附录的内容)如果你常常用会失败的牌咋唬,对手的预期回报为

Eop = (1 – q)P – qPB/(P + B).

这个公式里没有y,所以你的对手不能改变他的预期回报。

1661390800961666.

在我们的例子中P = B = $100,q = 0.2,所以xopt = 1/8。如果你有1/8的可能性咋唬,你的对手就不能在策略上战胜你了,即使他非常善于观察,了解你的策略(知道x = xopt)。如果你咋唬的可能性比1/8较多或较少,那些善于观察的对手就会发掘出你策略上的弱点。所以当你面对一个非常优秀的对手时,xopt可以确保 你的策略是最佳的。

一个优秀的对手会多么频繁地跟注你的下注?yopt已经给出了答案。如果你根据x = xopt的策略打牌,他可以选择任何策略,但都不能提高或降低他们的预期回报。如果对手不使用y = yopt的策略打牌,作为一个善于观察的玩家,你就可以利用他的错误,选择最佳的回应方式。唯一不能利用他策略上的错误的情况是他的y = yopt,现在无论你使用怎样的策略,你的预期回报都不会改变。要记住,如果你不使用xopt的策略,你的对手也会调整策略来利用你的缺陷。

现在我们知道xopt和yopt在什么时候才是最佳的:在它们可以提供不可被对手利用的策略时。在博弈论中, 这两个策略(xopt, yopt )被称为纳什均衡点。这在博弈论和经济学中都是非常重要的概念。(没错,就是电影 美丽心灵中的纳什,1994年诺贝尔经济学奖的获得者). 现在我们知道它在扑克中也扮演着重要的角色。

FAQ

中国什么时候有西瓜?

宋末元初,西瓜由元军带入广州,随后迅速传遍岭南地区。 元代,西瓜在北方已经形成规模化种植,并且成为农民创收的重要经济作物;东南的江淮、闽浙地区也开始大范围推广栽培,只是品质较北方稍差。 明代,西瓜种植在我国南北各地继续推进,栽培面积和规模显著增长,品质也快速提升。 李时珍《本草纲目》记载:“(西瓜)今则南北皆有”。26 ส.ค. 2566

拉瓜迪机场有几个航站楼?

拉瓜迪亚机场以其高效的服务和前往纽约市各区的便捷交通而闻名。 该机场共有四个航站楼(A、B、C 和D),每个航站楼都提供一系列便利设施,如餐饮选择、购物商店和休息室。 B 航站楼是最大的航站楼,最近进行了大规模翻修,为乘客提供了现代化的设施和更舒适的体验。

吃瓜什么梗?

2016年,有人将“不发言只围观”的普通网民称为“吃瓜群众”,用来表示一种不关己事、不发表意见仅围观的状态。 2016年12月14日,入选语言文字规范类刊物《咬文嚼字》杂志社发布的“2016年十大流行语”。

什么是胡瓜?

黄瓜(学名:Cucumis sativus)也称胡瓜、青瓜、刺瓜、瓜仔哖,属葫芦科黄瓜属植物。 广泛分布于中国各地,是中国夏季主要蔬菜,且为温室产品之一。

黑料网是什么?

黑料网- 今日黑料独家爆料正能量黑料网是一家专注于独家爆料的新闻网站,每天为大家带来最新鲜、独家的黑料消息。 正能量是黑料网的独特标签,不仅会揭发一些黑暗的现象,更会积极传递正能量,引导社会风气的向好的方向发展。 作为一家优秀的媒体,黑料网立足于提供真实的新闻信息,为公众揭露一些不为人知的**。

😚 最新文章 🎨 😘 熱門文章 🎯
😈 推薦文章 😈

公众号svg互动_96微信编辑器 微信SVG互动样式,选择后可以在微信编辑器内进行SVG交互式图文制作,操作简单,无需代码。 应用原创应用原创应用原创应用原创应用原创应用原创应

德州扑克牌技优秀的表现 德州扑克牌技优秀的表现 德州扑克初学者在牌路成长的过程中经常会问自己这样类似的问题,怎么才能知道自己变得优秀了?用什么方法才能衡量自己是否进步

bluff是什么意思? bluff是什么意思? bluff在德州扑克中是“诈唬”、“偷鸡”、“诈鸡”的意思。 bluff是指故意让其他玩家误以为自己是一副强牌或者一副弱

德州扑克最全的玩法解释 德州扑克最全的玩法解释 本文读完需要3分钟 速读仅需2分钟 德州扑克采用52张扑克牌(除去两张王牌),游戏玩家人数限制在2~9人。在牌局开始时,荷

熱銷排行榜 瓜瓜園官方購物網 瓜瓜園官方購物網讓您在家即可輕鬆購買瓜瓜園農場特選優質台農57號黃地瓜-冰烤蕃薯,冰熱兩吃帶給您不同層次的口感,團購熱銷商品值得您一再品嚐。

单挑是检验德州扑克技术的唯一标准? 单挑是检验德州扑克技术的唯一标准? 德州扑克根据游戏人数的不同,可以分为满员桌(9人桌)、6人桌和单挑桌(Heads-up,简称HU),其中H

怎么从娱乐玩家身上榨取价值 怎么从娱乐玩家身上榨取价值 你在德州扑克中获得成功最关键的一步,特别是在低级别中,就是有能力从娱乐玩家身上获取最大的价值。这个因素之所以重要是

用范围的底端诈唬 用范围的底端诈唬 有时你会发现自己的底牌在范围的底端,一点摊牌价值也没有。即使你所在的牌局不建议诈唬,但如果你发现自己的底牌在范围的绝对底端时

3bet底池测验题 3bet底池测验题 你作为一名3bet底池的防守者够出色吗?以下是一个与3bet底池有关的测试,请花些时间仔细思考,因为这十道题比较难。 以下牌

推测对手范围时应避免的错误 推测对手范围时应避免的错误 顶级职业牌手擅长于把对手的底牌推测到一个范围。这种千锤百炼的实战技能也促使他们做出更有利可图的决策。 与之相比,那些

德州扑克玩家通常不会下注的情况 德州扑克玩家通常不会下注的情况 你过牌,你的对手下注。他有什么牌呢?他可以有一手强牌、一手他想保护的弱牌、一手强听牌、一手弱听牌,或是空气牌。