立即玩

Join Best Online Poker Site. Enjoy Real Money online Poker Bonuses

从博弈论的角度分析诈唬(2):特殊情况中的期望回报 从博弈论的角度分析诈唬(2):特殊情况中的期望回报 第一篇文章请点击这里: 从博弈论的角度分析诈唬(1):什么情况下该诈唬 今天,我们要说的是第三

从博弈论的角度分析诈唬(2):特殊情况中的期望回报

第一篇文章请点击这里:

从博弈论的角度分析诈唬(1):什么情况下该诈唬

今天,我们要说的是第三点:

一些特殊情况下的期望回报下面两张表显示了特殊情况中的期望回报。

第一张图表示的是听牌失败时的期望回报,用上一篇文章的例子来计算:

对手的期望回报是你的期望回报的负数,再加上已经在底池中的$100。

他会得到你在下注轮的净损失+现有底池。当然如果你赢下底池的话,你的净损失是– $100,他没有回报。

来看看最简单的情况:当你的期望回报是0时,你的筹码量不会发生变化,因此你不会赢下底池,底池会被对手赢走。由于我们已经玩到河牌圈,所以这不是一个零和博弈。

如果你知道什么时候诈唬,什么时候价值下注,而对手却不知道,对他来说(也可能是对你),下面的这个图表会更有用。

这张表显示的是综合获胜和失败之后,你的期望回报。我们假设过,你有20%的时候领先,80%的时候落后,因此你的平均期望回报是 qEw + (1 – q)El。(这个结果的负值+底池现有的$100=对手的期望回报Eop。)

结论当你面对优秀的对手时,最好的选择就是利用纳什均衡点为你提供的策略:xopt。在这种情况对手会用 yopt的策略打牌。如果他没有使用,他就在犯错(也说明他不是一个优秀的玩家),你就可以利用他的错误找到最佳的打法。

如果他经常跟注,你就少诈唬,如果他很少跟注,你就多诈唬。如果你能猜到他的跟注频率,就可以根据期望回报最大化的原则,计算自己应该诈唬的频率。

附录◆◆yopt是怎样计算的◆◆如果y = yopt,无论x是多少,你的期望回报都不会改变。让我们先假设x = 0,这时你什么牌也赢不了,公式是:

El = 0

现在假设x = 1,El的公式变为

El = (1 – yopt)P – yoptB

因为x=0和x=1时的期望回报一样,所以

(1 – yopt)P – yoptB = 0,

所以

(1 – yopt)P = yoptB,

P – yoptP = yoptB,

P = yopt(P + B),

最后

yopt = P/(P + B)

◆◆从对手的角度来看◆◆现在我们从对手的视角看看这个问题。

首先我们要列出他的期望回报Eop。由于他不知道你的牌是领先还是落后,所以他的期望回报还会受到q的影响,所以这个公式会复杂一点:

Eop = – qyB + q(1 – y)0 + (1 – q)xy(P + B) + x(1 – y)0 + (1 – x)P

– qyB 表示你有优胜牌,你下注,他跟注,并且输了。

q(1 – y)0表示你有优胜牌,但是他弃牌,没有输赢。

(1 – q)xy(P + B) + x(1 – y)0 + (1 – x)P是他领先时的情况。

方括号中xy(P + B)表示你诈唬,他跟注,他赢得底池和你的下注。

x(1 – y)0 表示你诈唬,他弃牌,没有盈利和损失。

(1 – x)P表示你弃牌,他赢下底池的情况(包括他过牌赢下摊牌和他下注你弃牌两种情况)

省略其中为0的部分,我们得到

Eop = (1 – q)xy(P + B) + (1 – x)P – qyB

如果对手知道你从不诈唬(x = 0),那他的最佳打法是什么?他永远不会跟注,在上面的公式中如果用0代替x,我们得到

Eop x=0 = (1 – q)P– qyB

为了使结果最大化,我们必须让y = 0 (永远不跟注)。

反过来,如果对手知道你总是诈唬(x = 1),那他就很难找到最佳应对方式了。如果x = 1,我们得到

Eop x=1 = (1 – q)y(P + B) – qyB = y(1 – q)(P + B) – qB

如果

(1 – q)(P + B) – qB > 0,

y = 1 (总是跟注)会让对手的期望回报最大化。

如果

(1 – q)(P + B) – qB < 0,

他就应该使用 y = 0 (永远不跟注)的策略。

(1 – q)(P + B) – qB < 0

意味着

(1 – q)(P + B) < qB,

P + B – qP – qB < qB,

P + B < q(P + 2B),

最后

q > (P + B)/(P + 2B)

在我们的例子中,P = B = $100,如果q > 2/3,对手应该永不跟注(即使他知道你总是下注;因此在这种情况中你总是应该诈唬), 当q < 2/3时,他应该总是跟注(如果他知道你总是诈唬)。记住,这个q的值也仅取决于底池大小和下注大小。

◆◆xopt是怎么计算的?◆◆如果x = xopt,那么无论y是多少,对手的期望回报都不会改变。和之前一样,先假设y = 0。Eop的公式为

Eop = (1 – q)(1 – xopt)P

现在假设y = 1,我们得到

Eop = (1 – q) xopt (P + B) + (1 – xopt)P – qB

因为y=0和y=1时的Eop一样,我们得到

(1 – q)(1 – xopt)P = (1 – q) xopt (P + B) + (1 – xopt)P – qB,

因此

qB = (1 – q) xopt (P + B)

(两边都有(1 – q)(1 – xopt)P,因此可以消掉),所以最终我们得到

xopt = qB/(1 – q)(P + B)

当我们讨论频率时,我们通常用 0.2代替20%,用0.5代替50%等等。一件不可能的事件发生的可能性是0 (0%),一件确定的事发生的可能性是1 (100%)。剩下的其他事件发生的可能性在0和1之间。https://www.moshike.com/

FAQ

什么是胡瓜?

黄瓜(学名:Cucumis sativus)也称胡瓜、青瓜、刺瓜、瓜仔哖,属葫芦科黄瓜属植物。 广泛分布于中国各地,是中国夏季主要蔬菜,且为温室产品之一。

吃瓜是怎么来的?

该词源于2016年网络热词“不明真相的吃瓜群众”(或简写为“吃瓜群众”),更早则来自百度贴吧中“前排出售瓜子”、“吃瓜子看戏”等用语,而“不明真相”是网民用来反讽中国官方话语中常见的“少数别有用心”、“不明真相的群众”等固定短语。

微短剧是什么?

尽管叫法不同,本文探讨的短剧,更多是当下颇为流行的微短剧。 根据国家广电总局的定义,微短剧,全称为网络微短剧,是指“单集时长从几十秒到15分钟左右、有着相对明确的主题和主线、较为连续和完整的故事情节”的剧集。 这类形式此前更常见于长视频平台,如此前爆火的《招惹》《授她以柄》。Mar 15, 2024

「大瓜」の読み方は?

大瓜(オウリ)はどこ?

拉瓜迪机场有几个航站楼?

拉瓜迪亚机场以其高效的服务和前往纽约市各区的便捷交通而闻名。 该机场共有四个航站楼(A、B、C 和D),每个航站楼都提供一系列便利设施,如餐饮选择、购物商店和休息室。 B 航站楼是最大的航站楼,最近进行了大规模翻修,为乘客提供了现代化的设施和更舒适的体验。

🎤 最新文章 😏 🎰 熱門文章 🎻
😏 推薦文章 🎊

超额下注战术最大化利用对手的弱点 超额下注战术最大化利用对手的弱点 “超额下注(Overbetting)”战术经常会被德州扑克网站里的玩家所提到。据了解,Prahlad Frie

德州中的盲抓是什么意思?盲抓是一种好的策略还是糟糕的行为? “抓一下”这个概念在跟新手玩家解释时很容易迷糊。它的本质其实就是选择性的盲注(一个人在发牌之前就投入底池的筹码)。 抓的数目是大盲注的两倍,算

特定翻牌圈的不同手牌怎么打 特定翻牌圈的不同手牌怎么打 现在我们就来假设一个特定翻牌圈,然后看看在持有10种不同手牌时,最佳的行动策略是什么。 情况是这样的:你正在玩$5/

低级别稳定盈利教程 低级别稳定盈利教程 玩德州扑克要实现稳定盈利,并不容易,所以我决定整理一份终极扑克小抄,献给大家。 下面这份指南针对的是,想从现在开始在最低级别

多桌锦标赛的泡沫期怎么打 你在多桌锦标赛还在继续前进,已经活过了前期阶段和大部分中间阶段。现在你距离钱圈已经很近了,拿到奖金的希望近在眼前。随着你一手手牌的接近,拿到

扑克中的数学 扑克中的数学 大部分扑克玩家都能学会数补牌,并且记住几个常见的概率,但是,大多数人在面对更复杂的扑克数学或无法在书上或网上查到的情况时,仍是一

清华美院雕塑系教授董书兵: 瓜州与“大地之子”-清华大学美术学院 董书兵清华大学美术学院雕塑系教授中国雕塑学会副秘书长、常务理事北京美术家协会雕塑艺术委员会副主任瓜州与“大地之子” 文/孙振华中国有个叫瓜州的

德州扑克基础知识:Donk Bet 德州扑克基础知识:Donk Bet Donk Bet简称Donk,可以定义为:作为翻牌前的跟注者进入翻牌圈以后,在没位置情况下采用向翻牌前的公开加注者反主动

职业牌手的翻前策略 职业牌手的翻前策略 如需系统地学习德州扑克翻前策略,请点击查看视频课程:https://www.moshike.com/a/4691.html

德州扑克咋唬 德州扑克咋唬 许多从未打过牌的人认为德州扑克玩的就是咋唬。他们对扑克的认识仅仅来自电视扑克秀,但那只是节目效果,德州扑克其实不是那样玩的。 但是

德州扑克之平衡论 德州扑克之平衡论《无限德州扑克应用指南》花了大量的时间讨论平衡,许多已经读过那本书的人无疑已经注意到我在之前的牌例中几乎不怎么担心平衡。 在那