Spielen Sie Online-Poker und Gewinnen Sie Echtes Geld.

WPT Global

打了一辈子德州,居然输给了新手AI!(中篇) 打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html 完美信息博弈类游戏 对于围棋

打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html

完美信息博弈类游戏

对于围棋游戏来说,是一场零和完美信息博弈,这是指在任何时刻,双方玩家都知道前面游戏的全部状态(完美信息),并且在有限步数之后游戏的结果非胜即负(零和)。

知道了游戏的有限状态,计算机就可以通过暴力枚举的方法来计算后面所有可能的下法,形成一颗巨大的搜索树,这颗搜索树可以列举出在当前状态下所有可能的下法,每个子搜索树都能独立求解,计算机就可以根据计算的结果安排对应的策略,从而达到最终的胜利。

举个栗子,比如,小明是一个普通中国家庭长大的小孩,在他的一生中,面临着很多个选择,如何才能在未来走向人生巅峰呢?如果可以列举出他未来所有的可能性,把每一步的选择拆解成“子未来”,那么就可以计算出成功胜算最大的选择了。(例子可能不够恰当,理解意思就好,嘻嘻)

小明同学的人生探险

所以,假设我们有无限大的计算资源,就可以将一局游戏的博弈拆解成一个一个的子博弈(列举出所有的可能性),从而计算出胜算最大的打法,就可以打赢比赛了。但是,以棋类游戏中比较简单的西洋棋来说,它的分支因子大概是40左右,这表示预测之后20步的动作需要计算40的20次方(这是多大,就算是1GHz的处理器,也要计算3486528500050735年),请注意,这还是比较简单的西洋棋。

所以,科学家们利用一些剪枝、搜索等算法以缩减计算范围,从而在有限的游戏时间内找出最佳策略。

不完美信息博弈类游戏

终于讲到了今天的主角,口袋德州。口袋德州(德州扑克)就是很典型的不完美信息博弈类游戏,它的策略设置中存在隐藏的信息。这类模型也有大量的应用场景,比如谈判、拍卖等等。不完美信息博弈不能如完美信息博弈那样通过分解而进行求解,因为一个子博弈的最佳策略可能依赖于其它尚未得到的子博弈的策略和输出。换句话说,我们无法通过预测到对方下注的多少从而猜测到对方手里的牌是什么,因为也许对方的牌并不好,但他通过下注欺骗你,让你选择弃牌。

所以,这件事对于没心机的计算机是相当困难的,对手第一手就all in了,但是他的牌到底好不好呢?

因此,当我看到AI在德州上也打败了人类,还些许有些小激动,maybe未来,机器人也可以具有女人的第六感了。那AI到底是如何打败人类的呢?论文中提及和很多很难理解(其实自己也看不太懂,逃)的算法,为了方便理解德州怎么玩,我们以一个简单的博弈模型来举例,试图理解聪明的AI。

我们来设计一个简单的游戏。

游戏玩家有A和B两人。A可以抛一次硬币,正反面都只有自己才可以看到,抛完后他有两个选择:①sell,卖掉硬币;②play,和B玩游戏。

if : A选择了sell:

if : 硬币落在正面,A卖掉后得到五毛钱;

else:硬币落在反面,A卖掉后输掉五毛钱。

if : A选择了play:

游戏继续,接下来由B来猜硬币是落在正面还是反面:

if : B猜对了,A赔一元,B赚一元;

else:B猜错了,A赚一元,B赔一元。

打了一辈子,居然输给了新手AI!(下篇):https://www.moshike.com/a/354.html

FAQ

吃瓜的瓜是什么瓜?

追本溯源,「吃瓜」中的瓜,指的其實是「西瓜」。Nov 11, 2023

吃瓜是什么梗?

“吃瓜群众”是一个网络用语,指在网络论坛中,人们发帖讨论问题,后面排队跟帖,不着边际地闲扯的人,因为他们的常用语就是“前排出售瓜子”“前排吃瓜子”。 2016年,有人将“不发言只围观”的普通网民称为“吃瓜群众”,用来表示一种不关己事、不发表意见仅围观的状态。

吃瓜是怎么来的?

该词源于2016年网络热词“不明真相的吃瓜群众”(或简写为“吃瓜群众”),更早则来自百度贴吧中“前排出售瓜子”、“吃瓜子看戏”等用语,而“不明真相”是网民用来反讽中国官方话语中常见的“少数别有用心”、“不明真相的群众”等固定短语。

千瓜数据是什么?

千瓜数据是小红书营销数据分析平台,后台覆盖了全量的小红书平台达人、品牌、笔记、直播等数据。 目前,千瓜数据手机App已正式上线,方便达人及品牌实时掌握小红书平台的数据动态。 千瓜数据提供了最直观的各类榜单,位于首页功能位置,分为达人、笔记、品牌几个模块呈现数据,有效及时了解到榜单数据情况。22 Tem 2021

三黑料是哪三黑?

洗钱三黑料是指用于洗钱的三种黑色资金来源,包括毒品交易、诈骗和贪污。 在洗钱过程中,犯罪分子通常会通过这些不法手段获取的资金,通过各种手段将其转移或掩盖其真实来源,使其看起来合法化。

🎤 最新文章 🎬 🎊 熱門文章 😏
🎀 推薦文章 🎥

《朕的江山美人》6/16(一)合服维护 亲爱的君主: 为了提升游戏的互动性与玩家体验,我们决定进行伺服器合并, 让大家有更多机会与其他伺服器的玩家互动,促进更多的游戏讨论和社群交流。 我

德州扑克中在翻牌圈评估位置的价值 德州扑克中在翻牌圈评估位置的价值 尽管位置在翻牌圈的价值无法量化,但在某些公共牌结构中,处在有利位置是极其宝贵的,而在其他公共牌结构中,位置并

德州扑克满圆桌和短桌的玩法策略 德州扑克满圆桌和短桌的玩法策略 许多低额注玩家从满员桌而不是6人桌起步进行游戏。这背后有许多心理原因–满员桌允许一种更加保守,更加

拿着10的踢脚抓诈唬,居然还让他成功了 这是一个名垂牌史的真人德扑经典牌局,距今有20多年的历史。较量双方是Mansour Matloubi 和Stu Ungar。 Mansour Matloubi(上图左)是WSO

《龍女郎》9/3(三)淫畜無害的【莎菲灵】 各位玩家, 我们将于2025年9月3日(三) 10:00 GMT+8 进行维护更新, 预计于14:00 GMT+8完成维护过程,请耐心等候。 期间玩家将无法登入及进行游戏

德州扑克牌面预测 德州扑克牌面预测 德州扑克是需要根据当时情况尽量做最好决策的游戏。一旦我们判断我们是为了做价值下注还是诈唬,我们需要在真正行动再做进一步考虑。

拿到小同花连张,怎么打最合适? 拿到小同花连张,怎么打最合适? 大多数牌手都知道,大的底池往往都是同花、顺子和暗三条赢来的。这是因为,为了做成同花、顺子和暗三条,你必须有一手

微扑克外挂 微扑克外挂 首先申明一下,本站卖的微扑克外挂是真实有效的(但不支持苹果手机,支持安卓和win系统电脑),具体详情请查看:https://www

如何用暗三条对抗同花听牌 如何用暗三条对抗同花听牌 你拿着8♥ 8♣,翻牌是T♦ A♦ 8♠。你是在单挑,而且肯定对手拿着两张方块。务必确定下列情况: 知道对手完成听牌的概率(

弃牌赢率是什么意思?弃牌赢率有什么用? 在德州扑克中你可以用两种方式获胜。一种是在摊牌时拿着最好的牌,另一种是迫使对手弃牌。后者引出了弃牌赢率(fold equity)这个关键概念。

多桌锦标赛打法之进入钱圈后的策略 今天的策略文章,我们依旧为各位带来德扑多桌锦标赛的10条小贴士。之前这个系列内容已经进入了锦标赛钱圈,而泡沫已经爆裂,但还未进入决赛桌的阶段

加注或平跟入池? 加注或平跟入池? 假设你在一个充满松弱玩家的低额现金局里,你处在CO,前位有人开池后,3人平跟,你看了下手牌,是AJs,你要怎么行动? 我知道,

你有这几个德州扑克坏习惯吗? 你有这几个德州扑克坏习惯吗?所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。

所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。 下面