เงินรางวัลประจำวันรับประกัน 10,000 ดอลลาร์สหรัฐ

รับโบนัสคืนเงิน 100% เมื่อฝากเงินครั้งแรก

打了一辈子德州,居然输给了新手AI!(中篇) 打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html 完美信息博弈类游戏 对于围棋

打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html

完美信息博弈类游戏

对于围棋游戏来说,是一场零和完美信息博弈,这是指在任何时刻,双方玩家都知道前面游戏的全部状态(完美信息),并且在有限步数之后游戏的结果非胜即负(零和)。

知道了游戏的有限状态,计算机就可以通过暴力枚举的方法来计算后面所有可能的下法,形成一颗巨大的搜索树,这颗搜索树可以列举出在当前状态下所有可能的下法,每个子搜索树都能独立求解,计算机就可以根据计算的结果安排对应的策略,从而达到最终的胜利。

举个栗子,比如,小明是一个普通中国家庭长大的小孩,在他的一生中,面临着很多个选择,如何才能在未来走向人生巅峰呢?如果可以列举出他未来所有的可能性,把每一步的选择拆解成“子未来”,那么就可以计算出成功胜算最大的选择了。(例子可能不够恰当,理解意思就好,嘻嘻)

小明同学的人生探险

所以,假设我们有无限大的计算资源,就可以将一局游戏的博弈拆解成一个一个的子博弈(列举出所有的可能性),从而计算出胜算最大的打法,就可以打赢比赛了。但是,以棋类游戏中比较简单的西洋棋来说,它的分支因子大概是40左右,这表示预测之后20步的动作需要计算40的20次方(这是多大,就算是1GHz的处理器,也要计算3486528500050735年),请注意,这还是比较简单的西洋棋。

所以,科学家们利用一些剪枝、搜索等算法以缩减计算范围,从而在有限的游戏时间内找出最佳策略。

不完美信息博弈类游戏

终于讲到了今天的主角,口袋德州。口袋德州(德州扑克)就是很典型的不完美信息博弈类游戏,它的策略设置中存在隐藏的信息。这类模型也有大量的应用场景,比如谈判、拍卖等等。不完美信息博弈不能如完美信息博弈那样通过分解而进行求解,因为一个子博弈的最佳策略可能依赖于其它尚未得到的子博弈的策略和输出。换句话说,我们无法通过预测到对方下注的多少从而猜测到对方手里的牌是什么,因为也许对方的牌并不好,但他通过下注欺骗你,让你选择弃牌。

所以,这件事对于没心机的计算机是相当困难的,对手第一手就all in了,但是他的牌到底好不好呢?

因此,当我看到AI在德州上也打败了人类,还些许有些小激动,maybe未来,机器人也可以具有女人的第六感了。那AI到底是如何打败人类的呢?论文中提及和很多很难理解(其实自己也看不太懂,逃)的算法,为了方便理解德州怎么玩,我们以一个简单的博弈模型来举例,试图理解聪明的AI。

我们来设计一个简单的游戏。

游戏玩家有A和B两人。A可以抛一次硬币,正反面都只有自己才可以看到,抛完后他有两个选择:①sell,卖掉硬币;②play,和B玩游戏。

if : A选择了sell:

if : 硬币落在正面,A卖掉后得到五毛钱;

else:硬币落在反面,A卖掉后输掉五毛钱。

if : A选择了play:

游戏继续,接下来由B来猜硬币是落在正面还是反面:

if : B猜对了,A赔一元,B赚一元;

else:B猜错了,A赚一元,B赔一元。

打了一辈子,居然输给了新手AI!(下篇):https://www.moshike.com/a/354.html

FAQ

吃瓜的瓜是什么瓜?

追本溯源,「吃瓜」中的瓜,指的其實是「西瓜」。Nov 11, 2023

大衡村大瓜の読み方は?

〒981-3601 みやぎけんくろかわぐんおおひらむらおおうり 宮城県黒川郡大衡村大瓜

三黑料是什么意思?

料:主要指银行卡账号、密码,持卡人身份证号及绑定手机号四大类信息(又称CVV四大件)。 内料:指境内卡的四大件。 外料:指境外卡的四大件。 轨道料:指通过改装POS机得到的银行卡信息,这种信息一般非常精准。

微短剧是什么?

尽管叫法不同,本文探讨的短剧,更多是当下颇为流行的微短剧。 根据国家广电总局的定义,微短剧,全称为网络微短剧,是指“单集时长从几十秒到15分钟左右、有着相对明确的主题和主线、较为连续和完整的故事情节”的剧集。 这类形式此前更常见于长视频平台,如此前爆火的《招惹》《授她以柄》。Mar 15, 2024

大衡村大瓜の読み方は?

〒981-3601 みやぎけんくろかわぐんおおひらむらおおうり 宮城県黒川郡大衡村大瓜

🥳 最新文章 🎁 🎥 熱門文章 🎺
🎡 推薦文章 🎺

翻牌前庄家位的加注 翻牌前庄家位的加注 你翻牌前什么样的打法直接决定这手牌的导向,包括翻牌后底池的大小等等,让我们来看看一些导向。 庄家位的加注一般来说都没什么错误

即使拿到了“好牌”,也不要停止分析局面 即使拿到了“好牌”,也不要停止分析局面 有时一个牌手会击中一张或几张看似非常完美的公共牌。“哈,那恰好是我期待的翻牌!” 这个牌手心里想。 这种“

《三國志侵略版》6/14~6/22 独家限时返利登场! 亲爱的玩家您好: 独家限时回馈上线!感谢你的守护与陪伴! 在此大放送回馈!祝福您佳节快乐,万事如意! 活动期间内,于游戏内运用所有金流「直购宝物」

《腥城》4/1(二)更新LGR英雄-【莎莉】 亲爱的玩家您好: 为了让大家在游戏中也能感受到节日的欢乐气氛, 我们特别准备了一系列趣味活动和惊喜奖励, 让你在游戏中尽情享受整蛊与被整蛊的乐趣!

《艦B娘》4/10(四)维护公告 亲爱的领航员会社社长: 为了带给大家更优质的游戏体验, 伺服器将于 2025/4/10(四)14:00-17:00 进行停服维护, 还请各位玩家做好维

在牌桌上使用贝叶斯理论 在牌桌上使用贝叶斯理论 当你在牌桌上玩的时候,你不可能在脑子里有每个玩家的做出各种动作的可能性列表。具体的数字不重要。重要的是思考的过程。我将

学会这七招,保证能把德州牌桌上的菜鸟虐成渣下篇 学会这七招,保证能把德州牌桌上的菜鸟虐成渣下篇 学会这七招,保证能把德州牌桌上的菜鸟虐成渣上篇:https://www.moshike.com

德州扑克连续下注的技巧 德州扑克连续下注的技巧 学会连续下注(barreling)和高效诈唬,对于现场无限德州扑克的成功至关重要。一旦你超越了最低级别的轻松局,对手所

热榜事件终于结束了沃特碧们的ColgDNF地下城与勇士 - COLG玩家社区 为你介绍DNF:一开始我并没看到做表格那位的帖子,是先看到的K字开头那位的,跟踪过去看了一会,当事人团体阴阳怪气舌战群雄之余还不忘互相打趣,

同花听牌适合什么时候诈唬 同花听牌适合什么时候诈唬 拿着听牌打到河牌却没中,这时候是该继续诈唬,还是选择放弃? 不懂不处理? 没事,这就是今天要讨论的内容,我打算在这篇文章

德州咋呼:半诈唬的重要性牌局分析(下篇) 德州咋呼:半诈唬的重要性牌局分析(上篇):https://www.moshike.com/a/390.html 2 翻牌圈加注是值得的吗?我们可

带一对的听牌怎么玩? 带一对的听牌怎么玩? 带一对的听牌是德州扑克中最容易打错的一种牌。初学者很容易对一手具有多种潜力的牌感到兴奋,但让我们仔细拆解这类牌,学会如何

你有这几个德州扑克坏习惯吗? 你有这几个德州扑克坏习惯吗?所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。

所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。 下面