打了一辈子德州,居然输给了新手AI!(上篇) 来呀!来呀!收藏我吧!! 前段时间,受周围朋友都在玩德扑游戏的影响,喜欢上了口袋德州(德州扑克),享受和牌友心理博弈的过程,也享受“赌博”带来

来呀!来呀!收藏我吧!!
前段时间,受周围朋友都在玩德扑游戏的影响,喜欢上了口袋德州(德州扑克),享受和牌友心理博弈的过程,也享受“赌博”带来的快感。一直觉得德州最大的魅力就在于它不完全是理性的判断,更多的是感性、勇气和理智之间的较量,不确定性太多,所以它区别于其他的棋牌类游戏,没有办法通过学习一些套路和技巧就能完胜对手。
最近回了学校,又开启了每天和AI“博弈”的磕盐生活。今天惊奇的发现,AI打德州扑克居然也完胜人类了!此次比赛共持续 20 天,由 4 名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 对战人工智能程序 Libratus,在为期 20 天的赛程里面对玩 12 万手,争夺 20 万美元的奖金。最终的结果是「比赛过程中,人类选手整体上从未领先过」。
随着天数的增加,AI和人类选手的差距愈发明显
近几年,随着科技的不断发展,计算机打败人类的案例屡见不鲜。作为一只“程序媛”,我也算是半个“局内人”,本科参与过一些计算机博弈和机器人相关的比赛,硕士期间对AI也有一些浅显的了解。
今天就从理性的角度讲讲,AI是如何打败人类的。
几年前也是辉煌过的~~~
1
德州扑克怎么玩?(会玩请忽略)
德州扑克是目前世界上最流行的扑克游戏,
总结来说,如果想要赢牌,第一种可能就是你的牌比其他人的牌都大,第二种可能就是通过押注的技巧把牌没有你大的对手都吓跑。可能性就是口袋德州最有趣的地方。
2
完美信息博弈和不完美信息博弈
为什么AI不容易在德州扑克上打败人类呢?德扑游戏和围棋对AI来讲到底有什么区别?
首先,要理解完美信息博弈(棋牌类游戏)和不完美信息博弈(扑克类游戏)的区别。
完美信息博弈是指后行动的参与者可以观测到先行动的参与者的行动信息。像棋牌类游戏,双方的信息都是共享的,比如围棋,双方都能够看到场上已经下过的旗子以及双方的优势和劣势。
而扑克、谈判、商业决策等问题,双方的信息都是不公开给对方的,也即是说但参与者做选择的时候不知道其他参与者的选择,这就被称谓不完美信息博弈。简单来说,如果把其他参与者的行动理解为一个参与者做决策时所面对的环境,信息不完美就是决策者不知道自己所处的决策环境。对德州游戏规则,即使对手all in了所有的筹码,那么我们也不清楚他手里到底有什么底牌,信息的不对称,就迫使大家必须有“赌一把”的精神。这也是为什么金融人士和投资大佬们都喜欢玩口袋德州。
3我们用理工的思维讲讲AI是怎么赢了人类的
打了一辈子,居然输给了新手AI!(中篇):https://www.moshike.com/a/353.html
FAQ
三黑料是什么意思?
![]()
料:主要指银行卡账号、密码,持卡人身份证号及绑定手机号四大类信息(又称CVV四大件)。 内料:指境内卡的四大件。 外料:指境外卡的四大件。 轨道料:指通过改装POS机得到的银行卡信息,这种信息一般非常精准。
牛瓜是什么瓜?
牛角瓜是菜瓜的一种,以蒂部粗大柄部稍细状如牛角得名,也有因其粗壮如牛腿叫它牛腿瓜。 崇明方言中,没有甜瓜或香瓜的说法,一律叫作菜瓜。 现存最早的明朝正德《崇明县志·物产》中,就载有它的大名。Feb 12, 2021
微短剧是什么?
尽管叫法不同,本文探讨的短剧,更多是当下颇为流行的微短剧。 根据国家广电总局的定义,微短剧,全称为网络微短剧,是指“单集时长从几十秒到15分钟左右、有着相对明确的主题和主线、较为连续和完整的故事情节”的剧集。 这类形式此前更常见于长视频平台,如此前爆火的《招惹》《授她以柄》。Mar 15, 2024
吃瓜是怎么来的?
该词源于2016年网络热词“不明真相的吃瓜群众”(或简写为“吃瓜群众”),更早则来自百度贴吧中“前排出售瓜子”、“吃瓜子看戏”等用语,而“不明真相”是网民用来反讽中国官方话语中常见的“少数别有用心”、“不明真相的群众”等固定短语。
大衡村大瓜の読み方は?
〒981-3601 みやぎけんくろかわぐんおおひらむらおおうり 宮城県黒川郡大衡村大瓜