颤抖吧人类!阿尔法狗之后又有了冷扑大师

移动开发 新闻
恐怕大家都是从阿尔法狗击败李世乭这条热文,才开始关注AI的吧,然而现在不光有了阿尔法狗,还出了一个冷扑大师,专攻德扑的一款AI机器人。

恐怕大家都是从阿尔法狗击败李世乭这条热文,才开始关注AI的吧,然而现在不光有了阿尔法狗,还出了一个冷扑大师,专攻德扑的一款AI机器人。

[[188363]]

首先先来了解下德州扑克与棋类的区别。围棋是一种“完美信息游戏”,场面上所有的情况都黑白分明地摆在棋面上,双方掌握对等的信息。然而,德扑中隐藏了很多信息,是一种“非完美信息游戏”。玩家不知道对手手中是什么牌,不知道五张公共牌会开出怎样的结果,也不知道对手猜测自己握有怎样的手牌。因此,虽然一盘德扑的决策点数量是10的160次方,要少于围棋,但光靠搜索是打不了德扑的。德扑由此跳出了在搜索量上的较量,对AI提出了另一个方向上的考验:应对隐藏的信息。

阿尔法狗的几个基本原理,分别为:走棋网络(Policy Network),给定当前局面,预测和采样下一步的走棋;快速走子(Fast rollout),在适当牺牲走棋质量的条件下提高速度;价值网络(Value Network),给定当前局面,估计双方胜率;蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上三个部分串联成一个完整的系统。

冷扑大师的算法则主要基于:纳什均衡、虚拟遗憾最小化算法(Counterfactual Regret Minimization,CFR)、残局解算器(end-game solver)和自我强化学习等模块。

然而对于用户来说,阿尔法狗和冷扑大师除了能让我们看看新闻以外,哪个又更有用呢?

在现实生活中,我们遇到的事情会更像玩德扑:商业谈判时对方未知的底牌、房屋拍卖时竞争对手难测的举动、股票交易中一些隐藏的内部消息。桑德霍姆认为,德扑AI打开了靠人工智能解决随机事件和隐藏信息的大门。这样的AI,才有望离开虚拟的棋牌世界,成为人类在现实生活中谈判、博弈和投资的好帮手。

 

责任编辑:陈琳 来源: 51cto
相关推荐

2016-12-29 13:34:04

阿尔法狗围棋计算机

2016-11-29 07:39:18

苹果iOS科技新闻早报

2019-07-23 09:12:08

2017-05-31 15:47:27

AI人工智能机器学习

2012-04-06 13:51:01

RIM黑莓

2020-09-27 14:28:21

AI 数据人工智能

2014-02-19 13:25:45

智能路由Wi-Fi

2016-03-11 11:36:40

服务器

2018-04-02 16:10:28

人工智能机器人情感智能

2017-04-12 12:50:31

人工智能谷歌AlphaGo

2017-09-27 13:41:32

量子微软程序猿

2020-12-17 17:20:17

AI人工智能工作岗位

2020-02-10 09:52:27

人工智能机器学习技术

2021-04-25 15:35:59

鸿蒙HarmonyOS应用

2016-04-08 15:13:29

人工智能阿里小Ai

2018-10-20 15:20:10

2023-04-27 10:27:57

ChatGPT机器狗

2018-08-30 08:47:43

人工智能深度学习计算机视觉

2010-02-23 13:48:59

2020-05-26 16:18:26

iPhone黑客漏洞
点赞
收藏

51CTO技术栈公众号