德扑AI之父托马斯·桑德霍姆:扑克AI如何完虐人类,和AlphaGo大不同
作者:鸭脖娱乐 发布时间:2021-04-09 01:02
本文摘要:卡内基梅隆大学的计算机系教授,德捕AI的父亲托马斯·桑德霍姆按:11月6日,今天召开的京东霍姆JDD(京东金融世界数据探索者大会)大会上,卡内基梅隆大学的计算机系教授,德捕AI的父亲托马斯·桑德霍姆公开发表演说,描写了他们构筑的人工智能冻结大师Libratus背后的原理是什么应对这种非终极信息的游戏,AI也可以在经济生活中普遍应用。演说开始时,桑德霍姆透露,Libratus和名噪暂时的AlphaGoll有所不同,后者是基于终极信息的游戏,前者是终极信息的游戏。

鸭脖娱乐

卡内基梅隆大学的计算机系教授,德捕AI的父亲托马斯·桑德霍姆按:11月6日,今天召开的京东霍姆JDD(京东金融世界数据探索者大会)大会上,卡内基梅隆大学的计算机系教授,德捕AI的父亲托马斯·桑德霍姆公开发表演说,描写了他们构筑的人工智能冻结大师Libratus背后的原理是什么应对这种非终极信息的游戏,AI也可以在经济生活中普遍应用。演说开始时,桑德霍姆透露,Libratus和名噪暂时的AlphaGoll有所不同,后者是基于终极信息的游戏,前者是终极信息的游戏。在没有终极信息的游戏中,我们的挑战是不告诉掉和他的不道德,也不告诉他不道德的可能性。那么,他们过去做了什么呢?我也不说。

他说。之后,他解释了Libratus的基本原理,包括抽象、子游戏论解决问题器和自我提高模块三个部分,其中没有深入自学。

桑德霍姆指出,人工智能不仅仅是机器学习,机器学习是关于过去,我们从过去的数据中自学,预测未来,或者说将来需要做更多有益的东西,战略逻辑很多可能性无关,是关于未来发售的游戏。以下内容是根据桑德霍姆的演桑德霍姆的演说速记整理,有不改变本意的删除。今天,我们来谈谈超人类的AI如何进行战略分析和推理小说。

在这里用扑克做例子,今天我们说的是无限信息的游戏,也就是说输掉整体的状态不为机器人所知,这与对局没有太大的联系,但与谈判相似。非终极信息的游戏:扑克牌AI和AlphaGo有很大的不同,AlphaGo的技术可以用作所有终极信息的游戏,终极信息的游戏具有很好的性质,大游戏可以分解成小游戏,子游戏如何解决问题通过其他子游戏的结论来自学。例如,当我们看这个游戏时,我们不必在意其他游戏或其他象棋步骤的输掉。只要看看这个步骤是怎么做的,就有必要告诉我。

不是终极的信息是什么意思?一个信息是一个子游戏教的,不能用作另一个子游戏。没有终极信息的游戏比终极信息的游戏更无能为力。

这些是基于某个小领域的技术,不能转移到其他小领域。例如,扑克,我们的发明者的算法也需要在这信息的情况下也需要自学。

由于终极信息和终极信息的游戏本质不同,AlphaGo应用的技术不能应用于终极扑克游戏。因为两者的性质不同。在没有终极信息的游戏中,我们的挑战不告诉输掉和他的不道德,也不告诉他不道德的可能性。

那么,他们过去做了什么呢?我也不说。我和我的扑克输了,我不告诉他以前的行动,他也不告诉我以前的行动,在我们人类面临的情景中更好的是这样的,不告诉输了背后的意外。那么我们们想问的是,输掉的行动对我有什么样的救赎,我如何通过输掉的行动推断背后的动机,我的行动也泄露了我的意图输掉了?其中有趣的是,我们不必分析这些行动的信号。

这些信号让我们回顾一下这个纳什的方法。纳什只是对游戏的定义,他没有给我们结论。他用算法,根据更广泛的定义计算,寻求更好的算法。

那个扑克牌有很多数学原理,看纳什先生的博士论文,先把他的游戏论方程展示给我们,这是1993年,这里只有一个定义。那就像扑克的定义。

今后对扑克有更多的科学家和更多的定义。AI虐待人类的赌神也不会讨论。

如果有更好的战略和战略输给扑克牌的话,最近去年有数百人对这个扑克牌的研究。我说的太多了,我只说了一些重点研究。首先,2004、2005年的学生和我一起实现了关于提取的算法。

也就是说,你的金额被抛弃了,或者不告诉这个游戏的99%左右的信息,也可以告诉这个游戏的规则。那么,我们现在谈论的无限庄家德克萨斯扑克牌被压在最好的计算机界解决问题的基准上,包括10的161次的场面。

之前我刚说的无限庄家的卡牌游戏是被AI攻陷的,我们来看看这个单周无限庄家的突破,这是第二次决斗,因为之前有人机对付,当时的AI输给了人类选手,这次我们叫做再对付,再挑战。我们的AI系统是一个冻结大师的智能系统,它的输赢是四个非常优秀的扑克运动员,我们一共交往了12万次,在20天内,庄家的赌注多了20万美元,大家都有很强的动机输了。

2017年的这次,我们把这笔20万美元的奖金,不是每个人给20万美元,而是根据这4名选手的表现成正比分配,而且我们的试验设计非常激进,让人们设计整个游戏的模式,为什么这样做呢人类设计游戏整体的各种模式,最后要求谁输,人类事先设计的话,会有各种各样的争论和争论。那么,整个人在押注的时候,更好的时候人不会输。让我们看看游戏现场。丹尼尔是我的朋友,我的同事,他们分手的一对一单调。

冻捕AIVS中国龙的队伍说丹尼尔和AI决斗,AI决斗和上面的4名扑克大师在楼上决斗。例如杰森,他同时看着两张桌子,他可能在这两张桌子之间来回转换,在他左边的这个小画面上,他可以展开转换,最后的结果是我们的冻结师系统输了,而且赢了人。同样,我们用这个冻结大师对付中国的赌博神,中国的龙队,中国的六个赌博神,这是国际扑克大师的胜利者,这些都是顶尖的扑克手。

冻结大师还是输给了我们人类的赌注。冻结AI的秘密:有人回答不能深入自学。我们冻结师父的系统是什么原理?基本上我们使用的是正确的技术,其中没有深刻的自学。

因此,上面主要有三个自由选择,第一个自由选择有很多游戏规则的输入,更小的游戏抽象,最后有算法展开蓝图战略的继续执行。然后,在我们子游戏论的解决问题器中,实质上也是在游戏过程中展开问题的解决问题,有自我提高的模块,需要在晚上改版自己的AI舞台主机。关于软件的运营,我们匹兹堡的超级计算机中心的这台计算机积累了1200万小时的游戏时间。

所以说有很多输出信息,如果我们比较AlphaGo,AlphaGo就是人类的游戏历史,我们不能这样做,我们是白手起家的。我们向镜子展开摔跤,突然跳起来踢泰森的关系,我们也一样,我们在AlphaGo上展开了自我游戏。

抽象我们认为第一个分析是模块中用于新的抽象算法,取得了相对较小的规则,并且没有平衡简化的过程。然后新的回到我们的第一个游戏中展开我们所谓的蓝图策略。而且这里有两种抽象,一种是胜利抽象,是定期开展算法的计算。2016年实现过,现在我们只用抽象,展开平衡简化的算法,获得多种抽象,从第一个赌场到第二个赌场,可以在所有赌场中展开,第四个赌场中我们用于子游戏论的解决问题,这样我们就可以更好地阅读我们的客户。

第三个月的抽象是指我们的扑克赌场,这里除了人工智能外,还重新加入了大赌场和小赌场的概念,我们说有最初的初级算法,可以优化它,但是不能继续扩展,所以我们必须逐渐扩展第一个赌场。子游戏论解决问题器后来到子游戏论解决问题器,这里有五个新部分,第一部分很可能考虑到现在输掉的内容,第二部分属于一些战略,你的子游戏论,这种计算方式比这个蓝图战略差并且,如果说在现在的阶段犯了错误,我们可以重新考虑这种情况,同时考虑经常出现的错误,但是需要确保胜利,所以在和确实的人开始比赛的时候,经常出现这样的错误。

也就是说,子游戏论的解决问题。最初,解决问题的问题,开展游戏。

但是,我们必须在这里先解决问题。也就是说,整个局都要做新的事情,每次输掉回来,我都要重新计算剩下的部分。此外,它还可以计算当时庞加莱程序的实际步骤。这些都是在我们的抽象化中,而且可以早点启动。

以前是最后一个赌场,现在我们放在第三个赌场。如果这里没有子游戏论中的这张牌的抽象,我们以新的方式展开子游戏论的解决问题。自我提高模块的最后一个模块是自我提高模块,用几乎不同的方法展开自我提高。

此外,它我们以前所说的平衡战略。那么我一般是怎么做到的呢?也就是说,我们必须一起开发一系列的失败模块。我真的是有风险的方法。特别是对于一些顶级玩家来说,顶级玩家是属于世界这一领域的专家,他们是更容易找到漏洞的专家,所以在这个过程中,不会遇到困难,而且我们会告诉他自己战略中的漏洞在哪里。

这样,在这个超级计算机中,算法不会再添加到我们的不道德抽象画中,然后我们可以添加到我们的仓库中,我们可以在我们的主机中添加一些合理的内容。超人类AI如何进行战略分析和推理小说,在我们的实验室中研究的情况,以及如何解决问题的非原始信息的内容,这是我们实现的课题,所以在游戏中和我们之前说的话,没有不完整的信息,必须有抽象的搜索器。

然后,我们必须告诉那边的一个。游戏不是常见的问题路径。然后,我们有这个算法。那个可以计算一些概率。

如果你的模型离我们的差距这么近的话,那个模块就不会在比赛中展开,所以我们必须在比赛中进行。因此,在某种程度上的概念,如果我们的模块在现实中只有这样的我们就可以提高战略。然后让它更适合现实中的情况。第二,我们以前说过,事件中最差的可能是平衡战略,也是我们应该得到的最差的理论,从今年夏天开始,我们有更多的算法。

第三,我们双方经常出现大错误或许多错误时,能否解决问题。传统意义上,我们有可能简化计算错误,但现在计算机中的技术可以用更好的方法提高。

最后,在利用和研究开发之间的比较中,必须在游戏中找到对方的漏洞。然后开始过这种非游戏理论,我们开始考虑如何被对方使用。因此,当你开始使用游戏理论时,有些人说使用这种游戏理论或游戏理论是不安全的。

但现实中不一定如此,你可以在利用他人的同时,也可以保证自己不被利用,也可以保证自己的安全性。我以前提到的这些技术,在一定程度上被用于编程,这些在你有对话的过程中,不仅有一方,还有不原始的信息,对于新技术的能力,之所以这么鼓舞,是因为我们看到了这个战略机器中有很多类似科学知识的复印件。我指出了这个战略价格,或者说战略产品的人们,也可以利用它进行优化。

AI也可以应用于现实世界的游戏,在AI中,我们不仅可以节约更好的人力,还可以比最差的人强,有更多的理由利用现实。有些人可能实际上在很多现实中应用,但没有终极的信息。

即使不看游戏,也要想象在价格中的利用。如果对方的竞争对手的价格已经相同的话,突然对方改变这个价格的话,必须构筑自己的价值优化,必须反应。这里有体现的模块。

鸭脖娱乐app官网

战略定价在推动市场发展的同时,还可以事先开展价格思考,在一定程度上优化战略产品和人群,在金融中使用更多,如战略结构或战略贸易继续实施等,以及自动溢价。我们用于眼镜来提高我们的视力,为什么不能用AI来提高自己的战略逻辑呢?像拍卖一样,如果有投机的话。式拍卖,没有人告诉底价,能否使用合理的有奖。像电影版权一样,有不同的流媒体公司。

他们有可能出售不同的视频流程。如何构建更好的视频流程组,如何开展更好的谈判。

大部分应用于不考虑网络安全问题、防水脆弱性和操作系统问题的方法以及政治运动中我花了多少钱,根据竞争对手的支出来计算。另外,在自动驾驶车辆中,或者半自动驾驶员的车队在各公司开展运输维护时,如何获得更好的道路规则。许多军队在实体安全性方面的应用、生物适应环境、医药决定中,我们已经有很多计划。例如,为了防止疫苗的静脉注射和癌症防水,必须对患者进行更好的计划。

当然,我们有娱乐式、训练式的应用于技术,在很多新游戏中,也没有社交游戏。人工智能不仅是深度自学的最后幻灯片,人工智能不仅是深度自学,还有最重要的部分和领域,现在有新的技术和领域,我们被称为战略逻辑,它是我们战略游戏论的一部分,同时我们输了建模等,这些也是很多模型机器学习是关于过去,我们需要从过去的数据中自学,预测未来,或者说未来需要做更多有益的事情,战略逻辑与很多可能性无关,是关于未来发售的游戏。

我们已经实施了一些测试,希望得到更多的结果。谢谢你。文章:时隔AlphaGo再次突破:人工智能Libratus战胜德克萨斯扑克顶尖选手Facebook田渊栋:德克萨斯扑克战胜人类的AI到底用了什么算法?|解析洞见|即使输给AI,也不能说人类破坏了德克萨斯扑克阵地的版权文章,允许禁止登载。

下一篇文章发表了注意事项。


本文关键词:德扑,之父,托马斯,桑德,霍姆,鸭脖娱乐,扑克,如何,完虐

本文来源:鸭脖娱乐-www.daan29.com

电话
0249-74545752