AI先驱者Scoop Turing授予强化学习工作奖

两位开拓性的计算机科学家因其在强化学习方面的工作而获得了2024年的图灵奖,该学科通过基于奖励的反复试验来学习,使他们可以在受约束或动态环境中适应。 马萨诸塞大学阿默斯特大学的名誉教授安德鲁·G·巴托(Andrew G. Barto);艾伯塔大学(University of Alberta)的教授理查德·S·萨顿(Richard S.这包括在一种称为时间差异学习的增强技术上的工作;两人后来出版了一本名为“强化学习:简介”的学术教科书。 受人尊敬的数学家艾伦·图灵(Alan Turing)(上图),其命名为Turing Award,还制作了1950年代的一篇论文,称为“计算机和智力”,质疑计算机是否可以思考并涉及有关从经验学习的类似概念ence。 近年来,在Google DeepMind使用该技术建立了击败世界上最好的Alphago球员的AI之后,强化学习受到了更多关注。在过去的几个月中,中国AI Upstart DeepSeek的R1推理模型成为头条新闻,该模型倾向于增强学习,以创建更具成本效益的基础模型。 Andrew G. Barto和Richard S. Suttonimage积分:ACM “诺贝尔计算奖” 由计算机协会(ACM)管理的图灵奖通常被称为“计算机奖”。但是,诺贝尔奖本身一直在侵犯计算领域,尤其是在AI附近。杰夫·辛顿(Geoff Hinton)和约翰·霍普菲尔德(John Hopfield)去年因在基础AI中的工作而获得了诺贝尔物理奖。紧随其后的是Deepmind的Demis Hassabis和John Jumper,他们因其在Alpha上的工作而获得诺贝尔化学奖。折叠。 ACM主席Yannis Ioannidis在新闻稿中说:“从认知科学和心理学到神经科学的研究领域启发了增强学习的发展,这为AI中一些最重要的进步奠定了基础,并使我们对大脑的运作方式有了更深入的了解。” “ Barto和Sutton的作品不是我们现在从中继续前进的垫脚石。强化学习继续增长,并为进一步的计算和许多其他学科提供了巨大的潜力。我们将在我们领域获得最负盛名的奖项是合适的。” 赢得图灵奖的其他著名AI先驱包括Meta的首席AI科学家Yann Lecun,他与Geoff Hinton和Geoff Hinton和Yoshua Bengio一起获得了该奖项,因为他们在深度神经网络上的工作。 Barto和Sutton将共享100万美元的现金奖励,并获得Google的支持。

AI先驱者Scoop Turing授予强化学习工作奖

avatar

知识小能手 管理员

发布了:11462篇内容
查阅文章

发布评论

验证码

QQ交谈

在线咨询:QQ交谈

工作时间:每天9:00 - 18:00
若无特殊,节假日休息

我的微信