AI先驱者Scoop Turing授予强化学习工作奖

2025年03月07日 16:46发布

1057阅读

两位开拓性的计算机科学家因其在强化学习方面的工作而获得了2024年的图灵奖，该学科通过基于奖励的反复试验来学习，使他们可以在受约束或动态环境中适应。马萨诸塞大学阿默斯特大学的名誉教授安德鲁·G·巴托（Andrew G. Barto）；艾伯塔大学（University of Alberta）的教授理查德·S·萨顿（Richard S.这包括在一种称为时间差异学习的增强技术上的工作；两人后来出版了一本名为“强化学习：简介”的学术教科书。受人尊敬的数学家艾伦·图灵（Alan Turing）（上图），其命名为Turing Award，还制作了1950年代的一篇论文，称为“计算机和智力”，质疑计算机是否可以思考并涉及有关从经验学习的类似概念ence。近年来，在Google DeepMind使用该技术建立了击败世界上最好的Alphago球员的AI之后，强化学习受到了更多关注。在过去的几个月中，中国AI Upstart DeepSeek的R1推理模型成为头条新闻，该模型倾向于增强学习，以创建更具成本效益的基础模型。 Andrew G. Barto和Richard S. Suttonimage积分：ACM “诺贝尔计算奖” 由计算机协会（ACM）管理的图灵奖通常被称为“计算机奖”。但是，诺贝尔奖本身一直在侵犯计算领域，尤其是在AI附近。杰夫·辛顿（Geoff Hinton）和约翰·霍普菲尔德（John Hopfield）去年因在基础AI中的工作而获得了诺贝尔物理奖。紧随其后的是Deepmind的Demis Hassabis和John Jumper，他们因其在Alpha上的工作而获得诺贝尔化学奖。折叠。 ACM主席Yannis Ioannidis在新闻稿中说：“从认知科学和心理学到神经科学的研究领域启发了增强学习的发展，这为AI中一些最重要的进步奠定了基础，并使我们对大脑的运作方式有了更深入的了解。” “ Barto和Sutton的作品不是我们现在从中继续前进的垫脚石。强化学习继续增长，并为进一步的计算和许多其他学科提供了巨大的潜力。我们将在我们领域获得最负盛名的奖项是合适的。” 赢得图灵奖的其他著名AI先驱包括Meta的首席AI科学家Yann Lecun，他与Geoff Hinton和Geoff Hinton和Yoshua Bengio一起获得了该奖项，因为他们在深度神经网络上的工作。 Barto和Sutton将共享100万美元的现金奖励，并获得Google的支持。