Google运输双子双子座模型的速度比其AI安全报告快
在Google被Openai的Chatgpt释放了两年以上,该公司已经大大提高了步伐。
3月下旬,Google启动了AI推理模型Gemini 2.5 Pro,该模型带领该行业以测量编码和数学功能的几个基准测试。该发射是在科技巨头首次亮相另一个模型Gemini 2.0 Flash之后的三个月。
。Google双子座的总监兼产品负责人Tulsee Doshi在一次采访中告诉TechCrunch,该公司模型推出的越来越多是一致努力与快速发展的AI行业保持一致的一部分。
“我们仍在努力弄清楚这些模型的正确方法是什么 - 获得反馈的正确方法,” Doshi说。
但是,升级的释放时间框架似乎是有代价的。 Google尚未发布安全其最新型号的报告,包括Gemini 2.5 Pro和Gemini 2.0 Flash,引起了公司对速度优先级优先于透明度的担忧。
今天,对于Frontier AI实验室(包括OpenAI,Anthropic和Meta)来说,这是相当标准的,以报告安全测试,绩效评估和用例,每当他们启动新型号时。这些报告有时被称为“系统卡”或“模型卡”,是几年前行业和学术界的研究人员提出的。 Google实际上是2019年研究论文中最早建议模型卡的人之一,称它们为“用于机器学习中负责任,透明和负责任的实践的方法。”
Doshi告诉TechCrunch,该公司尚未发布Gemini 2.5 Pro的型号,因为它认为该模型是“实验性”发行版。这些实验版本的目的是以有限的方式放出AI模型,获取反馈和Itera她说,在制作发布之前,该模型上的模型。
Doshi表示,Google打算发布Gemini 2.5 Pro的模型卡,当时该模型通常可用,并补充说,该公司已经进行了安全测试和对抗性红色团队。
在后续消息中,Google发言人告诉TechCrunch,安全仍然是该公司的“重中之重”,并计划围绕其AI模型发布更多文档,包括Gemini 2.0 Flash,前进。 Gemini 2.0 Flash(通常可用)也缺少模型卡。 Google发行的最后一张模型卡是Gemini 1.5 Pro,该Pro于一年多以前出现。
系统卡和型号卡提供了有用的信息,有时甚至是不总是广泛宣传其AI的信息。例如,为其O1推理模型发布的系统卡OpenAI表明,该公司的模型具有“计划”反对人类并秘密追求自己的目标。
总的来说,AI社区将这些报告视为支持独立研究和安全评估的善意努力,但近年来,这些报告却更加重要。正如《变形金刚》先前指出的那样,谷歌在2023年告诉美国政府,它将发布所有“重要”的安全报告,公共AI模型在“范围内”发布。该公司对其他政府做出了类似的承诺,承诺“提供公共透明度”。
美国在联邦和州一级已经进行了监管工作,以为AI模型开发人员创建安全报告标准。但是,他们的收养和成功率有限。最著名的尝试之一是否决的加州法案SB 1047,技术行业强烈反对。议员们还提出了可以授权的立法美国AI安全研究所,美国AI标准设定机构,以制定模型发行指南。但是,安全研究所现在正面临特朗普政府的可能削减。
从所有外观上看,Google都落后于其一些关于模型测试报告的承诺,而同时运输型号的速度比以往任何时候都更快。许多专家认为,这是一个不好的先例 - 特别是当这些模型变得越来越强大和精致时。
发布评论