Google运输双子双子座模型的速度比其AI安全报告快

知识菜鸟

2025年04月04日 18:03发布

4536阅读

在Google被Openai的Chatgpt释放了两年以上，该公司已经大大提高了步伐。

3月下旬，Google启动了AI推理模型Gemini 2.5 Pro，该模型带领该行业以测量编码和数学功能的几个基准测试。该发射是在科技巨头首次亮相另一个模型Gemini 2.0 Flash之后的三个月。

。

Google双子座的总监兼产品负责人Tulsee Doshi在一次采访中告诉TechCrunch，该公司模型推出的越来越多是一致努力与快速发展的AI行业保持一致的一部分。

“我们仍在努力弄清楚这些模型的正确方法是什么 - 获得反馈的正确方法，” Doshi说。

但是，升级的释放时间框架似乎是有代价的。 Google尚未发布安全其最新型号的报告，包括Gemini 2.5 Pro和Gemini 2.0 Flash，引起了公司对速度优先级优先于透明度的担忧。

今天，对于Frontier AI实验室（包括OpenAI，Anthropic和Meta）来说，这是相当标准的，以报告安全测试，绩效评估和用例，每当他们启动新型号时。这些报告有时被称为“系统卡”或“模型卡”，是几年前行业和学术界的研究人员提出的。 Google实际上是2019年研究论文中最早建议模型卡的人之一，称它们为“用于机器学习中负责任，透明和负责任的实践的方法。”

Doshi告诉TechCrunch，该公司尚未发布Gemini 2.5 Pro的型号，因为它认为该模型是“实验性”发行版。这些实验版本的目的是以有限的方式放出AI模型，获取反馈和Itera她说，在制作发布之前，该模型上的模型。

Doshi表示，

Google打算发布Gemini 2.5 Pro的模型卡，当时该模型通常可用，并补充说，该公司已经进行了安全测试和对抗性红色团队。

在后续消息中，Google发言人告诉TechCrunch，安全仍然是该公司的“重中之重”，并计划围绕其AI模型发布更多文档，包括Gemini 2.0 Flash，前进。 Gemini 2.0 Flash（通常可用）也缺少模型卡。 Google发行的最后一张模型卡是Gemini 1.5 Pro，该Pro于一年多以前出现。

系统卡和型号卡提供了有用的信息，有时甚至是不总是广泛宣传其AI的信息。例如，为其O1推理模型发布的系统卡OpenAI表明，该公司的模型具有“计划”反对人类并秘密追求自己的目标。

总的来说，AI社区将这些报告视为支持独立研究和安全评估的善意努力，但近年来，这些报告却更加重要。正如《变形金刚》先前指出的那样，谷歌在2023年告诉美国政府，它将发布所有“重要”的安全报告，公共AI模型在“范围内”发布。该公司对其他政府做出了类似的承诺，承诺“提供公共透明度”。

美国在联邦和州一级已经进行了监管工作，以为AI模型开发人员创建安全报告标准。但是，他们的收养和成功率有限。最著名的尝试之一是否决的加州法案SB 1047，技术行业强烈反对。议员们还提出了可以授权的立法美国AI安全研究所，美国AI标准设定机构，以制定模型发行指南。但是，安全研究所现在正面临特朗普政府的可能削减。

从所有外观上看，Google都落后于其一些关于模型测试报告的承诺，而同时运输型号的速度比以往任何时候都更快。许多专家认为，这是一个不好的先例 - 特别是当这些模型变得越来越强大和精致时。