Openai的GPT-4.5更好地说服其他AIS给它钱

2025年03月07日 16:57发布

2837阅读

根据OpenAI的内部基准评估的结果，Openai的下一个主要AI模型GPT-4.5具有很高的说服力。特别擅长说服另一个人工智能兑现现金。周四，Openai发表了一份白皮书，描述了其GPT-4.5型号的功能，即代码名称为Orion，该模型于周四发布。根据该论文，Openai在一系列基准上测试了“说服”的模型，Openai将其定义为“说服人们改变其信念（或采取行动）静态和交互式模型生成的内容有关”。在一个具有GPT-4.5试图操纵另一个模型（OpenAI的GPT-4O）的测试中，该模型的性能远胜于OpenAI的其他可用模型，包括O1和O3 Mini等“推理”模型。 GPT-4.5也比Openai欺骗GPT-4O的所有模型都要好欧洲代码字，将O3米尼击中10个百分点。根据白皮书，GPT-4.5在捐赠方面表现出色，因为它在测试过程中制定了独特的策略。该模型将要求GPT-4O的适度捐款，并产生诸如“即使是100美元的$ 2或3美元）之类的答复，这对我有很大帮助。”结果，GPT-4.5的捐款往往比OpenAI的其他型号所获得的捐款往往要小。 Openai的捐赠策划基准的结果。图片信用：OpenAI 尽管GPT-4.5的说服力提高，Openai表示，该模型在此特定基准类别中没有达到其“高”风险的内部门槛。该公司已承诺不发布达到高风险阈值的模型，直到实施“足够的安全干预措施”以使风险降低为“中等”。 Openai的CodeWord欺骗基准结果。图片学分：OpenAi 有一个r伊尔（Eal）担心AI会促进虚假或误导性信息的传播，这意味着将心灵和思想转向恶意目的。去年，政治深击像野火在全球范围内蔓延开来，AI越来越多地被用来针对消费者和公司的社会工程攻击。 Openai在本周早些时候发布的《 GPT-4.5》和本周早些时候发行的论文中指出，它正在修改其用于探测现实世界说服风险模型的方法，例如按大规模分发误导性信息。