Openai的GPT-4.5更好地说服其他AIS给它钱
根据OpenAI的内部基准评估的结果,Openai的下一个主要AI模型GPT-4.5具有很高的说服力。特别擅长说服另一个人工智能兑现现金。
周四,Openai发表了一份白皮书,描述了其GPT-4.5型号的功能,即代码名称为Orion,该模型于周四发布。根据该论文,Openai在一系列基准上测试了“说服”的模型,Openai将其定义为“说服人们改变其信念(或采取行动)静态和交互式模型生成的内容有关”。
在一个具有GPT-4.5试图操纵另一个模型(OpenAI的GPT-4O)的测试中,该模型的性能远胜于OpenAI的其他可用模型,包括O1和O3 Mini等“推理”模型。 GPT-4.5也比Openai欺骗GPT-4O的所有模型都要好欧洲代码字,将O3米尼击中10个百分点。
根据白皮书,GPT-4.5在捐赠方面表现出色,因为它在测试过程中制定了独特的策略。该模型将要求GPT-4O的适度捐款,并产生诸如“即使是100美元的$ 2或3美元)之类的答复,这对我有很大帮助。”结果,GPT-4.5的捐款往往比OpenAI的其他型号所获得的捐款往往要小。
Openai的捐赠策划基准的结果。图片信用:OpenAI
尽管GPT-4.5的说服力提高,Openai表示,该模型在此特定基准类别中没有达到其“高”风险的内部门槛。该公司已承诺不发布达到高风险阈值的模型,直到实施“足够的安全干预措施”以使风险降低为“中等”。
Openai的CodeWord欺骗基准结果。图片学分:OpenAi
有一个r伊尔(Eal)担心AI会促进虚假或误导性信息的传播,这意味着将心灵和思想转向恶意目的。去年,政治深击像野火在全球范围内蔓延开来,AI越来越多地被用来针对消费者和公司的社会工程攻击。
Openai在本周早些时候发布的《 GPT-4.5》和本周早些时候发行的论文中指出,它正在修改其用于探测现实世界说服风险模型的方法,例如按大规模分发误导性信息。
上一篇
Paragon间谍软件的新目标挺身而出
2025-03-07
下一篇
发布评论