Openai推出了新工具,以帮助企业建立AI代理商

周二,OpenAI发布了新工具,旨在帮助开发人员和企业建立AI代理 - 可以独立完成任务的自动化系统 - 使用公司自己的AI模型和框架。

Openai推出了新工具,以帮助企业建立AI代理商

这些工具是OpenAI的新响应API的一部分,该API使企业可以开发自定义的AI代理,这些AI代理可以执行Web搜索,通过公司文件扫描和导航网站,就像OpenAI的操作员产品一样。响应API有效地取代了OpenAI的助手API,该公司计划在2026年上半年日落。

尽管技术行业一直在努力向人们展示“ AI代理商”的真正含义,但近年来,围绕AI代理商的炒作近年来已经显着增长。在最近的代理炒作的最新示例中,本周早些时很快发现并没有兑现公司的许多诺言。

换句话说,对于Openai来说,赌注很高。

“演示您的经纪人非常容易,” Openai的API产品负责人Olivier Godement在接受TechCrunch时对TechCrunch进行了采访。 “缩放代理很难,让人们经常使用它非常困难。”

今年早些时候,Openai在Chatgpt介绍了两名AI代理:运营商,该代理代表您浏览网站,并深入研究,该研究为您汇编了研究报告。两种工具都可以瞥见代理技术可以实现的目标,但是在“自治”部门中,需要花费很多时间。

现在有了响应API,OpenAI希望出售对AI代理的组件的访问权限,从而允许开发人员构建自己的操作员和深层研究风格的代理应用程序。 Openai希望开发人员可以使用其创建一些应用程序感觉比当今可用的更自主的代理技术。

使用响应API,开发人员可以在OpenAI的Chatgpt搜索网络搜索工具的引擎盖下点击相同的AI模型(在预览中):GPT-4O搜索和GPT-4O MINI搜索。这些模型可以浏览网络以获取问题的答案,并以它们生成答复的来源为由。

OpenAI声称GPT-4O搜索和GPT-4O迷你搜索实际上是准确的。在公司的SimpleQA基准测试中,该基准衡量了模型回答简短的,寻求事实的问题的能力,GPT-4O搜索得分为90%,而GPT-4O Mini搜索得分为88%(较高)(较高)。为了进行比较,GPT-4.5 - Openai更大,最近发布的模型 - 得分仅为63%。

响应API还包括一个文件搜索实用程序,可以快速跨公司数据库中的文件扫描以检索信息。 (Openai声称它不会在这些文件上培训模型。)离子,使用响应的开发人员API可以点击开放式运算符的OpenAI的计算机使用代理(CUA)模型。该模型生成鼠标和键盘操作,允许开发人员自动化计算机使用数据输入和应用程序工作流程等任务。

Openai说,

企业可以选择运行CUA模型,该模型在研究预览中在本地发布的系统中发布。运算符中可用的CUA的消费者版本只能在网上采取操作。

明确的是,API的响应不会解决今天困扰AI代理商的所有技术问题。

虽然AI驱动的搜索工具比传统的AI模型更准确,但这并不奇怪,因为它们可以查找正确的答案,但Web搜索并没有使AI幻觉成为解决问题的问题。 GPT-4O搜索仍然遇到了事实问题的10%。除了它们的准确性之外,AI搜索工具还倾向于在简短的导航查询中挣扎(这样如“今天的湖人得分”),最近的报道表明,Chatgpt的引用并不总是可靠的。

Openai在提供给TechCrunch的博客文章中说,CUA模型“尚不在操作系统上自动化任务非常可靠”,并且很容易犯“无意”错误。

但是,Openai说,这些是其代理工具的早期迭代,并且一直在努力改善它们。

除了响应API之外,OpenAI还发布了一个名为Agents SDK的开源工具包,该工具包为开发人员提供免费工具,以将模型与其内部系统集成,设置保障措施,并监控AI代理活动的活动,以调试和优化目的。 Adents SDK是对Openai群的随访,该群体是该公司去年下半年发布的多代理编排的框架。

上帝说他希望Openai可以弥合AI之间的差距代理商演示和产品今年,他认为,“代理是将会发生的最有影响力的AI应用。”这与宣告Openai的宣告首席执行官Sam Altman在1月份成立:2025年是AI代理商进入劳动力的那一年。

2025年是否真正成为“ AI代理年”,Openai的最新版本显示,该公司希望从华而不实的代理商演示转移到有影响力的工具。

avatar

知识菜鸟 管理员

发布了:10730篇内容
查阅文章

发布评论

验证码

QQ交谈

在线咨询:QQ交谈

工作时间:每天9:00 - 18:00
若无特殊,节假日休息

我的微信