Chatgpt的图像生成功能获得了升级
在周二的一次直播中,Openai首席执行官Sam Altman宣布了一年多的Chatgpt图像生成能力的首次重大升级。
ChatGpt现在可以利用公司的GPT-4O型号在本地创建和修改图像和照片。 GPT-4O长期以来一直为AI驱动的聊天机器人平台提供了支持,但是直到现在,该模型才能够生成和编辑文本 - 而不是图像。
Altman表示,GPT-4O本地图像生成今天现场直播在OpenAI的AI视频生成产品Chatgpt和Sora,供该公司的每月200美元的Pro计划订阅。 Openai表示,该功能即将推出,并使用Chatgpt的免费用户以及使用公司API服务的开发人员。
gpt-4O带有图像输出“思考”比图像生成模型更长的时间,它有效地取代了dall-e 3,以使OpenAI描述为更准确,更详细的图像。 GPT-4O可以编辑现有图像ES,包括与其中的人一起使用的图像 - 将它们转换或“介绍”细节,例如前景和背景对象。
为了为新的图像功能提供动力,Openai告诉《华尔街日报》,它在“公开数据”上训练了GPT-4O,以及与Shutterstock等公司的合作伙伴关系的专有数据。
。许多生成的AI供应商将培训数据视为竞争优势,因此他们将其保留以及与胸部接近的任何信息。但是,培训数据细节也是IP相关诉讼的潜在来源,这是公司揭示很多东西的另一种抑制。
“我们正在尊重艺术家的权利,从我们的发出方式方面,我们制定了适当的政策,可以防止我们生成直接模仿任何活着艺术家的作品的图像,” OpenAI首席运营官Brad Lightcap在《期刊》上发表的声明中说。
。OpenAi提供了一个退出表格,允许创建者要求从其培训数据集中删除IR工程。该公司还表示,它尊重请求禁止其网络剪贴机器人收集培训数据,包括图像,网站。
Chatgpt升级的图像生成功能紧随Google的实验性本机图像输出,Gemini 2.0 Flash是该公司的旗舰车型之一。强大的功能在社交媒体上传播了,但不一定是出于最佳原因。 Gemini 2.0 Flash的图像组件原来很少有护栏,使人们可以删除水印并创建描绘受版权保护字符的图像。
本文在PT下午12点进行了更新,其中包括Openai围绕GPT-4O的培训数据的《华尔街日报》的声明。
发布评论