Chatgpt的图像生成功能获得了升级

知识菜鸟

2025年03月26日 10:43发布

1849阅读

在周二的一次直播中，Openai首席执行官Sam Altman宣布了一年多的Chatgpt图像生成能力的首次重大升级。

ChatGpt现在可以利用公司的GPT-4O型号在本地创建和修改图像和照片。 GPT-4O长期以来一直为AI驱动的聊天机器人平台提供了支持，但是直到现在，该模型才能够生成和编辑文本 - 而不是图像。

Altman表示，GPT-4O本地图像生成今天现场直播在OpenAI的AI视频生成产品Chatgpt和Sora，供该公司的每月200美元的Pro计划订阅。 Openai表示，该功能即将推出，并使用Chatgpt的免费用户以及使用公司API服务的开发人员。

gpt-4O带有图像输出“思考”比图像生成模型更长的时间，它有效地取代了dall-e 3，以使OpenAI描述为更准确，更详细的图像。 GPT-4O可以编辑现有图像ES，包括与其中的人一起使用的图像 - 将它们转换或“介绍”细节，例如前景和背景对象。

为了为新的图像功能提供动力，Openai告诉《华尔街日报》，它在“公开数据”上训练了GPT-4O，以及与Shutterstock等公司的合作伙伴关系的专有数据。

。

许多生成的AI供应商将培训数据视为竞争优势，因此他们将其保留以及与胸部接近的任何信息。但是，培训数据细节也是IP相关诉讼的潜在来源，这是公司揭示很多东西的另一种抑制。

“我们正在尊重艺术家的权利，从我们的发出方式方面，我们制定了适当的政策，可以防止我们生成直接模仿任何活着艺术家的作品的图像，” OpenAI首席运营官Brad Lightcap在《期刊》上发表的声明中说。

。

OpenAi提供了一个退出表格，允许创建者要求从其培训数据集中删除IR工程。该公司还表示，它尊重请求禁止其网络剪贴机器人收集培训数据，包括图像，网站。

Chatgpt升级的图像生成功能紧随Google的实验性本机图像输出，Gemini 2.0 Flash是该公司的旗舰车型之一。强大的功能在社交媒体上传播了，但不一定是出于最佳原因。 Gemini 2.0 Flash的图像组件原来很少有护栏，使人们可以删除水印并创建描绘受版权保护字符的图像。

本文在PT下午12点进行了更新，其中包括Openai围绕GPT-4O的培训数据的《华尔街日报》的声明。

发布了：9437篇内容

查阅文章

2025-03-26

2025-03-26