Google的企业云获得了音乐生成的AI模型

周三,Google推出了通过其Vertex AI云平台提供的几种第一方媒体生成的AI模型的更新。

Google的企业云获得了音乐生成的AI模型

lyria是Google的文本到音乐模型,现在可以在Preview in Preview for Persect for Pervie客户中获得,并且通过新的编辑和视觉效果定制选项,该公司的VEO 2视频创作模型已增强。该公司还推出了由Chirp 3(Google的音频理解模型)提供动力的语音关闭功能,用于“允许上市”用户。 Imagen 3图像生成器现在提供了公司所说的“显着”更好的性能。

更新是Cloud Next的定时,是Google最新推出生成AI企业市场的推动力。该公司可能与亚马逊最直接竞争,亚马逊提供了一个可比的云AI平台,称为Bedrock,其专有的生成AI模型集。

Google正在宣传lyrIA作为免版税音乐库的替代品。该公司说,使用该模型,客户可以以各种风格和流派创作歌曲,从爵士钢琴独奏到Lo-Fi曲目。

。 同时,

Chirp 3可以用大约35种语言综合语音。 Chirp 3首次预览于今年早些时候,驱动了即时的自定义声音,据说可以用10秒的音频克隆声音。现在通常可用。该模型还支持了一个新工具在预览中启动的新工具,称为Transcription with Diarrization,该工具在录音中分开并确定了与多个参与者的录音中的扬声器。

为防止滥用,即时自定义声音要经受“勤奋”过程,以验证“适当的语音使用权限”。

对于VEO 2,该模型现在可以从现有视频中删除背景图像,徽标和对象,并将视频镜头范围扩展(例如,将景观视频转换为肖像)。现在也可以调整e摄像机角度和在AI生成的场景中起搏,以创建时间失误,无人机式夹子等,并且可以在指定的开始和终端框架之间插值。

这些VEO功能现在可以在预览中获得。

至于上述成像3升级,Google表示,它们提高了该模型删除对象和重建图像缺失或损坏的能力。

使用Google的SynthID技术,将Imagen,VEO和Lyria(但不是Chirp)生成的所有媒体均以水标为水印。该公司表示,其所有生成的AI模型都具有“内置保障”,以防止创建有害内容。

Google历来尚未表明它用于培训其模型的哪些特定数据,而科技巨头一直坚持当今的先例。由于IP相关的原因,培训数据往往是有争议的主题。一些公司在没有首先获得Permis的情况下对受版权保护的作品进行训练权利持有人的sion。尽管这些公司声称美国公平使用学说掩盖了这种做法,但一些创作者可以理解地不同意。许多正在法庭上与供应商作斗争。

Google此前曾告诉TechCrunch,它提供了用于模型培训的选择退出机制,以及赔偿政策,以屏蔽Google Cloud和Vertex AI客户免于AI相关的版权纠纷。

avatar

知识菜鸟 管理员

发布了:18472篇内容
查阅文章

发布评论

验证码

QQ交谈

在线咨询:QQ交谈

工作时间:每天9:00 - 18:00
若无特殊,节假日休息

我的微信