Google的企业云获得了音乐生成的AI模型

知识菜鸟

2025年04月10日 11:07发布

1876阅读

周三，Google推出了通过其Vertex AI云平台提供的几种第一方媒体生成的AI模型的更新。

lyria是Google的文本到音乐模型，现在可以在Preview in Preview for Persect for Pervie客户中获得，并且通过新的编辑和视觉效果定制选项，该公司的VEO 2视频创作模型已增强。该公司还推出了由Chirp 3（Google的音频理解模型）提供动力的语音关闭功能，用于“允许上市”用户。 Imagen 3图像生成器现在提供了公司所说的“显着”更好的性能。

更新是Cloud Next的定时，是Google最新推出生成AI企业市场的推动力。该公司可能与亚马逊最直接竞争，亚马逊提供了一个可比的云AI平台，称为Bedrock，其专有的生成AI模型集。

。

Google正在宣传lyrIA作为免版税音乐库的替代品。该公司说，使用该模型，客户可以以各种风格和流派创作歌曲，从爵士钢琴独奏到Lo-Fi曲目。

。同时，

Chirp 3可以用大约35种语言综合语音。 Chirp 3首次预览于今年早些时候，驱动了即时的自定义声音，据说可以用10秒的音频克隆声音。现在通常可用。该模型还支持了一个新工具在预览中启动的新工具，称为Transcription with Diarrization，该工具在录音中分开并确定了与多个参与者的录音中的扬声器。

为防止滥用，即时自定义声音要经受“勤奋”过程，以验证“适当的语音使用权限”。

对于VEO 2，该模型现在可以从现有视频中删除背景图像，徽标和对象，并将视频镜头范围扩展（例如，将景观视频转换为肖像）。现在也可以调整e摄像机角度和在AI生成的场景中起搏，以创建时间失误，无人机式夹子等，并且可以在指定的开始和终端框架之间插值。

这些VEO功能现在可以在预览中获得。

至于上述成像3升级，Google表示，它们提高了该模型删除对象和重建图像缺失或损坏的能力。

使用Google的SynthID技术，将Imagen，VEO和Lyria（但不是Chirp）生成的所有媒体均以水标为水印。该公司表示，其所有生成的AI模型都具有“内置保障”，以防止创建有害内容。

Google历来尚未表明它用于培训其模型的哪些特定数据，而科技巨头一直坚持当今的先例。由于IP相关的原因，培训数据往往是有争议的主题。一些公司在没有首先获得Permis的情况下对受版权保护的作品进行训练权利持有人的sion。尽管这些公司声称美国公平使用学说掩盖了这种做法，但一些创作者可以理解地不同意。许多正在法庭上与供应商作斗争。

Google此前曾告诉TechCrunch，它提供了用于模型培训的选择退出机制，以及赔偿政策，以屏蔽Google Cloud和Vertex AI客户免于AI相关的版权纠纷。