病毒虚拟助手Maya背后的创业芝麻释放其基本AI模型

知识小能手

2025年03月17日 18:49发布

1734阅读

AI Company芝麻已经发布了为Maya提供动力的基本模型，这是令人印象深刻的现实语音助手。

该模型的大小为10亿个参数（“参数”指向模型的各个组件），在Apache 2.0许可下，这意味着它可以在商业上使用，而很少有限制。该模型称为CSM-1B，根据AI DEV平台拥抱面的芝麻的描述，从文本和音频输入中生成“ RVQ音频代码”。

RVQ是指“残留向量量化”，这是一种将音频编码为离散代币的技术。 RVQ用于许多最近的AI音频技术，包括Google的Soundstream和Meta的Eccodec。

CSM-1B使用Meta的Llama家族中的模型作为骨架与音频“解码器”组件配对。芝麻说，CSM Powers Maya的微调变体。

“模式l开源是基本的一代模型，”芝麻在CSM-1B的拥抱脸和GitHub存储库中写道。 “它能够产生各种声音，但由于培训数据中的数据污染，该模型并未在任何特定的声音上进行微调[…]，但可能不会做得很好。”

目前尚不清楚用于训练CSM-1B的芝麻数据芝麻。公司没有说。

值得注意的是，该模型没有真正的保障措施。芝麻具有荣誉系统，仅敦促开发人员和用户不使用模型未经同意而模仿一个人的声音，创建诸如假新闻之类的误导性内容，或从事“有害”或“恶意”活动。

我在拥抱脸上尝试了演示，克隆我的声音不到一分钟。从那里开始，很容易对我内心的渴望产生演讲，包括在续大选和俄罗斯宣传等漫游主题。

消费者报告最近警告说，市场上许多受欢迎的AI驱动语音克隆工具没有“有意义的”保障来防止欺诈或滥用。

由Oculus共同创作者Brendan Iribe共同创立的芝麻在2月下旬因其助理Tech而风靡一时，该助理技术接近清除了不可思议的山谷领土。玛雅（Maya）和芝麻（Maya）的另一个助手迈尔斯（Miles）呼吸着呼吸，并在讲话时会被打断，就像Openai的语音模式一样。

芝麻从Andreessen Horowitz，Spark Capital和Matrix Partners筹集了未公开的资本。除了构建语音助理技术外，该公司还说，它是针对AI眼镜“全天戴”的原型AI眼镜，该眼镜将配备其定制型号。

发布了：12304篇内容

查阅文章

2025-03-17

2025-03-17