病毒虚拟助手Maya背后的创业芝麻释放其基本AI模型
AI Company芝麻已经发布了为Maya提供动力的基本模型,这是令人印象深刻的现实语音助手。
该模型的大小为10亿个参数(“参数”指向模型的各个组件),在Apache 2.0许可下,这意味着它可以在商业上使用,而很少有限制。该模型称为CSM-1B,根据AI DEV平台拥抱面的芝麻的描述,从文本和音频输入中生成“ RVQ音频代码”。
RVQ是指“残留向量量化”,这是一种将音频编码为离散代币的技术。 RVQ用于许多最近的AI音频技术,包括Google的Soundstream和Meta的Eccodec。
CSM-1B使用Meta的Llama家族中的模型作为骨架与音频“解码器”组件配对。芝麻说,CSM Powers Maya的微调变体。
“模式l开源是基本的一代模型,”芝麻在CSM-1B的拥抱脸和GitHub存储库中写道。 “它能够产生各种声音,但由于培训数据中的数据污染,该模型并未在任何特定的声音上进行微调[…],但可能不会做得很好。”
>> >目前尚不清楚用于训练CSM-1B的芝麻数据芝麻。公司没有说。
值得注意的是,该模型没有真正的保障措施。芝麻具有荣誉系统,仅敦促开发人员和用户不使用模型未经同意而模仿一个人的声音,创建诸如假新闻之类的误导性内容,或从事“有害”或“恶意”活动。
我在拥抱脸上尝试了演示,克隆我的声音不到一分钟。从那里开始,很容易对我内心的渴望产生演讲,包括在续大选和俄罗斯宣传等漫游主题。
消费者报告最近警告说,市场上许多受欢迎的AI驱动语音克隆工具没有“有意义的”保障来防止欺诈或滥用。
由Oculus共同创作者Brendan Iribe共同创立的芝麻在2月下旬因其助理Tech而风靡一时,该助理技术接近清除了不可思议的山谷领土。玛雅(Maya)和芝麻(Maya)的另一个助手迈尔斯(Miles)呼吸着呼吸,并在讲话时会被打断,就像Openai的语音模式一样。 芝麻从Andreessen Horowitz,Spark Capital和Matrix Partners筹集了未公开的资本。除了构建语音助理技术外,该公司还说,它是针对AI眼镜“全天戴”的原型AI眼镜,该眼镜将配备其定制型号。
上一篇
chatgpt:您需要了解的有关AI聊天机器人的一切
2025-03-17
下一篇
发布评论