病毒虚拟助手Maya背后的创业芝麻释放其基本AI模型

AI Company芝麻已经发布了为Maya提供动力的基本模型,这是令人印象深刻的现实语音助手。

病毒虚拟助手Maya背后的创业芝麻释放其基本AI模型

该模型的大小为10亿个参数(“参数”指向模型的各个组件),在Apache 2.0许可下,这意味着它可以在商业上使用,而很少有限制。该模型称为CSM-1B,根据AI DEV平台拥抱面的芝麻的描述,从文本和音频输入中生成“ RVQ音频代码”。

RVQ是指“残留向量量化”,这是一种将音频编码为离散代币的技术。 RVQ用于许多最近的AI音频技术,包括Google的Soundstream和Meta的Eccodec。

CSM-1B使用Meta的Llama家族中的模型作为骨架与音频“解码器”组件配对。芝麻说,CSM Powers Maya的微调变体。

“模式l开源是基本的一代模型,”芝麻在CSM-1B的拥抱脸和GitHub存储库中写道。 “它能够产生各种声音,但由于培训数据中的数据污染,该模型并未在任何特定的声音上进行微调[…],但可能不会做得很好。”

>>

>

目前尚不清楚用于训练CSM-1B的芝麻数据芝麻。公司没有说。

值得注意的是,该模型没有真正的保障措施。芝麻具有荣誉系统,仅敦促开发人员和用户不使用模型未经同意而模仿一个人的声音,创建诸如假新闻之类的误导性内容,或从事“有害”或“恶意”活动。

我在拥抱脸上尝试了演示,克隆我的声音不到一分钟。从那里开始,很容易对我内心的渴望产生演讲,包括在续大选和俄罗斯宣传等漫游主题。

消费者报告最近警告说,市场上许多受欢迎的AI驱动语音克隆工具没有“有意义的”保障来防止欺诈或滥用。

由Oculus共同创作者Brendan Iribe共同创立的芝麻在2月下旬因其助理Tech而风靡一时,该助理技术接近清除了不可思议的山谷领土。玛雅(Maya)和芝麻(Maya)的另一个助手迈尔斯(Miles)呼吸着呼吸,并在讲话时会被打断,就像Openai的语音模式一样。

芝麻从Andreessen Horowitz,Spark Capital和Matrix Partners筹集了未公开的资本。除了构建语音助理技术外,该公司还说,它是针对AI眼镜“全天戴”的原型AI眼镜,该眼镜将配备其定制型号。

avatar

知识小能手 管理员

发布了:12304篇内容
查阅文章

发布评论

验证码

QQ交谈

在线咨询:QQ交谈

工作时间:每天9:00 - 18:00
若无特殊,节假日休息

我的微信