Google首次亮相了新的基于双子座的文本嵌入模型

Google上周五向其双子座开发人员API添加了一种新的,实验性的“嵌入”模型,Gemini Embedding。 嵌入模型将诸如单词和短语之类的文本输入转化为数值表示,称为嵌入,以捕获文本的语义含义。嵌入在一系列应用中,例如文档检索和分类,部分原因是它们可以在改善延迟的同时降低成本。 包括亚马逊,Cohere和OpenAI在内的公司通过各自的API提供嵌入模型。 Google以前提供了嵌入模型,但Gemini Embedding是其首次在AI模型的双子座家族中训练的。 Google在博客文章中说:“该嵌入模型受过双子座模型本身的培训,已经继承了双子座对语言和细微差别的上下文的理解,使其适用于广泛的用途。” “我们已经训练了我们的模型,以非常一般,提供了出色的经历跨不同领域的Rmance,包括金融,科学,法律,搜索等等。” Google声称,双子座嵌入的嵌入超过了其先前最先进的嵌入模型,Text-Ebbedding-004的性能,并在流行的嵌入基准中实现了竞争性能。与Text-ebbedding-004相比,双子座的嵌入也可以一次接受较大的文本和代码,并且支持了两倍的语言(超过100种)。 Google指出,双子座的嵌入处于“实验阶段”,容量有限,并且可能会发生变化。该公司在博客文章中写道:“ [W]正在努力在未来几个月中努力稳定,通常可用的版本。”

Google首次亮相了新的基于双子座的文本嵌入模型

avatar

知识菜鸟 管理员

发布了:9824篇内容
查阅文章

发布评论

验证码

QQ交谈

在线咨询:QQ交谈

工作时间:每天9:00 - 18:00
若无特殊,节假日休息

我的微信