“开放” AI模型许可通常具有有关限制的
本周,谷歌发布了一个开放式AI模型Gemma 3的家庭,该系列迅速以其令人印象深刻的效率而获得赞誉。但是,随着许多开发人员对X的遗憾,Gemma 3的许可证将模型的商业使用成为有风险的主张。
这不是Gemma 3的特有的问题。像Meta这样的公司还将其公开可用的模型应用于自定义,非标准的许可条款,并且该条款对公司带来了法律挑战。一些公司,尤其是较小的业务,担心Google和其他公司可以通过断言更加繁重的条款来“吸收地毯”。
“所谓的'开放式AI模型的限制性和不一致的许可正在造成不确定性,尤其是对于商业采用而言。 “虽然这些模型被销售为开放,但实际术语施加了各种法律和实用障碍,使企业将其整合到其产品或服务中。”
开放模型开发人员的理由是在专有许可下发布模型,而不是Apache和MIT等行业标准选择。例如,AI创业公司的cohere已经清楚地表明了其支持科学(但不是商业)在其模型上工作的意图。
但是,杰玛(Gemma)和梅塔(Meta)的骆驼许可证尤其具有限制,这些限制限制了公司在不担心法律报复的情况下使用模型的方式。
例如,meta禁止开发人员使用Llama 3模型的“输出或结果”来改善除骆驼3或“衍生作品”之外的任何模型。它还可以防止拥有超过7亿个月活跃用户的公司部署Llama模型,而无需首先获得特殊的额外许可证。
Gemma的许可证通常不那么繁重。但是,它确实授予Google对Gemma的“限制(远程或其他方式)使用”的权利,而Google认为违反了公司禁止使用政策或“适用法律和法规”。
这些术语不仅适用于原始的骆驼和Gemma型号。基于骆驼或杰玛的模型也必须分别遵守骆驼和杰玛许可。在Gemma的情况下,其中包括对Gemma生成的合成数据训练的模型。
德国人工智能研究中心的研究助理弗洛里安(Florian)品牌认为,尽管技术巨头管理员会相信什么,但吉玛(Gemma)和拉玛(Llama)的“不能合理地称为'开源''
“大多数公司都有一套批准的许可证,例如Apache 2.0,因此任何自定义许可证都是很多麻烦和金钱,”品牌告诉TechCrunch。 “没有法律团队或律师资金的小型公司将坚持拥有标准许可证的模型。”
品牌指出,具有自定义许可证的AI模型开发人员(例如Google)尚未积极执行其条款。但是,他补充说,威胁通常足以阻止采用。
“这些限制对AI生态系统产生了影响,即使对像我这样的AI研究人员,” Brand说。
穆迪(Moody's)的机器学习总监Han-Chung Lee同意,诸如Gemma和Llama附加的许可证在许多商业场景中都“不可用”。 AI初创公司Gretel的科学家Eric Tramel也是如此。“模型特定的许可使模型衍生物和蒸馏的特定雕像引起了人们对回扣的关注,” Tramel说。 “想象一个专门生产模型的业务S为他们的客户。 Llama的Gemma-Data微调应具有什么许可? 对所有下游客户的影响会带来什么影响?”
Tramel说,部署最恐惧的情况是,这些模特是一种特洛伊木马。
“模型铸造厂可以推出[开放]模型,等待使用这些模型来看哪些业务案例,然后通过勒索或法律策略将其进入成功的垂直行业,”他说。 “例如,杰玛3(Gemma 3)看起来像是一个坚实的释放,并且可能会产生广泛的影响。但是由于其许可结构,市场无法采用它。因此,企业可能会坚持使用较弱且可靠的Apache 2.0型号。”
清楚,尽管有限制性许可,某些模型仍取得了广泛的分配。例如,骆驼已经下载了数亿次,并内置包括Spotify在内的主要公司的产品。
AI初创公司Hugging Face的机器学习和社会负责人Yacine Jernite表示,
,如果获得允许的许可,他们可能会更加成功。 Jernite呼吁像Google这样的提供商开放许可证框架,并以广泛接受的条款与用户“更直接地合作”。
“鉴于在这些条款上缺乏共识,以及许多基本假设尚未在法庭上进行测试的事实,这主要是这些演员的意图宣言。” “ [但是,如果某些条款的解释太广泛,那么许多出色的工作将发现自己的法律依据不确定,这对于建立成功的商业产品的组织尤其令人恐惧。”
vidal说,迫切需要AI模型公司可以自由集成,修改和共享而无需Fe突然的许可证变更或法律歧义。
“当前的AI模型许可的格局充满了混乱,限制性条款和误导性的开放性主张,” Vidal说。 “与其重新定义'开放'以适合公司利益,不如AI行业与已建立的开源原则保持一致,以创建一个真正的开放生态系统。”
发布评论