DeepSeek:您需要了解的有关AI ChatBot应用的所有信息

DeepSeek已经传播开来。 中国AI实验室DeepSeek本周介绍了Apple App商店排行榜的顶部(以及Google Play),本周闯入了主流意识。 DeepSeek的AI模型是使用计算高效技术培训的,它导致华尔街分析师和技术人员质疑美国是否可以在AI竞赛中保持其领先地位,以及对AI芯片的需求是否可以维持。 但是,DeepSeek从何而来,它是如何如此迅速地升入国际名声的呢? DeepSeek的交易者起源 DeepSeek得到了高飞行资本管理的支持,这是中国定量对冲基金,该基金使用AI来告知其交易决策。 AI爱好者Liang Wenfeng于2015年共同创立了High-Flyer。Wenfeng据报道,他开始涉足交易,而Zhejiang University的一名学生在2019年推出了高级资本管理作为对冲基金,重点是开发和部署AI Algorithms。 2023年,High-Flyer始于DeepSeek,是一个致力于研究AI工具与金融业务分开的实验室。该实验室以High-Flyer作为其投资者之一,旋转成自己的公司,也称为DeepSeek。 从第一天开始,DeepSeek构建了自己的数据中心群集进行模型培训。但是像中国其他AI公司一样,DeepSeek受到了美国出口禁令的影响。为了培训其最新模型之一,该公司被迫使用NVIDIA H800芯片,这是美国公司可用的芯片,H100的功能较小的版本。 据说DeepSeek的技术团队偏向年轻。据报道,该公司积极招募了来自中国顶级大学的AI研究人员博士学位。 DeepSeek还雇用没有任何计算机科学背景的人,以帮助其技术更好地了解纽约时报。 DeepSeek的强大模型 DeepSeek推出了其第一组模型 - DeepSeek编码器,DeepSeek LLM和DeepSeek聊天 - 2023年11月。但是直到去年春天,这家初创公司发布了下一代DeepSeek-V2模型家族,AI行业才开始引起注意。 DeepSeek-v2是一种通用文本和图像分析系统,在各种AI基准测试中表现良好 - 并且运行远比当时可比的模型便宜得多。它迫使DeepSeek的国内竞争,包括Bytedance和Alibaba,降低了某些模型的使用价格,并使其他人完全自由。 DeepSeek-V3于2024年12月推出,仅加入了DeepSeek的臭名昭著。 根据DeepSeek的内部基准测试,DeepSeek V3均优于可下载的,公开可用的型号,例如Meta的Llama和“封闭”模型,并且只能通过API访问,例如OpenAI的GPT-4O。 同样令人印象深刻的是DeepSeek的R1“推理”模型。 DeepSeek声称R1在一月份发行,以及Openai的O1和NBSP;键基准上的模型。 作为推理模型,R1有效地进行了事实检查,这有助于它避免一些通常会绊倒模型的陷阱。与典型的非争议模型相比,推理模型需要更长的时间(通常更长至分钟)才能达到解决方案。优势是它们在物理,科学和数学等领域中倾向于更可靠。 但是,R1,DeepSeek V3和DeepSeek的其他模型有一个缺点。作为中国发展的AI,他们受到中国互联网监管机构的基准测试,以确保其反应“体现核心社会主义价值观”。例如,在DeepSeek的聊天机器人应用程序中,R1不会回答有关Tiananmen Square或台湾自治的问题。 一种破坏性的方法 如果DeepSeek具有商业模式,则尚不清楚该模型是什么。该公司将其产品和服务的价格远低于市场价值,并使其他人脱离或免费。 DeepSeek讲述的方式是,效率突破使它能够保持极高的成本竞争力。但是,一些专家对公司提供的数字提出了异议。 无论如何,开发人员都采用了DeepSeek的模型,这不是开源的,因为通常可以理解该短语,但可以在允许商业用途的允许许可下获得。 Hugging Face的首席执行官Clem Delangue表示,托管DeepSeek模型的平台之一,Hugging Face上的开发人员创建了500多个R1的“衍生”模型,这些模型已增加了250万个下载。 DeepSeek对更大,更具成熟的竞争对手的成功被描述为“抬高的AI”和“超级狂欢”。该公司的成功至少部分是由于一月份导致NVIDIA的股价下跌18%,并引起Openai首席执行官Sam Altman的公众回应。 麦克风Rosoft宣布,DeepSeek可以在其Azure AI Foundry Service(Microsoft的平台)上提供,该平台将AI服务汇集在单个横幅下。当被问及DeepSeek在第一季度收益电话中对Meta的AI支出的影响时,首席执行官Mark Zuckerberg表示,在AI基础设施上的支出将继续是Meta的“战略优势”。 在NVIDIA的第四季度收益电话会议上,首席执行官Jensen Huang强调了DeepSeek的“出色创新”,他说它和其他“推理”模型对NVIDIA非常有用,因为他们需要更多的计算。 同时,一些公司正在禁止DeepSeek,包括韩国在内的整个国家和政府也是如此。纽约州还禁止DeepSeek被用于政府设备。 至于DeepSeek的未来可能会有什么,尚不清楚。改进的模型是给定的。但是美国政府似乎对它的危害持警惕极大的外国影响力。 TechCrunch有一个以AI为重点的新闻通讯! 在这里注册以将其在每个星期三的收件箱中获取。 这个故事最初发表于2025年1月28日,并将定期更新。

DeepSeek:您需要了解的有关AI ChatBot应用的所有信息

avatar

知识小能手 管理员

发布了:11472篇内容
查阅文章

发布评论

验证码

QQ交谈

在线咨询:QQ交谈

工作时间:每天9:00 - 18:00
若无特殊,节假日休息

我的微信