DeepSeek：您需要了解的有关AI ChatBot应用的所有信息

2025年03月07日 16:45发布

4063阅读

DeepSeek已经传播开来。中国AI实验室DeepSeek本周介绍了Apple App商店排行榜的顶部（以及Google Play），本周闯入了主流意识。 DeepSeek的AI模型是使用计算高效技术培训的，它导致华尔街分析师和技术人员质疑美国是否可以在AI竞赛中保持其领先地位，以及对AI芯片的需求是否可以维持。但是，DeepSeek从何而来，它是如何如此迅速地升入国际名声的呢？ DeepSeek的交易者起源 DeepSeek得到了高飞行资本管理的支持，这是中国定量对冲基金，该基金使用AI来告知其交易决策。 AI爱好者Liang Wenfeng于2015年共同创立了High-Flyer。Wenfeng据报道，他开始涉足交易，而Zhejiang University的一名学生在2019年推出了高级资本管理作为对冲基金，重点是开发和部署AI Algorithms。 2023年，High-Flyer始于DeepSeek，是一个致力于研究AI工具与金融业务分开的实验室。该实验室以High-Flyer作为其投资者之一，旋转成自己的公司，也称为DeepSeek。从第一天开始，DeepSeek构建了自己的数据中心群集进行模型培训。但是像中国其他AI公司一样，DeepSeek受到了美国出口禁令的影响。为了培训其最新模型之一，该公司被迫使用NVIDIA H800芯片，这是美国公司可用的芯片，H100的功能较小的版本。据说DeepSeek的技术团队偏向年轻。据报道，该公司积极招募了来自中国顶级大学的AI研究人员博士学位。 DeepSeek还雇用没有任何计算机科学背景的人，以帮助其技术更好地了解纽约时报。 DeepSeek的强大模型 DeepSeek推出了其第一组模型 - DeepSeek编码器，DeepSeek LLM和DeepSeek聊天 - 2023年11月。但是直到去年春天，这家初创公司发布了下一代DeepSeek-V2模型家族，AI行业才开始引起注意。 DeepSeek-v2是一种通用文本和图像分析系统，在各种AI基准测试中表现良好 - 并且运行远比当时可比的模型便宜得多。它迫使DeepSeek的国内竞争，包括Bytedance和Alibaba，降低了某些模型的使用价格，并使其他人完全自由。 DeepSeek-V3于2024年12月推出，仅加入了DeepSeek的臭名昭著。根据DeepSeek的内部基准测试，DeepSeek V3均优于可下载的，公开可用的型号，例如Meta的Llama和“封闭”模型，并且只能通过API访问，例如OpenAI的GPT-4O。同样令人印象深刻的是DeepSeek的R1“推理”模型。 DeepSeek声称R1在一月份发行，以及Openai的O1和NBSP;键基准上的模型。作为推理模型，R1有效地进行了事实检查，这有助于它避免一些通常会绊倒模型的陷阱。与典型的非争议模型相比，推理模型需要更长的时间（通常更长至分钟）才能达到解决方案。优势是它们在物理，科学和数学等领域中倾向于更可靠。但是，R1，DeepSeek V3和DeepSeek的其他模型有一个缺点。作为中国发展的AI，他们受到中国互联网监管机构的基准测试，以确保其反应“体现核心社会主义价值观”。例如，在DeepSeek的聊天机器人应用程序中，R1不会回答有关Tiananmen Square或台湾自治的问题。一种破坏性的方法如果DeepSeek具有商业模式，则尚不清楚该模型是什么。该公司将其产品和服务的价格远低于市场价值，并使其他人脱离或免费。 DeepSeek讲述的方式是，效率突破使它能够保持极高的成本竞争力。但是，一些专家对公司提供的数字提出了异议。无论如何，开发人员都采用了DeepSeek的模型，这不是开源的，因为通常可以理解该短语，但可以在允许商业用途的允许许可下获得。 Hugging Face的首席执行官Clem Delangue表示，托管DeepSeek模型的平台之一，Hugging Face上的开发人员创建了500多个R1的“衍生”模型，这些模型已增加了250万个下载。 DeepSeek对更大，更具成熟的竞争对手的成功被描述为“抬高的AI”和“超级狂欢”。该公司的成功至少部分是由于一月份导致NVIDIA的股价下跌18％，并引起Openai首席执行官Sam Altman的公众回应。麦克风Rosoft宣布，DeepSeek可以在其Azure AI Foundry Service（Microsoft的平台）上提供，该平台将AI服务汇集在单个横幅下。当被问及DeepSeek在第一季度收益电话中对Meta的AI支出的影响时，首席执行官Mark Zuckerberg表示，在AI基础设施上的支出将继续是Meta的“战略优势”。在NVIDIA的第四季度收益电话会议上，首席执行官Jensen Huang强调了DeepSeek的“出色创新”，他说它和其他“推理”模型对NVIDIA非常有用，因为他们需要更多的计算。同时，一些公司正在禁止DeepSeek，包括韩国在内的整个国家和政府也是如此。纽约州还禁止DeepSeek被用于政府设备。至于DeepSeek的未来可能会有什么，尚不清楚。改进的模型是给定的。但是美国政府似乎对它的危害持警惕极大的外国影响力。 TechCrunch有一个以AI为重点的新闻通讯！在这里注册以将其在每个星期三的收件箱中获取。这个故事最初发表于2025年1月28日，并将定期更新。