OpenAI再次指控DeepSeek违规“蒸馏”其模型
OpenAI再次公开指控中国初创公司DeepSeek利用“模型蒸馏”技术违规复制其产品功能,并已将相关证据提交至美国国会众议院中国问题特别委员会。OpenAI声称,DeepSeek通过一种名为“模型蒸馏”(Model Distillation)的技术手段,从OpenAI庞大的模型中提取核心功能,以极低的成本研发出性能媲美的竞争产品。
据OpenAI内部备忘录称,DeepSeek利用了“复杂且混淆的手段”,据称试图绕过OpenAI的安全防护系统,收集OpenAI模型的输出数据用于训练其自有模型R1及后续版本 .OpenAI表示,此举不仅损害了其商业利益,更破坏了市场公平竞争秩序.

业内专家指出,虽然OpenAI对DeepSeek的指控在措辞上极为严厉,但“蒸馏”技术在人工智能行业中实际上非常常见。它允许开发者通过少量数据和算力,利用大型模型的输出作为训练参考,从而在成本和时间上获得巨大的优势。然而,OpenAI在服务条款中明确规定,禁止用户复制其模型输出以开发竞争性模型。这意味着如果DeepSeek在未经授权的情况下使用了OpenAI的模型输出,可能确实触犯了OpenAI的合约条款.
尽管面临指控,DeepSeek在市场上的表现依旧强劲。自从发布R1模型以来,DeepSeek凭借其在数学推理、编程和通用对话能力上的突破,已经成为OpenAI在国内外市场的主要竞争对手之一。DeepSeek的R1模型据称在训练成本上仅为OpenAI最新大模型的三十分之一左右,但性能却能媲美OpenAI的最强推理模型o1.
DeepSeek的开源力度堪称业界标杆,已经从单纯的模型权重开源,发展到涵盖底层架构的全栈开源。DeepSeek不仅开源了模型本身,还开源了包括FlashMLA、DualPipe、EPLB(专家负载平衡)在内的多项底层优化工具。这些工具涵盖了模型训练中的双向流水线并行、通信计算重叠以及专家负载均衡等关键技术,帮助开发者更高效地复现和部署模型。
DeepSeek的开源策略激发了全球开发者社区的高度参与。开发者不仅复刻DeepSeek,还尝试将其与Claude、Gemini等模型进行“缝合”,利用各自优势构建混合型AI系统。这表明DeepSeek已经成为全球AI工具箱中的基础组件之一。

彭博社报道:https://www.bloomberg.com/news/articles/2026-02-12/openai-accuses-deepseek-of-distilling-us-models-to-gain-an-edge



发表回复