DeepSeek首次公开回应「技术模仿」争议
2025年9月17日,中国人工智能领域迎来历史性突破时刻。DeepSeek-AI研究团队在《自然》杂志发表关于开源模型DeepSeek-R1的研究成果,该研究不仅登上当期杂志封面,更引发全球AI领域广泛关注。

研究团队通过实验证明,利用纯强化学习方法可显著提升大语言模型的推理能力,这种方法有效降低了对人工标注数据的依赖。与传统训练范式相比,创新方法训练的模型在数学解题、编程竞赛等STEM领域研究生级别的任务中展现出更卓越的性能。
针对业界的「蒸馏争议」,DeepSeek研究团队首次作出正式回应。在论文审稿过程中,研究团队向审稿人明确说明:R1模型并非通过复制已有AI模型的推理示例进行学习,而是和多数大语言模型一样,其基础模型训练数据来源于互联网自然存在的AI生成内容。
科研奇迹:29万美元创造的颠覆性突破
在全球AI竞赛中,高质量大模型的研发向来被视为「烧钱游戏」。据公开数据显示,OpenAI训练GPT-4花费超过1亿美元,Meta、谷歌等科技巨头的投入同样高达数千万美元。在这场资本角逐中,DeepSeek-R1却以惊人性价比改写了行业规则。
论文补充材料披露,DeepSeek-R1的推理训练成本仅29.4万美元,即使加上600万美元的基础模型训练投入,总成本仍远低于国际同行。这一突破不仅体现在经济性上,更在于其开创性的训练方法。
创新性的纯强化学习框架配合组相对策略优化(GRPO)算法,使模型能够仅依据答案正确性获得激励,而非机械模仿人工推理过程。令人惊讶的是,这种看似简单的训练机制,反而促使模型自主产生了自我反思、自我验证等高级认知行为,有时会生成上千个token来反复推理论证。
在美国数学邀请赛(AIME2024)测试中,采用自洽解码方法的DeepSeek-R1准确率达86.7%,显著超越人类平均水准。《自然》杂志评论指出,这证明AI完全可以通过强化学习自主发展复杂推理能力,而无需人工示范。
经过多轮优化后的DeepSeek-R1不仅在数学编程等硬核项目表现优异,在文本创作、开放问答等通用任务中同样展现出令人惊叹的完成度。这充分验证「让AI自主思考」比「教授AI思考」更具发展潜力。
梁文锋:十年磨一剑的AI追梦人
DeepSeek-R1的成功背后,站着一位执着于AI梦想的科学家创业者——梁文锋。这位1985年生于广东湛江的学者,从浙江大学电子信息工程专业开始,就展现出过人的学术天赋和技术远见。
硕士阶段师从项志宇教授期间,他突破性地将机器学习应用于量化金融领域。即便面临全球金融危机冲击,面对大疆等知名企业的创业邀约,他依然选择坚持AI赛道,先后创立雅克比投资和幻方科技。2024年,他决定全力投入通用人工智能研究,创办DeepSeek公司。
梁文锋独特的团队建设理念同样引人注目。他打造的研发团队不以资深专家为核心,反而大量启用应届毕业生和年轻研究者。「我们可能没有现成的顶尖人才,但我们能培养出顶尖人才」的理念,成为DeepSeek实现低成本高效益突破的关键因素。
随着研究成果的问世,DeepSeek-R1的意义已超越单一模型的技术价值。它不仅为AI发展提供了可负担的高效路径,更向世界证明:在算法创新的推动下,AI发展的主旋律正从「资本竞赛」转向「智能革命」。《自然》审稿人评价道,这项研究标志着大模型发展迈入了全新阶段。
可以预见,未来的AI竞争将更注重原创算法与智能涌现的研究突破。而DeepSeek-R1的成功,已然为这场范式转变奏响了前奏曲。
