游乐游手机版
首页/科技数码/文章详情

DeepSeek登全球顶刊《Nature》封面 创始人梁文锋首度回应技术争议

时间:2025-12-14 10:53
摘要:DeepSeek也首次回应“蒸馏”争议。 2025年9月17日,属于中国人工智能的又一个高光时刻来到了。DeepSeek-AI团队梁文锋及其同事在《自然》杂志发表了关于开源模型 DeepSe

DeepSeek首次公开回应「技术模仿」争议

2025年9月17日,中国人工智能领域迎来历史性突破时刻。DeepSeek-AI研究团队在《自然》杂志发表关于开源模型DeepSeek-R1的研究成果,该研究不仅登上当期杂志封面,更引发全球AI领域广泛关注。

研究团队通过实验证明,利用纯强化学习方法可显著提升大语言模型的推理能力,这种方法有效降低了对人工标注数据的依赖。与传统训练范式相比,创新方法训练的模型在数学解题、编程竞赛等STEM领域研究生级别的任务中展现出更卓越的性能。

针对业界的「蒸馏争议」,DeepSeek研究团队首次作出正式回应。在论文审稿过程中,研究团队向审稿人明确说明:R1模型并非通过复制已有AI模型的推理示例进行学习,而是和多数大语言模型一样,其基础模型训练数据来源于互联网自然存在的AI生成内容。

科研奇迹:29万美元创造的颠覆性突破

在全球AI竞赛中,高质量大模型的研发向来被视为「烧钱游戏」。据公开数据显示,OpenAI训练GPT-4花费超过1亿美元,Meta、谷歌等科技巨头的投入同样高达数千万美元。在这场资本角逐中,DeepSeek-R1却以惊人性价比改写了行业规则。

论文补充材料披露,DeepSeek-R1的推理训练成本仅29.4万美元,即使加上600万美元的基础模型训练投入,总成本仍远低于国际同行。这一突破不仅体现在经济性上,更在于其开创性的训练方法。

创新性的纯强化学习框架配合组相对策略优化(GRPO)算法,使模型能够仅依据答案正确性获得激励,而非机械模仿人工推理过程。令人惊讶的是,这种看似简单的训练机制,反而促使模型自主产生了自我反思、自我验证等高级认知行为,有时会生成上千个token来反复推理论证。

在美国数学邀请赛(AIME2024)测试中,采用自洽解码方法的DeepSeek-R1准确率达86.7%,显著超越人类平均水准。《自然》杂志评论指出,这证明AI完全可以通过强化学习自主发展复杂推理能力,而无需人工示范。

经过多轮优化后的DeepSeek-R1不仅在数学编程等硬核项目表现优异,在文本创作、开放问答等通用任务中同样展现出令人惊叹的完成度。这充分验证「让AI自主思考」比「教授AI思考」更具发展潜力。

梁文锋:十年磨一剑的AI追梦人

DeepSeek-R1的成功背后,站着一位执着于AI梦想的科学家创业者——梁文锋。这位1985年生于广东湛江的学者,从浙江大学电子信息工程专业开始,就展现出过人的学术天赋和技术远见。

硕士阶段师从项志宇教授期间,他突破性地将机器学习应用于量化金融领域。即便面临全球金融危机冲击,面对大疆等知名企业的创业邀约,他依然选择坚持AI赛道,先后创立雅克比投资和幻方科技。2024年,他决定全力投入通用人工智能研究,创办DeepSeek公司。

梁文锋独特的团队建设理念同样引人注目。他打造的研发团队不以资深专家为核心,反而大量启用应届毕业生和年轻研究者。「我们可能没有现成的顶尖人才,但我们能培养出顶尖人才」的理念,成为DeepSeek实现低成本高效益突破的关键因素。

随着研究成果的问世,DeepSeek-R1的意义已超越单一模型的技术价值。它不仅为AI发展提供了可负担的高效路径,更向世界证明:在算法创新的推动下,AI发展的主旋律正从「资本竞赛」转向「智能革命」。《自然》审稿人评价道,这项研究标志着大模型发展迈入了全新阶段。

可以预见,未来的AI竞争将更注重原创算法与智能涌现的研究突破。而DeepSeek-R1的成功,已然为这场范式转变奏响了前奏曲。

来源:https://36kr.com/p/3471852231792260
上一篇一加15预热 李杰:屏幕对标iPhone 17 Pro Max绰绰有余 下一篇ChatGPT用户数突破7亿:周消息量达180亿,女性与年轻用户活跃度高
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宫本茂亲签3DS XL拍卖价破两万美元
科技数码 · 2026-05-29

宫本茂亲签3DS XL拍卖价破两万美元

今天来说一件挺有意思的事:2015年任天堂世界锦标赛冠军约翰·戈德堡,近日将他当年夺冠时赢得的宫本茂亲笔签名版3DS XL掌机放上了拍卖平台。截至2026年5月29日,这台签名掌机的竞拍价已突破两万美元,并且价格还在持续攀升。戈德堡在社交媒体上发布声明表示,经过相当长时间的慎重考虑,他决定将这台对自

七彩虹隐星P16 Pro游戏本新配置仅售7799元
科技数码 · 2026-05-29

七彩虹隐星P16 Pro游戏本新配置仅售7799元

七彩虹近期推出隐星P16Pro游戏本新配置,售价7799元。其搭载酷睿i9-13900HX处理器与RTX5060显卡,配备16英寸2 5K高刷电竞屏及高效散热系统。存储组合为16GB内存与1TB固态硬盘,支持后续扩展。该配置主打高性能性价比,适合预算有限但追求强劲性能的游戏玩家与轻度创作者。

苹果iPhone Hikawa握把支架448元重新上架
科技数码 · 2026-05-29

苹果iPhone Hikawa握把支架448元重新上架

苹果公司重新上架了与艺术家贝利·桧川及PopSockets合作设计的iPhone专用握把支架。该配件采用磁吸设计,兼具握持与支架功能,旨在通过人性化设计降低握持负担,并提供三种配色可选,售价448元。

苹果体育应用扩展至170市场 为2026世界杯引入对阵图
科技数码 · 2026-05-29

苹果体育应用扩展至170市场 为2026世界杯引入对阵图

苹果体育应用新增覆盖90多个国家和地区,全球可用市场总数超过170个。为迎接2026年世界杯,应用加入了完整的赛程对阵图和可视化阵型卡片,方便用户追踪赛事与战术。同时,应用支持实时活动功能,可将比分固定在锁屏或表盘,并新增一键跳转至新闻的入口。目前该应用仍仅限iPhone用户使用。

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产
科技数码 · 2026-05-29

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产

据博主爆料,小米下一代自研玄戒芯片计划于今年6月正式进入量产阶段,此次将采用台积电3nm工艺。初代玄戒O1累计出货量已突破100万颗,量产验证十分扎实。新一代芯片的产能将显著提升,这意味着供货问题基本得到解决。 根据现有曝光信息,这颗迭代芯片极有可能命名为玄戒O3,首发搭载机型预计为小米MIX Fo