游乐游手机版
首页/科技数码/文章详情

DeepSeek登全球顶刊《Nature》封面 创始人梁文锋首度回应技术争议

时间:2025-12-14 10:53
摘要:DeepSeek也首次回应“蒸馏”争议。 2025年9月17日,属于中国人工智能的又一个高光时刻来到了。DeepSeek-AI团队梁文锋及其同事在《自然》杂志发表了关于开源模型 DeepSe

DeepSeek首次公开回应「技术模仿」争议

2025年9月17日,中国人工智能领域迎来历史性突破时刻。DeepSeek-AI研究团队在《自然》杂志发表关于开源模型DeepSeek-R1的研究成果,该研究不仅登上当期杂志封面,更引发全球AI领域广泛关注。

研究团队通过实验证明,利用纯强化学习方法可显著提升大语言模型的推理能力,这种方法有效降低了对人工标注数据的依赖。与传统训练范式相比,创新方法训练的模型在数学解题、编程竞赛等STEM领域研究生级别的任务中展现出更卓越的性能。

针对业界的「蒸馏争议」,DeepSeek研究团队首次作出正式回应。在论文审稿过程中,研究团队向审稿人明确说明:R1模型并非通过复制已有AI模型的推理示例进行学习,而是和多数大语言模型一样,其基础模型训练数据来源于互联网自然存在的AI生成内容。

科研奇迹:29万美元创造的颠覆性突破

在全球AI竞赛中,高质量大模型的研发向来被视为「烧钱游戏」。据公开数据显示,OpenAI训练GPT-4花费超过1亿美元,Meta、谷歌等科技巨头的投入同样高达数千万美元。在这场资本角逐中,DeepSeek-R1却以惊人性价比改写了行业规则。

论文补充材料披露,DeepSeek-R1的推理训练成本仅29.4万美元,即使加上600万美元的基础模型训练投入,总成本仍远低于国际同行。这一突破不仅体现在经济性上,更在于其开创性的训练方法。

创新性的纯强化学习框架配合组相对策略优化(GRPO)算法,使模型能够仅依据答案正确性获得激励,而非机械模仿人工推理过程。令人惊讶的是,这种看似简单的训练机制,反而促使模型自主产生了自我反思、自我验证等高级认知行为,有时会生成上千个token来反复推理论证。

在美国数学邀请赛(AIME2024)测试中,采用自洽解码方法的DeepSeek-R1准确率达86.7%,显著超越人类平均水准。《自然》杂志评论指出,这证明AI完全可以通过强化学习自主发展复杂推理能力,而无需人工示范。

经过多轮优化后的DeepSeek-R1不仅在数学编程等硬核项目表现优异,在文本创作、开放问答等通用任务中同样展现出令人惊叹的完成度。这充分验证「让AI自主思考」比「教授AI思考」更具发展潜力。

梁文锋:十年磨一剑的AI追梦人

DeepSeek-R1的成功背后,站着一位执着于AI梦想的科学家创业者——梁文锋。这位1985年生于广东湛江的学者,从浙江大学电子信息工程专业开始,就展现出过人的学术天赋和技术远见。

硕士阶段师从项志宇教授期间,他突破性地将机器学习应用于量化金融领域。即便面临全球金融危机冲击,面对大疆等知名企业的创业邀约,他依然选择坚持AI赛道,先后创立雅克比投资和幻方科技。2024年,他决定全力投入通用人工智能研究,创办DeepSeek公司。

梁文锋独特的团队建设理念同样引人注目。他打造的研发团队不以资深专家为核心,反而大量启用应届毕业生和年轻研究者。「我们可能没有现成的顶尖人才,但我们能培养出顶尖人才」的理念,成为DeepSeek实现低成本高效益突破的关键因素。

随着研究成果的问世,DeepSeek-R1的意义已超越单一模型的技术价值。它不仅为AI发展提供了可负担的高效路径,更向世界证明:在算法创新的推动下,AI发展的主旋律正从「资本竞赛」转向「智能革命」。《自然》审稿人评价道,这项研究标志着大模型发展迈入了全新阶段。

可以预见,未来的AI竞争将更注重原创算法与智能涌现的研究突破。而DeepSeek-R1的成功,已然为这场范式转变奏响了前奏曲。

来源:https://36kr.com/p/3471852231792260
上一篇一加15预热 李杰:屏幕对标iPhone 17 Pro Max绰绰有余 下一篇ChatGPT用户数突破7亿:周消息量达180亿,女性与年轻用户活跃度高
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5

电动汽车电池新国标7月实施热失控不起火不爆炸
科技数码 · 2026-07-01

电动汽车电池新国标7月实施热失控不起火不爆炸

自2026年7月1日起,两项关乎电动汽车安全的核心强制性国家标准将正式实施,为行业加装“安全锁”——《电动汽车安全要求》(GB 18384-2025)与《电动汽车用动力蓄电池安全要求》(GB 38031-2025)同步落地。此次标准升级,从整车架构与电池系统两大维度,精准填补了近年来多起事故暴露出的