首页 游戏 软件 资讯 排行榜 专题
首页
AI
任少卿详解Faster R-CNN:从学术突破到蔚来智驾创新实践

任少卿详解Faster R-CNN:从学术突破到蔚来智驾创新实践

热心网友
56
转载
2025-12-06

在人工智能研究领域,神经信息处理系统大会(NeurIPS)始终被誉为全球最具影响力的顶级学术会议,其重要地位如同奥斯卡之于电影界,是引领全球AI发展的年度风向标。近日,任少卿、何恺明、罗斯·吉什克(Ross Girshick)与孙剑凭借"Faster R-CNN"(快速区域卷积神经网络架构)荣膺2025年NeurIPS时间检验奖,这一消息迅速引发了行业广泛关注。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

NeurIPS时间检验奖旨在表彰那些经受住十年时间考验、对学科发展产生深远影响的奠基性研究成果。过去三年间,该奖项得主中不乏诺贝尔奖得主杰弗里·辛顿(Geoffrey Hinton)、图灵奖得主约书亚·本吉奥(Yoshua Bengio),以及OpenAI联合创始人兼首席科学家伊利亚·苏茨克维(Ilya Sutskever)等国际顶尖学者。

"Faster R-CNN"诞生于2015年,由中国学者任少卿、何恺明、孙剑主导,联合美国人工智能科学家罗斯·吉什克共同发表。这一创新网络架构显著提升了物体检测效率,增幅超过10倍,开创了端到端实时精准目标检测的全新模式。截至目前,相关论文已被学术引用超过9.8万次,作为第一作者的任少卿,其论文不仅是华人在该会议上发表的学术引用量最高之作,更是全球AI检测领域被引次数最多的里程碑式研究。

十余年来,"Faster R-CNN"的核心思想已深度融入人工智能基础设施,成为驱动自动驾驶、医疗影像、安防监控、工业检测、卫星遥感等关键领域发展的核心力量。任少卿与合作伙伴何恺明(现任MIT副教授)、孙剑(前旷视科技首席科学家)此前还共同发表过深度残差网络框架ResNet,该论文已成为21世纪全球被引次数最高的学术文献。

任少卿在回忆与导师孙剑的合作时表示,孙剑始终秉持"简约有效"的科研理念,这一理念在日常交流和论文评审中逐渐深入人心。他坦言自己撰写的第一篇论文,曾因不够简洁而最终放弃投稿。如今看来,那篇论文更多是在他人工作基础上的简单叠加,缺乏实质性创新突破。他强调,追求"简约有效"需要远见、品味和坚持,三者缺一不可。

谈及与何恺明的长期合作,任少卿表示二人共事时间最长,工作节奏紧凑而高效。每天早晨到公司后,他们会先查看实验结果,随后展开深入交流,从上午11点到12点用餐期间持续讨论,下午2点各自投入工作,5点再次会晤并共进晚餐。何恺明对研究问题的专注态度和创新精神给他留下了深刻印象,他认为何恺明善于把握研究方向与突破点,并投入大量时间构建思维框架。

在深度学习研究方向的选择上,任少卿透露团队会先进行可行性探索,在看到潜在价值后才会持续投入。选择这一方向的考量因素包括方法创新性、已有成果进展以及成果的泛化能力。他们认为,新研究方向的上限要高,且已取得的成果需真实可靠,而非仅在特定场景下有效。

"Faster R-CNN"成功解决了物体检测任务的端到端难题。传统物体检测分为两个步骤:先在图像上寻找可能的目标候选区域,再对这些区域进行分类识别。这一过程计算量巨大,效率较为低下。而"Faster R-CNN"通过单一网络直接输出结果,实现了实时检测,频率可达10Hz、20Hz乃至30Hz,显著提升了系统效率并降低了延迟,为产业应用带来了突破性进展。

2020年8月,任少卿加入蔚来,负责组建团队并推进自研芯片项目。当时,蔚来正面临L2与L4技术路径的争议,以及是否全面自研的战略抉择。最终,公司决定全力研发L2级自研芯片产品,同时支持L3和L4技术发展。在组建专业团队的同时,蔚来还与英伟达达成战略合作,率先量产了Orin芯片,成为全球首个量产该芯片的车企,并推出了全球最复杂的ADC(自动驾驶域控制器)系统架构。

作为新一代产品,Orin芯片需要应对散热、功耗、热稳定性等诸多工程挑战。蔚来团队在短时间内攻克了这些技术难题,并重构了AI、CPU及调度相关的工具链。任少卿表示,团队在定义芯片需求时,预见到Transformer技术的兴起,并在芯片设计中预留了高带宽和热备余能力,以支持更高级别的自动驾驶功能。

在自研芯片量产进程中,蔚来还构建了完整的工具链和软件体系,其中数据闭环系统是核心组成部分。任少卿认为,数据价值在于其针对特定模型的精准筛选能力,而这一过程需要消耗大量算力。为此,蔚来建立了灵活调用云端和车端算力的分布式系统,并在此基础上构建了大规模数据训练体系。公司还借鉴互联网行业的"A/B测试"方法,建立了智能调度计算资源的平台,实现了模型的高效迭代优化。

针对主动安全领域的技术挑战,蔚来通过"A/B测试"系统实现了每三天迭代一次的更新频率,显著降低了系统误报率。同时,蔚来还建立了面向量产车智能系统的自动化分析平台,通过大模型过滤无效信息,显著提升研发效率。

在自动驾驶技术演进过程中,端到端方案成为行业热议话题。任少卿指出,端到端是技术发展的必经阶段,但并未解决所有问题。他强调,语言模型以语言理解为核心,难以处理时空认知问题,而自动驾驶作为真实世界中的智能体,需要同时具备概念认知和时空感知能力。因此,蔚来从2024年开始投入研发世界模型,旨在构建系统的时空认知能力,解决长时序决策难题。

世界模型通过学习空间和时间信息,支持长时序场景推演,使自动驾驶系统能够一体化地处理复杂道路场景。任少卿表示,蔚来在小路场景处理能力的提升,正是世界模型应用的典型案例。在狭窄路段会车时,世界模型能够综合考虑空间和时间因素,做出更合理的决策判断。

来源:https://www.itbear.com.cn/html/2025-12/1041602.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查
web3.0
美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查

加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这

热心网友
04.08
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币
web3.0
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币

微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿

热心网友
04.08
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch
web3.0
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch

稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D

热心网友
04.08
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线
web3.0
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线

基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一

热心网友
04.08
PAAL代币如何参与治理?社区投票能决定哪些事项?
web3.0
PAAL代币如何参与治理?社区投票能决定哪些事项?

PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票

热心网友
04.08