首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
前Kimi训练负责人宋鸿涌投身通用机器人基座模型创业

前Kimi训练负责人宋鸿涌投身通用机器人基座模型创业

热心网友
27
转载
2026-05-26

大模型与强化学习领域的顶尖专家Flood Sung,正式将其前沿技术积累拓展至机器人产业。据AI科技评论独家消息,原月之暗面后训练与强化学习负责人宋鸿涌(Flood Sung)已于2025年12月离任,并创立了专注于通用人形机器人的新公司——「北京十六号机器人科技有限公司」(XVI Robotics)。该公司的核心使命清晰:致力于研发与构建面向通用人形机器人的基座大模型。

企查查公开信息显示,北京十六号机器人科技有限公司成立于2025年12月。其官方定位旨在构建大规模机器人基座模型,核心目标是赋能人形机器人,使其具备理解复杂指令、进行逻辑推理并在真实物理世界中自主执行任务的能力。

从游戏AI到大模型:一位强化学习专家的进阶之路

宋鸿涌,业界更熟悉其英文名Flood Sung,在人工智能学术界与开发者社区中享有极高声誉,被视为国内强化学习(RL)领域最早进行系统性研究与布道的先驱之一。回顾其职业发展路径,他先后深耕于游戏AI、大模型后训练以及如今的机器人三大前沿方向,这条独特的轨迹恰好为其进军具身智能与机器人领域奠定了坚实的技术逻辑。

在学术研究方面,宋鸿涌在少样本学习(Few-Shot Learning)领域贡献卓著。其于2018年在CVPR上发表的里程碑论文《Learning to Compare: Relation Network for Few-Shot Learning》,引用量已突破6000次,奠定了该领域的重要基础。此外,他在GitHub上维护的开源项目「Deep-Learning-Papers-Reading-Roadmap」,收获了超过3.9万颗星标,长期是国内AI学习与进阶最具影响力的开源指南之一。

在工程与实践层面,他的经验同样深厚。2020年至2022年,他在字节跳动AI Lab担任研究科学家,深度参与了游戏AI中复杂的多智能体强化学习(MARL)项目,曾主导3D-MOBA类游戏中多智能体AI机器人的算法研发与工程落地。2023年,他加入月之暗面,担任后训练与强化学习负责人,全面主导了Kimi K1.5、K2、K2.5等系列核心模型的强化学习训练体系构建,是推动Kimi大模型持续迭代与能力跃升的关键人物。

攻坚核心赛道:通用人形机器人基座模型

宋鸿涌此次创业所选择的方向,无疑是当前具身智能与机器人领域技术壁垒最高、竞争最为激烈、同时也最受资本关注的核心赛道。

“通用人形机器人基座模型”的本质,在于将大语言模型在数字领域所展现出的强大通用认知与推理能力,有效迁移至物理世界的机器人运动控制中。其终极目标是让人形机器人能够在开放、未知的真实场景中,仅通过自然语言指令,就能理解任务、感知动态环境并自主规划出安全、合理的动作序列,而无需为每一个具体任务进行海量的数据标注与训练。

这一技术路径所面临的核心挑战——例如,如何在稀疏、延迟的环境奖励信号下实现模型的自我优化与泛化——恰恰与宋鸿涌在月之暗面所精通的RLHF(基于人类反馈的强化学习)与大模型后训练技术一脉相承。这或许正是他选择此时入局机器人赛道的内在技术逻辑与信心所在。

目前,XVI Robotics团队仍处于早期筹建与研发阶段。据悉,公司已成功获得知名投资机构的种子轮融资支持。关于具体的产品路线图、技术细节及商业化策略,公司尚未对外详细披露,后续发展值得业界持续关注。

来源:https://www.aitntnews.com/newDetail.html?newId=25378
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

前Kimi训练负责人宋鸿涌投身通用机器人基座模型创业
AI资讯
前Kimi训练负责人宋鸿涌投身通用机器人基座模型创业

资深专家宋鸿涌离职创业,成立北京十六号机器人科技有限公司,聚焦通用人形机器人基座模型研发。其学术与工程背景涵盖强化学习、大模型后训练,技术路径旨在将大语言模型推理能力迁移至机器人物理控制,应对场景泛化等核心挑战。公司已获种子轮融资,处于早期阶段。

热心网友
05.26
Kimi K2系列API已停用请升级至新版模型
AI资讯
Kimi K2系列API已停用请升级至新版模型

技术迭代的步伐从未停歇。5月25日,月之暗面Kimi官方正式发布公告,宣布Kimi K2系列模型的API服务将全面终止维护与支持。这标志着在开源大模型领域曾引发广泛关注的K2系列,已圆满完成了其阶段性的技术使命,正式步入历史。 对于目前仍在集成和使用这些API的开发者与用户而言,当务之急是尽快规划并

热心网友
05.26
Kimi长文本分析教程:高效提炼线上课程核心要点
AI资讯
Kimi长文本分析教程:高效提炼线上课程核心要点

面对线上课程海量资料,可利用Kimi长文本分析功能高效提炼核心。上传文档后启用原生解析确保结构准确,通过角色限定指令提取课程骨架,聚焦目标与知识模块。多章节内容可分段锚定以维持脉络,或通过关键词反向定位考核重点。若无讲义,可将视频字幕转为文本后生成结构化摘要。

热心网友
05.26
Kimi流程图制作教程 3分钟快速入门指南
AI资讯
Kimi流程图制作教程 3分钟快速入门指南

Kimi可根据指令生成流程图代码,支持Mermaid语法。将代码复制到boardmix等工具后,可编辑样式、导出PNG或PDF,并生成分享链接实现在线协作编辑。

热心网友
05.26
单GPU工作站如何运行万亿参数Kimi模型 傲腾内存突破显存限制
业界动态
单GPU工作站如何运行万亿参数Kimi模型 傲腾内存突破显存限制

近期,技术社区的一项突破性实践引发了广泛讨论:有开发者在一台仅配备单GPU的工作站上,成功部署并运行了参数规模高达一万亿的Kimi K2 5大语言模型,实测推理速度稳定在每秒4个Token左右。这听起来似乎难以置信,因为部署万亿参数模型通常需要庞大的分布式计算集群。那么,这一技术壮举是如何实现的呢?

热心网友
05.25

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

索拉纳现货与合约交易指南:如何选择适合你的投资策略
web3.0
索拉纳现货与合约交易指南:如何选择适合你的投资策略

现货交易直接买卖资产,适合长期持有与新手。合约交易采用杠杆,支持做多做空,收益与风险极高。投资者应根据自身风险承受能力与投资目标,谨慎评估并选择适合的交易方式。

热心网友
05.26
中国占全球人形机器人九成出货量或成下个电动车产业
业界动态
中国占全球人形机器人九成出货量或成下个电动车产业

摩根士丹利报告指出,中国在人形机器人领域已处全球领先地位,预计2025年全球出货量的约90%将来自中国。该产业正处爆发前夜,有望成为驱动中国制造与出口增长的新引擎。凭借规模化制造与供应链优势,中国正推动机器人在仓储、巡检等服务场景落地,预计2030年运行规模将达26万台,开启生产力新。

热心网友
05.26
荣耀600系列京东现货发售 心动购物季抢先下单优先发货
业界动态
荣耀600系列京东现货发售 心动购物季抢先下单优先发货

荣耀600系列于5月25日发布,含元气版、超级版及Pro三款机型,起售价自2294 15元至3399元。新机采用全新“幸运星”设计及3D星河工艺,搭载不同旗舰处理器,全系配备2亿像素主摄与专业防抖,Pro版支持全焦段4KLive直出。京东平台已开启预售,参与“先人一步”计划可享优先发货及多重优惠。

热心网友
05.26
2026年中高端电视选购指南 三星退市后实测推荐
业界动态
2026年中高端电视选购指南 三星退市后实测推荐

三星逐步退出中国市场后,消费者面临重新选择。当前中高端电视市场以MiniLED和大屏为主流。东芝Z7PRO凭借RGBMiniLED和火箭炮音质,提供卓越影音体验;R700则侧重高刷与游戏优化,适合影游用户。飞利浦9599的流光溢彩功能增强沉浸感,长虹85Q10K以智能交互和实用性见长。建议根据自身核心需求选择最合适的产品。

热心网友
05.26
百元价位动态血糖仪哪款性价比最高
业界动态
百元价位动态血糖仪哪款性价比最高

动态血糖仪进入百元市场,挑选需综合考量技术参数。精准度核心指标MARD值普遍低于10%,国产品牌表现优异。数据采样频率存在分钟级差异,高频监测能更细腻捕捉血糖波动。部分产品采用先进酶技术提升抗干扰能力。佩戴舒适性、操作简便性及监测时长也影响长期体验,需根据个人控糖需求权衡。

热心网友
05.26