雷军千万年薪招募DeepSeek天才,小米AI论文突破新成果
10月16日消息,大家是否还记得去年底引发热议、登上热搜的“95后AI天才少女”罗福莉?
据媒体报道,小米与北京大学联合署名的论文近日发表在arXiv上,曾经被曝获得小米集团创始人兼CEO雷军以千万年薪招募的DeepSeek“天才少女”罗福莉,出现在这篇论文的通讯作者之列。
不过值得注意的是,论文作者中并未标注罗福莉属于小米大模型团队。
公开报道显示,罗福莉是95后,本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所计算语言学专业。
毕业后的罗福莉曾在阿里巴巴达摩院主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作,2024年入职DeepSeek,参与了MoE大模型DeepSeek-V2的研发。
去年底,据证券时报独家报道称,小米创始人雷军亲自出手“挖人”,以千万年薪的优厚条件,成功招揽了DeepSeek开源大模型DeepSeek-V2的关键开发者之一——罗福莉,让她领导小米的AI大模型团队。
这也使其冲上热搜,但双方至今都未公开声明是否正式入职小米。
不过,今年2月18日,罗福莉在朋友圈发文呼吁:“请互联网还我一片安安静静做事的氛围吧!几年前就说过我并非天才少女,神化一个人的结果就是捧得多高摔得多重!”
据了解,这篇论文提出了提升MoE模型强化学习训练的新方法Rollout Routing Replay(R3)。
当下,强化学习已成为提升大语言模型能力的关键方法。然而在MoE模型中,路由机制往往会引入不稳定性,甚至导致强化学习训练崩溃,但现有的引入重要性采样机制等并不能提升训练稳定性。
不同于此前采取诸如丢弃差异较大的数据之类的变通方法,这篇论文的研究人员希望通过解决路由分布也就是R3来根本性地解决这个问题。
相关攻略

10月18日消息,博主数码闲聊站表示,截至10月12日,小米17系列累计激活量在137万台左右,下周可以看到第一波母系竞品的对比销量了。有网友在评论区表示,我的小米17系列还没发货。资料显示,小米1

小米米家扫拖机器人 5C 现已开售,支持超远机械臂外扩贴边清洁,拥有水箱版、薄嵌上下水版本可选。水箱版定价 2199 元,今日活动价为 2059 元;下单领取 9 折优惠券:点此领取;以旧换新补贴

10月17日消息,小米公关部总经理王化今日发微博透露了关于小米车主受到网络攻击的进展情况。他表示,小米车主遭网络攻击专项援助信息收集表自9月26日发布以来,截止10月15日24:00,共计6032人

10月16日消息,据科创板日报报道,今日,在2025智能网联汽车大会上,小米集团创始人、董事长雷军表示,智能网联汽车的发展处于历史的机遇期,不是零和博弈,需要全行业的团结一致,共建共享智能网联汽车的

10月16日消息,还记得去年底引发热议、上热搜的“95后AI天才少女”罗福莉吗?据媒体报道,小米和北京大学联合署名的论文近日发表于arXiv,曾被曝获小米集团创始人兼CEO雷军以千万年薪招募的Dee
热门专题


热门推荐

10 月 18 日消息,据日本瑞穗证券的最新报告显示,苹果正在缩减其超薄机型 iPhone Air 的生产规模,原因是该机型的市场表现不如预期。尽管整个 iPhone 17 系列整体销售强劲,但

10月18日消息,台积电的2nm工艺N2节点即将进入量产阶段,未来的工艺也会进入埃米时代,A16工艺明年问世,再往后就是A14节点了。A14就是之前说的1 4nm工艺,相比过渡性质浓厚的A16工艺,

10月13日凌晨,成都市区某路段,一辆小米汽车因车主醉酒后超速行驶失控碰撞并起火。数位路过的救援者试图打开车门时,陷入“车门外拉不开、砸碎玻璃后车内也无法开启”的困境——全隐藏式电动门把手在断电后彻

抖音电商“双11”促销活动期间,平台搜索功能对销售额的拉动作用显著增强。数据显示,10月9日至14日期间,通过搜索渠道实现的销售额同比大幅增长74%,同时,店播销售额突破千万元的商家数量较去年同期激

当王玉举起手在小米17手机背屏上比出爱心时,屏幕里的熊猫玩偶同步做出相同动作,这个充满趣味性的互动场景,让她最终决定用5000元换掉使用两年的苹果手机。这款搭载 "妙享背屏 "设计的机型,正成为国产手机