第八届北京智源大会FlagOS挑战赛的颁奖典礼现场气氛热烈,多位获奖选手依次亮相,分别宣布了赛道一与赛道三的最终成绩。仪式结束后,智源研究院副院长林咏华与选手们展开交流,外界也因此更清晰地看到了这场技术巅峰对决的深层意义。
对话林咏华:揭秘FlagOS挑战赛背后的故事
谈及举办比赛的初衷,林咏华直言不讳:青年开发者正是推动行业发展的核心力量。正是基于这一理念,本次赛事特意面向学生群体开放。比赛的吸引力究竟有多强?一组数字足以说明——全球共有1127支队伍报名参赛,总奖金池高达200万元。
本季大赛共设三条赛道。林咏华特别强调了跨平台能力的战略价值:不同于那些仅专注于单一芯片的赛事,FlagOS体系支持在多种芯片上完成算子开发、大模型推理优化及数据标注,真正实现了计算壁垒的突破。
具体而言,赛道一紧密结合FlagOS体系下通用算子库FlagGems的实际应用场景,精心设计了20道梯度化赛题,覆盖从基础数学通用算子到前沿复杂场景算子,全方位考察选手在算子实现与性能优化方面的综合实力。


赛道二则充满挑战——参赛者需基于FlagOS专属的vllm-plugin-FL推理框架和FlagGems高性能算子库,对Qwen3-4B模型进行极限性能调优。并行策略、显存管理、计算内核及采样算法等关键技术都需综合运用,目标是在指定硬件上挖掘最大潜力。
赛道三聚焦数据标注能力。选手需借助Qwen3-4B模型,设计高效的ICL自动标注方案,在超长上下文范式下完成推理验证。


对于参赛者而言,开发门槛是大家最关心的问题之一,而FlagOS在这方面确实具备独特优势。两大核心技术功不可没:其一是跨芯片统一AI编译器,确保代码在7款不同芯片上稳定运行;其二是AI Agent与大模型组合,能为选手提供芯片架构、内存及线程优化方面的专业指导。借助这套体系,原本需要数月甚至一年才能掌握的芯片优化技能,如今可以更快上手。
林咏华最后还提出了一个关键期望:希望参赛选手在实战中切实感受FlagOS技术栈的优势,更期待获奖选手的优质算子成果能全部开源,反哺社区算子库的迭代升级。他呼吁更多人持续扎根开源领域,共同壮大国内开放计算的力量。
专访赛道一、三获奖选手:与赛事共同成长
赛程从2026年1月持续至6月,选手们在比赛中直面诸多技术挑战,也收获了宝贵的实战经验。
赛道三选手岑子翰
岑子翰回顾了赛道三的挑战:数据标注任务在问答与自然语言生成代码两大题型上要求极为严格。由于Qwen3-4B小模型无法调用外部检索工具,问答能力受到限制。团队后来通过指令注入、Top K采样及后处理机制,成功将模型性能提升约10%。此外,在超长上下文场景下,模型容易出现语义理解偏差和代码命名错乱的问题,他们借助多轮模型调用与质量审查机制,将代码生成任务的编译通过率提升至80%以上。
赛道一获奖选手Yunyi Liu
Yunyi Liu在赛道一同样遇到了不少困难。她分享道:“算子开发最大的难点在于边缘测试用例难以全面覆盖,而且算子功能实现门槛较高。再加上同台竞技,对算子性能与完成速度都提出了极高要求。我们只能先吃透主流框架的算子逻辑,再逐步进行迁移开发,同时精心设计测试用例以确保兼容性。”她也为后来者提供了宝贵建议:先熟悉赛题与官方规则,从简单任务入手,通过团队协作快速搭建方案并持续迭代。
赛道三获奖选手崔超
在评价FlagOS软件栈的使用体验时,多位选手一致给出积极反馈:开源友好、上手门槛低,保留了充足的优化空间,并支持一键部署。跨硬件迁移表现同样扎实,推理程序在不同芯片间切换顺畅,高负载下运行稳定。崔超更是直言,参与这次开发让他深度融入大型开源生态,跳出了单一技术研究的局限,拓宽了视野。他特别提醒其他选手:大模型训练推理的算力成本高昂,切忌盲目试错,必须提前设计消融实验,精准判断各项优化策略的实际效果。
写在最后
从现场氛围来看,无论是主办方还是参赛团队,对本次赛事的投入程度都令人印象深刻。FlagOS开放计算全球挑战赛S1赛季,不仅发掘出了一批深耕AI底层开发与模型优化的优秀技术人才,更重要的是,它以赛事为纽带,加速了FlagOS开源技术生态的普及与迭代,推动了算子开发、大模型推理、智能数据标注等核心技术在真实场景中的落地应用。
值得关注的是,未来赛事将继续依托智源研究院的技术积淀与FlagOS开源生态优势,持续聚焦前沿技术赛道,汇聚全球开发者力量,为中国开放计算产业的高质量发展持续赋能。正如林咏华在采访中所言:希望参赛团队掌握FlagOS完整技术栈,鼓励优质算子成果开源共享,也期待更多优秀开发者扎根开源社区;后续赛事将持续拓展合作伙伴,不断丰富算子资源,为AI产业的整体发展持续赋能。
