游乐游手机版
首页/AI教程/文章详情

沐蜥芯生 SGLang MeetUp 圆满落幕 开源共创探索AI推理落地新路径

时间:2026-06-12 15:50
沐曦联合龙蜥社区、SGLang社区举办的技术Meetup在京落幕,线上超65万人次观看。活动聚焦大模型推理落地难题,围绕PD分离、KVCache显存优化、多智能体架构等展开五场演讲及圆桌,展现SGLang生态从“能用”迈向“好用”的进展。

2025年6月6日,一场聚焦SGLang推理技术生态的线下Meetup在北京圆满落幕。本次活动由沐曦股份联合龙蜥社区、SGLang社区共同主办,吸引了线上超过65万人次观看,现场更有百余位技术专家与高校学子深度参与。简而言之,这是一场不设虚浮噱头的“硬核”技术聚会——与会者围绕大模型推理的实际落地难题与性能瓶颈展开了务实探讨。

今年OpenClaw发布的“龙虾”Agent智能体令整个行业为之振奋,随之而来的PD分离、长上下文KV Cache显存利用、多智能体推理等话题迅速成为热点。本次大会设置了五场主题演讲及一场圆桌对话,内容从底层可观测性延伸至上层多智能体架构,系统勾勒出SGLang推理生态的全景技术版图。

首位登台的是SGLang Core Maintainer童心源。他系统梳理了开源推理框架SGLang的发展脉络,重点剖析了PD分离、多模态模型支持、强化学习/后训练部署等关键技术节点的突破进展。从分享中可以看出,社区在该方向的推进速度远超外界预期。

(图:童心源)

龙蜥社区的苏峰与常怀鑫搭档登场,聚焦可观测性主题。他们回顾了SGLang Tracing的建设历程,并结合实际案例展示了如何利用AI Agent反向助力推理框架的性能优化——堪称“用魔法打败魔法”的典型实践。

下半场首个演讲来自阿里云高级技术专家马腾。他分享了基于Mooncake的多智能体推理架构优化方案,核心逻辑清晰:将KV Cache显存视为“物理工作记忆”,通过PD分离与全局共享显存池,实现“一次计算、全局复用”的记忆共享机制。

(图:马腾)

腾讯云高级工程师陈凯悦则将视角转向企业级落地。他详细拆解了HiCache与Mooncake如何从社区组件演变为内部推理集群的标准配置,并分享了在实际客户环境中踩过的坑与填过的坑,干货满满。

(图:陈凯悦)

压轴出场的是沐曦股份的杨鑫,他带来了沐曦GPU深度适配SGLang的全栈工程实践。从适配流程、自研MXMACA软件栈,到最新的模型兼容性与性能优化成果,信息密度极高,也让与会者清晰感受到国产算力在推理生态中的加速融入。

(图:杨鑫)

五场分享结束后,现场提问环节火花四溅。与会者关注的均为实际部署中遭遇的真实挑战,无任何空洞之谈。

圆桌对话:异构算力下的推理效能革命

圆桌环节由沐曦AI研究院院长李兆石主持,与童心源、常怀鑫、马腾、陈凯悦及沐曦SGLang核心开发者王志鹏围坐畅谈。话题自然聚焦“百万长上下文场景下的KV Cache管理”“AI存储需求演进方向”“云端与本地部署如何权衡”等硬核议题。几位嘉宾的观点碰撞精彩纷呈,每人均有一线实战积淀。

整场活动给人最深的感受是:SGLang生态正从“可用”加速迈向“好用”。龙蜥社区与沐曦等生态伙伴,正围绕推理性能优化、模型适配广度、开发者工具链等维度,一步一个脚印地将开源推理蓝图转化为切实可落地的工程方案。

最后,诚挚感谢所有参与分享的嘉宾,感谢沐曦与龙蜥社区的工作人员——范佳璐、陈韵霏、蒙秋红、刘瑞刚、李彪、章津楠、杨仰、蔡佳丽、金美琴、倪俊雄、袁艳桃等同事的全程组织与支持。同时特别鸣谢InfoQ、51CTO、阿里云AI生产力Live等媒体伙伴的助力,让这场技术盛会得以触达更广泛的受众。

附上本场活动的PPT与视频回放链接,方便各位复盘学习:

PPT下载链接:https://docs.openanolis.cn/document/detail/rpzigrnb

视频回放:https://openanolis.cn/video/#1644020499070544368

现场精彩集锦:

—— 完 ——

来源:https://developer.aliyun.com/article/1740909
上一篇龙蜥两大委员会5月工作会议 CXL SIG新项目开源推动AI Agent生态变革 下一篇技术岗不会Agent竞争力差距正拉大
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Windows Docker Desktop RabbitMQ生产级部署完整指南
AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言 在 Windows 本地开发环境中,直接安装 RabbitMQ 确实颇为周折:需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是,版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。 相比之下,借助 Do

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践
AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年,我们与福建制造企业合作较为频繁,发现一个非常突出的现象:超过80%的企业官网,产品参数仍然存放在PDF或图片中。AI爬虫?根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富,但在AI搜索这一全新战场上,它们几乎处于隐身状态。 一、一个正在发生的行业变化 A

阿里云Token Plan团队版功能价格与省钱购买指南
AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务,这一服务专为企业与开发者量身打造,定位为AI大模型订阅平台。通过引入Credits作为统一计量单位,将文本生成、图像生成等多模态AI能力纳入单一计费体系,同时无缝兼容主流AI编程工具及智能体(Agent)生态系统。其核心亮点包括:全

阿里云物联网.NET Core客户端位置信息上报
AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标,而位置数据的来源本质上是借助设备属性进行上传。换言之,若要让设备上报位置,您需先将其视为一个普通属性进行处理。 1)添加二维位置数据 操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据,点击添加,将

年阿里云服务器选型配置与网站部署全攻略
AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年,阿里云服务器生态已高度成熟,形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网,还是运营电商平台、进行应用开发,基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维,系统梳理2026年最实用的操作要点,帮助你少走弯路,让网