沐蜥芯生 SGLang MeetUp 圆满落幕开源共创探索AI推理落地新路径

时间：2026-06-12 15:50

沐曦联合龙蜥社区、SGLang社区举办的技术Meetup在京落幕，线上超65万人次观看。活动聚焦大模型推理落地难题，围绕PD分离、KVCache显存优化、多智能体架构等展开五场演讲及圆桌，展现SGLang生态从“能用”迈向“好用”的进展。

2025年6月6日，一场聚焦SGLang推理技术生态的线下Meetup在北京圆满落幕。本次活动由沐曦股份联合龙蜥社区、SGLang社区共同主办，吸引了线上超过65万人次观看，现场更有百余位技术专家与高校学子深度参与。简而言之，这是一场不设虚浮噱头的“硬核”技术聚会——与会者围绕大模型推理的实际落地难题与性能瓶颈展开了务实探讨。

今年OpenClaw发布的“龙虾”Agent智能体令整个行业为之振奋，随之而来的PD分离、长上下文KV Cache显存利用、多智能体推理等话题迅速成为热点。本次大会设置了五场主题演讲及一场圆桌对话，内容从底层可观测性延伸至上层多智能体架构，系统勾勒出SGLang推理生态的全景技术版图。

首位登台的是SGLang Core Maintainer童心源。他系统梳理了开源推理框架SGLang的发展脉络，重点剖析了PD分离、多模态模型支持、强化学习/后训练部署等关键技术节点的突破进展。从分享中可以看出，社区在该方向的推进速度远超外界预期。

（图：童心源）

龙蜥社区的苏峰与常怀鑫搭档登场，聚焦可观测性主题。他们回顾了SGLang Tracing的建设历程，并结合实际案例展示了如何利用AI Agent反向助力推理框架的性能优化——堪称“用魔法打败魔法”的典型实践。

下半场首个演讲来自阿里云高级技术专家马腾。他分享了基于Mooncake的多智能体推理架构优化方案，核心逻辑清晰：将KV Cache显存视为“物理工作记忆”，通过PD分离与全局共享显存池，实现“一次计算、全局复用”的记忆共享机制。

（图：马腾）

腾讯云高级工程师陈凯悦则将视角转向企业级落地。他详细拆解了HiCache与Mooncake如何从社区组件演变为内部推理集群的标准配置，并分享了在实际客户环境中踩过的坑与填过的坑，干货满满。

（图：陈凯悦）

压轴出场的是沐曦股份的杨鑫，他带来了沐曦GPU深度适配SGLang的全栈工程实践。从适配流程、自研MXMACA软件栈，到最新的模型兼容性与性能优化成果，信息密度极高，也让与会者清晰感受到国产算力在推理生态中的加速融入。

（图：杨鑫）

五场分享结束后，现场提问环节火花四溅。与会者关注的均为实际部署中遭遇的真实挑战，无任何空洞之谈。

圆桌对话：异构算力下的推理效能革命

圆桌环节由沐曦AI研究院院长李兆石主持，与童心源、常怀鑫、马腾、陈凯悦及沐曦SGLang核心开发者王志鹏围坐畅谈。话题自然聚焦“百万长上下文场景下的KV Cache管理”“AI存储需求演进方向”“云端与本地部署如何权衡”等硬核议题。几位嘉宾的观点碰撞精彩纷呈，每人均有一线实战积淀。

整场活动给人最深的感受是：SGLang生态正从“可用”加速迈向“好用”。龙蜥社区与沐曦等生态伙伴，正围绕推理性能优化、模型适配广度、开发者工具链等维度，一步一个脚印地将开源推理蓝图转化为切实可落地的工程方案。

最后，诚挚感谢所有参与分享的嘉宾，感谢沐曦与龙蜥社区的工作人员——范佳璐、陈韵霏、蒙秋红、刘瑞刚、李彪、章津楠、杨仰、蔡佳丽、金美琴、倪俊雄、袁艳桃等同事的全程组织与支持。同时特别鸣谢InfoQ、51CTO、阿里云AI生产力Live等媒体伙伴的助力，让这场技术盛会得以触达更广泛的受众。

附上本场活动的PPT与视频回放链接，方便各位复盘学习：

PPT下载链接：https://docs.openanolis.cn/document/detail/rpzigrnb

视频回放：https://openanolis.cn/video/#1644020499070544368

现场精彩集锦：

—— 完 ——

来源：https://developer.aliyun.com/article/1740909

上一篇龙蜥两大委员会5月工作会议 CXL SIG新项目开源推动AI Agent生态变革 下一篇技术岗不会Agent竞争力差距正拉大

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言在 Windows 本地开发环境中，直接安装 RabbitMQ 确实颇为周折：需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是，版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。相比之下，借助 Do

AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年，我们与福建制造企业合作较为频繁，发现一个非常突出的现象：超过80%的企业官网，产品参数仍然存放在PDF或图片中。AI爬虫？根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富，但在AI搜索这一全新战场上，它们几乎处于隐身状态。一、一个正在发生的行业变化 A

AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务，这一服务专为企业与开发者量身打造，定位为AI大模型订阅平台。通过引入Credits作为统一计量单位，将文本生成、图像生成等多模态AI能力纳入单一计费体系，同时无缝兼容主流AI编程工具及智能体（Agent）生态系统。其核心亮点包括：全

AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标，而位置数据的来源本质上是借助设备属性进行上传。换言之，若要让设备上报位置，您需先将其视为一个普通属性进行处理。 1）添加二维位置数据操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据，点击添加，将

AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年，阿里云服务器生态已高度成熟，形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网，还是运营电商平台、进行应用开发，基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维，系统梳理2026年最实用的操作要点，帮助你少走弯路，让网