SGLang与长上下文实践:高效后训框架与模型扩展探索

当人工智能加速由“对话”模式迈向“能办事”的智能体时代,LLM系统优化与落地的探索变得尤为关键,这更需要开发者们深度联结,共创实践经验。
因此,由SGLang社区、机器之心、张江孵化器联合举办的线下Meetup,将让屏幕前的贡献者走向台前,请幕后的优化者分享独家心得。2月6日下午,“SGLang上海Meetup”将在上海浦东·纳贤路800号1层正式举行。
本次Meetup将围绕SGLang技术路线、超长上下文扩展、RL后训练框架、扩散语言模型探索等议题展开深入探讨,并设有自由交流环节。诚邀开发者与研究同仁共赴现场,共同探寻LLM系统优化与落地实践的新可能。
最新日程
最新日程现已公开,扫描下方二维码即可完成报名,锁定您的专属参会资格。

活动嘉宾介绍
张柏舟:SGLang核心开发成员
个人简介:SGLang核心开发成员,主要负责开源大语言模型在不同Cuda硬件(Hopper, Blackwell)上的支持与优化工作。本科毕业于北京大学信息科学技术学院智能科学专业,硕士毕业于加州大学圣迭戈分校(UCSD)计算机专业,曾于英伟达、百度等公司实习。
郑锦煦:Omni-infer核心开发者
个人简介:华为技术专家,omni-infer社区核心贡献者,具备多年软件开发与系统设计经验,长期深耕高性能系统与工程落地。熟悉网络协议栈、分布式系统调度与资源管理、服务治理与性能诊断等。当前主要从事推理系统的方案设计与性能优化,围绕负载均衡、算子融合、KV Cache、并行策略、通信开销与端到端链路调优等方向提升吞吐、时延与稳定性,并参与推动相关能力与社区共建。
谢承兴:清华大学博士生、Slime核心开发者
个人简介:清华大学一年级博士生,是slime强化学习训练框架的核心开发者之一,具备一定的强化学习系统构建与Agentic RL训练经验。其研究方向聚焦于大语言模型强化学习、强化学习系统基础设施(RL Infra),以及如何提升大语言模型在真实世界复杂任务中的推理与决策能力。
蔡尚锟:SGLang核心开发者、Mooncake核心开发者
个人简介:阿里云飞天实验室研究员与技术专家,清华大学计算机科学与技术系博士。主要研究方向包括:高性能推理系统、大语言模型、分布式机器学习训练等。他是SGLang社区PD分离、流水线并行等特性的核心contributor和maintainer,同时也是Mooncake社区的核心成员与maintainer。
李泽寰:蚂蚁集团系统工程师、SGLang Contributor
个人简介:李泽寰毕业于上海交通大学,专注于AI Infra领域,从系统、引擎与模型层的综合视角进行优化。作为SGLang dLLM的核心贡献者,他运用该框架提升了dLLM模型的评测与强化学习效率。目前,蚂蚁集团正基于此框架构建对服务的低延迟推理能力。另外,作为机密计算领域开源项目Occlum的核心贡献者,实现了异步网络框架、运行时及SGX-SDK动态内存管理等关键模块,并推动Spark on Occlum项目落地,拥有扎实的系统开发经验。
扫码锁定线下席位
如在报名期间有任何不清楚的地方,请随时与活动小助手联系:136 6148 9516(同微信)。
相关攻略
在当今数据驱动的商业环境中,高效处理Excel表格是提升工作效率的关键。许多人认为大语言模型仅能用于对话或文本创作,但实际上,它在数据解析与处理方面同样展现出强大能力。通过智能化地理解、清洗和分析表格数据,大语言模型不仅能实现流程自动化,更能显著减少人工错误,帮助您从海量数据中精准挖掘商业价值,实现
自然语言处理(NLP)领域经历了从“规则驱动”到“数据驱动”的范式转变。传统方法与当今主导的大语言模型(LLM)在底层逻辑和处理能力上存在本质区别,理解这些差异对于把握技术趋势至关重要。 一、传统NLP与大语言模型的核心处理模式对比 传统NLP技术高度依赖专家知识与人工工程。其核心路径是:由领域专家
随着人工智能技术深度融入社会各领域,教育行业也迎来了创新发展的关键机遇。以GPT、BERT等为代表的大语言模型,正逐步成为中小学教育场景中的智能增效工具。它并非替代教师,而是作为强大的辅助手段,为传统教学注入智能化动能,有效提升课堂效率、保障教学品质并推动个性化学习。那么,教育工作者应如何具体应用呢
在人工智能与自动化技术深度融合的当下,大语言模型的提示词(Prompt)已成为驱动智能决策与自动化执行的核心桥梁。简而言之,Prompt是用户向AI模型发出的指令或提问,它直接决定了模型的输出内容。当这项技术与实在智能RPA机器人深度结合时,其价值发生了质的飞跃——它不再仅仅停留在文本生成层面,而是
你精心构建了一项基于大语言模型(LLM)的功能,它在本地开发环境里运行得堪称完美:响应迅速、结果准确,一切流畅无比。然而,一旦将其部署到生产环境,情况往往急转直下。响应速度开始变慢,成本曲线悄然攀升,用户抛出的问题也超出了你的预期。模型给出的答案乍看之下似乎合理,却可能在不知不觉中破坏了实际的工作流
热门专题
热门推荐
机器人行业迎来里程碑式突破。以视频生成模型Vidu著称的生数科技,正式发布了名为Motubrain的“世界动作模型”。这并非一次普通迭代,而是被定位为机器人的“物理大脑”,其核心目标在于:用一个统一的通用模型,彻底取代以往依赖多个专用系统拼凑而成的复杂架构。 正如其“一个大脑,无限可能”的口号所揭示
xAI正式进军AI编程智能体领域,于近日发布了专为软件工程与复杂编程任务设计的Grok Build。 简单来说,Grok Build是一款能在终端里直接跑起来的AI编程助手。它被定位为一个具备智能体能力的命令行工具,开发者用自然语言告诉它要做什么,它就能生成代码,甚至帮你搞定一系列编程和自动化任务。
近日,谷歌对其搜索引擎的核心规则进行了重要更新,此次调整直指当前备受关注的AI搜索领域。具体而言,谷歌在其垃圾内容政策中新增了明确条款,正式将“操纵AI搜索结果”的行为列为违规操作,划定了新的质量红线。 根据权威行业媒体Search Engine Land的报道,本次谷歌算法更新的核心在于,将任何企
硅谷的科技巨头们或许曾以为,自己已经远离了AI数据中心带来的电力压力——毕竟,高昂的地价和电费早就把大型数据中心项目“赶”到了别处。但现实总是出人意料,这场能源危机的涟漪,正悄然涌向他们心爱的度假后院。 没错,说的就是太浩湖。这个湾区精英们钟爱的避世天堂,如今正站在一场电力风暴的边缘。距离它必须找到
这项由高通AI研究院(Qualcomm AI Research)主导的创新研究于2026年5月正式发布,论文预印本编号为arXiv:2605 07721。 研究背景:当AI越想越费内存,我们该怎么办 设想一下,手机导航应用会在出发前规划好整条路线,而一位真正智慧的向导则会边走边思考,遇到路障时灵活应





