首页 游戏 软件 资讯 排行榜 专题
首页
AI
SGLang与长上下文实践:高效后训框架与模型扩展探索

SGLang与长上下文实践:高效后训框架与模型扩展探索

热心网友
83
转载
2026-01-29



当人工智能加速由“对话”模式迈向“能办事”的智能体时代,LLM系统优化与落地的探索变得尤为关键,这更需要开发者们深度联结,共创实践经验。

因此,由SGLang社区、机器之心、张江孵化器联合举办的线下Meetup,将让屏幕前的贡献者走向台前,请幕后的优化者分享独家心得。2月6日下午,“SGLang上海Meetup”将在上海浦东·纳贤路800号1层正式举行。

本次Meetup将围绕SGLang技术路线、超长上下文扩展、RL后训练框架、扩散语言模型探索等议题展开深入探讨,并设有自由交流环节。诚邀开发者与研究同仁共赴现场,共同探寻LLM系统优化与落地实践的新可能。

最新日程

最新日程现已公开,扫描下方二维码即可完成报名,锁定您的专属参会资格。




活动嘉宾介绍

张柏舟:SGLang核心开发成员

个人简介:SGLang核心开发成员,主要负责开源大语言模型在不同Cuda硬件(Hopper, Blackwell)上的支持与优化工作。本科毕业于北京大学信息科学技术学院智能科学专业,硕士毕业于加州大学圣迭戈分校(UCSD)计算机专业,曾于英伟达、百度等公司实习。

郑锦煦:Omni-infer核心开发者

个人简介:华为技术专家,omni-infer社区核心贡献者,具备多年软件开发与系统设计经验,长期深耕高性能系统与工程落地。熟悉网络协议栈、分布式系统调度与资源管理、服务治理与性能诊断等。当前主要从事推理系统的方案设计与性能优化,围绕负载均衡、算子融合、KV Cache、并行策略、通信开销与端到端链路调优等方向提升吞吐、时延与稳定性,并参与推动相关能力与社区共建。

谢承兴:清华大学博士生、Slime核心开发者

个人简介:清华大学一年级博士生,是slime强化学习训练框架的核心开发者之一,具备一定的强化学习系统构建与Agentic RL训练经验。其研究方向聚焦于大语言模型强化学习、强化学习系统基础设施(RL Infra),以及如何提升大语言模型在真实世界复杂任务中的推理与决策能力。

蔡尚锟:SGLang核心开发者、Mooncake核心开发者

个人简介:阿里云飞天实验室研究员与技术专家,清华大学计算机科学与技术系博士。主要研究方向包括:高性能推理系统、大语言模型、分布式机器学习训练等。他是SGLang社区PD分离、流水线并行等特性的核心contributor和maintainer,同时也是Mooncake社区的核心成员与maintainer。

李泽寰:蚂蚁集团系统工程师、SGLang Contributor

个人简介:李泽寰毕业于上海交通大学,专注于AI Infra领域,从系统、引擎与模型层的综合视角进行优化。作为SGLang dLLM的核心贡献者,他运用该框架提升了dLLM模型的评测与强化学习效率。目前,蚂蚁集团正基于此框架构建对服务的低延迟推理能力。另外,作为机密计算领域开源项目Occlum的核心贡献者,实现了异步网络框架、运行时及SGX-SDK动态内存管理等关键模块,并推动Spark on Occlum项目落地,拥有扎实的系统开发经验。

扫码锁定线下席位



如在报名期间有任何不清楚的地方,请随时与活动小助手联系:136 6148 9516(同微信)。

来源:https://www.163.com/dy/article/KKF439F10511AQHO.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

大语言模型Excel表格处理应用指南
业界动态
大语言模型Excel表格处理应用指南

在当今数据驱动的商业环境中,高效处理Excel表格是提升工作效率的关键。许多人认为大语言模型仅能用于对话或文本创作,但实际上,它在数据解析与处理方面同样展现出强大能力。通过智能化地理解、清洗和分析表格数据,大语言模型不仅能实现流程自动化,更能显著减少人工错误,帮助您从海量数据中精准挖掘商业价值,实现

热心网友
05.17
传统NLP与LLM大语言模型的核心差异解析
业界动态
传统NLP与LLM大语言模型的核心差异解析

自然语言处理(NLP)领域经历了从“规则驱动”到“数据驱动”的范式转变。传统方法与当今主导的大语言模型(LLM)在底层逻辑和处理能力上存在本质区别,理解这些差异对于把握技术趋势至关重要。 一、传统NLP与大语言模型的核心处理模式对比 传统NLP技术高度依赖专家知识与人工工程。其核心路径是:由领域专家

热心网友
05.17
中小学如何运用大语言模型辅助课堂教学实践
业界动态
中小学如何运用大语言模型辅助课堂教学实践

随着人工智能技术深度融入社会各领域,教育行业也迎来了创新发展的关键机遇。以GPT、BERT等为代表的大语言模型,正逐步成为中小学教育场景中的智能增效工具。它并非替代教师,而是作为强大的辅助手段,为传统教学注入智能化动能,有效提升课堂效率、保障教学品质并推动个性化学习。那么,教育工作者应如何具体应用呢

热心网友
05.17
实在智能RPA如何优化大语言模型Prompt指令
业界动态
实在智能RPA如何优化大语言模型Prompt指令

在人工智能与自动化技术深度融合的当下,大语言模型的提示词(Prompt)已成为驱动智能决策与自动化执行的核心桥梁。简而言之,Prompt是用户向AI模型发出的指令或提问,它直接决定了模型的输出内容。当这项技术与实在智能RPA机器人深度结合时,其价值发生了质的飞跃——它不再仅仅停留在文本生成层面,而是

热心网友
05.17
大语言模型部署实战指南 七个关键步骤详解
AI
大语言模型部署实战指南 七个关键步骤详解

你精心构建了一项基于大语言模型(LLM)的功能,它在本地开发环境里运行得堪称完美:响应迅速、结果准确,一切流畅无比。然而,一旦将其部署到生产环境,情况往往急转直下。响应速度开始变慢,成本曲线悄然攀升,用户抛出的问题也超出了你的预期。模型给出的答案乍看之下似乎合理,却可能在不知不觉中破坏了实际的工作流

热心网友
05.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

生数科技Motubrain动作模型发布引领机器人智能新纪元
AI
生数科技Motubrain动作模型发布引领机器人智能新纪元

机器人行业迎来里程碑式突破。以视频生成模型Vidu著称的生数科技,正式发布了名为Motubrain的“世界动作模型”。这并非一次普通迭代,而是被定位为机器人的“物理大脑”,其核心目标在于:用一个统一的通用模型,彻底取代以往依赖多个专用系统拼凑而成的复杂架构。 正如其“一个大脑,无限可能”的口号所揭示

热心网友
05.18
xAI发布编程助手Grok Build 进军AI编程工具市场
AI
xAI发布编程助手Grok Build 进军AI编程工具市场

xAI正式进军AI编程智能体领域,于近日发布了专为软件工程与复杂编程任务设计的Grok Build。 简单来说,Grok Build是一款能在终端里直接跑起来的AI编程助手。它被定位为一个具备智能体能力的命令行工具,开发者用自然语言告诉它要做什么,它就能生成代码,甚至帮你搞定一系列编程和自动化任务。

热心网友
05.18
谷歌更新垃圾内容规则 AI操纵行为将被处罚
AI
谷歌更新垃圾内容规则 AI操纵行为将被处罚

近日,谷歌对其搜索引擎的核心规则进行了重要更新,此次调整直指当前备受关注的AI搜索领域。具体而言,谷歌在其垃圾内容政策中新增了明确条款,正式将“操纵AI搜索结果”的行为列为违规操作,划定了新的质量红线。 根据权威行业媒体Search Engine Land的报道,本次谷歌算法更新的核心在于,将任何企

热心网友
05.18
太浩湖能源危机:AI产业推高电价冲击硅谷后花园
AI
太浩湖能源危机:AI产业推高电价冲击硅谷后花园

硅谷的科技巨头们或许曾以为,自己已经远离了AI数据中心带来的电力压力——毕竟,高昂的地价和电费早就把大型数据中心项目“赶”到了别处。但现实总是出人意料,这场能源危机的涟漪,正悄然涌向他们心爱的度假后院。 没错,说的就是太浩湖。这个湾区精英们钟爱的避世天堂,如今正站在一场电力风暴的边缘。距离它必须找到

热心网友
05.18
高通新架构实现AI深度思考:推理更智能且大幅节省内存资源
AI
高通新架构实现AI深度思考:推理更智能且大幅节省内存资源

这项由高通AI研究院(Qualcomm AI Research)主导的创新研究于2026年5月正式发布,论文预印本编号为arXiv:2605 07721。 研究背景:当AI越想越费内存,我们该怎么办 设想一下,手机导航应用会在出发前规划好整条路线,而一位真正智慧的向导则会边走边思考,遇到路障时灵活应

热心网友
05.18