硅基流动大模型平台迎来重大升级——蚂蚁集团旗下百灵团队打造的Ling-flash-2.0语言模型正式入驻,成为平台第130个开放模型。这款基于混合专家系统(MoE)架构的全新模型,凭借其100亿总参数和仅6.1亿激活参数的轻量化设计,在保持高效运算的同时,达到了40亿参数密集模型的性能标准。

技术亮点与性能突破
研发团队通过对20TB高质量语料的深度预训练,结合多轮强化学习和精细化调优,使Ling-flash-2.0在复杂逻辑推理、代码编写及前端开发等领域展现卓越能力。其128K超长上下文窗口可轻松处理300页文档内容,为长篇文本分析和持续对话提供强劲支持。在实际应用中,得益于1/32激活比例的MoE架构优化与H20硬件加持,模型响应速度突破每秒200个Token,较传统36B密集模型提速超过3倍。
极具竞争力的定价策略
平台延续普惠定价原则:输入Token每百万仅收1元,输出Token收费4元/百万。针对新用户推出专属优惠——国内开发者可获得14元体验金,国际用户则享1美元等值额度。这样的定价方案极大降低了人工智能技术的尝试门槛,特别适合创业团队和小微企业进行技术验证。
实测性能优势明显
在权威测试中,Ling-flash-2.0展现出显著优势。与同规格的Qwen3-32B-Non-Thinking、Seed-OSS-36B-Instruct等密集模型,以及Hunyuan-A13B-Instruct、GPT-OSS-120B/low等MoE架构模型对比,本模型在数学解题和代码纠错任务中准确率提升12%-18%。在创意文本生成方面,其语言的连贯性和内容密度指标也领先多数同类产品。
一站式AI开发体验
硅基流动平台现已整合文本、图像、音视频等多领域AI能力。开发者可以通过统一API自由组合不同模型,实现跨模态任务的无缝衔接。平台内置的模型比对工具支持实时性能评估,帮助用户快速找到最适合业务需求的解决方案。
技术架构创新
Ling-flash-2.0的核心创新包括:动态专家路由机制实现模块高效协同,渐进式激活策略平衡算力与性能,sparse注意力设计优化资源利用率。这些突破使模型在低延迟的同时,具备处理高阶逻辑任务的能力。
接入方式
开发者可通过以下入口体验新模型:
国内通道:https://cloud.siliconflow.cn/models
国际通道:https://cloud.siliconflow.com/models
平台提供完整的技术文档、在线调试工具和开发者社区支持,助力AI应用快速落地。
