金山云星流平台现已正式推出 Xiaomi MiMo-V2-Flash 模型,用户目前可直接通过平台 API 服务调用该模型进行推理。依托金山云强大的算力支撑与深度优化的推理层,开发者与企业用户能够更便捷地构建智能应用,享受低延迟、高稳定性的模型推理体验。
以下是在金山云星流平台调用 Xiaomi MiMo-V2-Flash 的操作流程:
第一步
登录金山云星流平台控制台并开通 API 服务

据介绍,Xiaomi MiMo-V2-Flash 是小米为追求极致推理效率而自研的总参数量达 309B(激活参数量 15B)的 MoE 模型。该模型通过引入 Hybrid 注意力架构创新与多层 MTP 推理加速技术,在多项 Agent 评测基准中表现突出,位列全球开源模型 Top 2;其代码能力超越所有开源模型,比肩闭源标杆 Claude 4.5 Sonnet,而推理成本仅为后者的 2.5% 左右,且生成速度提升至 2 倍。
Xiaomi MiMo-V2-Flash 的接入,进一步丰富了金山云星流平台的模型生态。未来,平台将持续引入更多优质模型,为各领域的数智化升级提供助力。
