阶跃星辰开源Step 3.5 Flash,推理速度达每秒350token
2月2日,人工智能公司阶跃星辰正式发布了其最新的基座大模型 Step 3.5 Flash,并宣布开源。该模型旨在为开发者构建智能体提供底层支持,并针对规模化应用场景下的稳定性和响应速度进行了专门优化。

据介绍,Step 3.5 Flash 采用了稀疏混合专家架构,总参数量达到1960亿。通过特殊的技术设计,每个 Token 实际激活的参数约为110亿,在推理能力与运行效率之间取得了良好平衡。在最新公布的测试中,该模型在 LiveCodeBench V6 代码挑战、AIME 2025 数学竞赛等多项权威评测中展现了出色的竞争力,在单请求代码任务下,其最高推理速度可达每秒350个token。

在应用层面,该模型专为处理需要多步推理、复杂逻辑求解以及长时间运行的任务而设计。阶跃星辰表示,模型支持在 NVIDIA DGX Spark、Apple M3/M4 Max 以及 AMD AI Max+ 395 等主流个人工作站上进行本地部署,以满足用户对数据隐私和本地算力应用的需求。
目前,Step 3.5 Flash 模型已在 OpenRouter、GitHub 及阶跃星辰最新应用平台上架,面向开发者开放。与此同时,阶跃星辰宣布其下一代模型 Step 4 的训练工作已经正式启动。
相关攻略
4月2日,阿里巴巴正式推出新一代大语言模型Qwen3 6-Plus,并宣布其企业级AI旗舰应用“悟空”率先完成接入。此次升级不仅是模型的迭代,更标志着AI在企业级应用场景中的核心能力实现了关键性跨越。 官方信息显示,Qwen3 6-Plus在代码生成、智能体协作、逻辑推理及原生多模态理解等核心维度均
近日,开源技术圈迎来一项标志性进展:百度依托文心大模型打造的PaddleOCR项目,在GitHub上的Star数量突破73 3K,首次超越谷歌旗下长期占据领先地位的Tesseract OCR(73 2K)。这意味着,全球最受开发者欢迎的OCR开源项目正式易主,标志着大模型驱动的技术范式正在重塑行业格
Cursor的命运,悬在两个速度之间:AI自主编码成熟的速度,和Cursor自我蜕变的速度。 这家公司正处在一个奇特的矛盾点上:它依然蒸蒸日上,却又似乎正在走向绝望。关于这家一度是“Vibe Coding”代名词的明星公司,市场同时存在着两种截然相反却又似乎都能成立的观点。 数据描绘的是一幅烈火烹油
近日,Reddit上一则热帖引发了广泛关注。游戏开发商Beamable的首席执行官Jon Radoff,利用一个周末的时间,借助AI助手Claude,成功复活了自己19岁时开发的一款名为《未来往昔传奇》(Legends of Future Past)的MUD(多用户地下城)游戏。这款诞生于1992年
上周,Anthropic刚宣布对OpenClaw采取限制措施,这周,事情就发展到了一个新阶段——连OpenClaw项目的核心人物Peter Steinberger的个人账户也遭到了封禁。这场风波究竟会如何演变? 今天一早,OpenClaw创始人Peter Steinberger在社交平台X上发文确认
热门专题
热门推荐
团队为打造面向年轻群体的智能家居产品,设定了产品打磨、按时交付和预算控制三大目标。通过市场调研、供应链建设及用户测试取得关键进展,并针对沟通、进度与预算挑战,采取了定期同步、任务拆解和开支优化等措施。最终达成目标,积累了项目实战经验,为未来工作提供了参考。
项目X成功交付完整解决方案,攻克技术集成挑战,通过灰度发布控制风险。实现核心功能全覆盖,系统响应时间提升40%,稳定性达99 9%,并沉淀技术文档与流程。经验表明,深入需求沟通与分阶段上线至关重要,未来将持续优化协作与产品价值。
以太坊行情分析工具可提供涨跌预测与风险预警,辅助投资者进行决策。相关软件入口汇集了多种预测功能,旨在帮助用户把握市场动态。需注意投资存在风险,工具仅为参考。
现代职场中,文档处理效率至关重要。传统方式耗时费力,而AI技术能实现一键生成。WPSAI针对文档、PPT和表格提供智能解决方案,帮助用户快速生成初稿,从而聚焦内容深化。其功能便捷且个性化,支持多种文档类型,有效融入工作流程,系统性提升办公效率。
AI智能写作平台正推动内容生产向全链路智能化转型,显著提升效率与互动率。其核心价值覆盖选题、生成、优化、发布及追踪五大环节,通过工具实现各阶段效率飞跃。选型需考量功能完备性、生态整合度与数据安全性,并遵循从体验到迭代的实践路径,以构建高效智能的内容生产体系。





