首页 游戏 软件 资讯 排行榜 专题
首页
AI
讯飞星火X2硬核亮相:行业深度升级,神仙打架+1

讯飞星火X2硬核亮相:行业深度升级,神仙打架+1

热心网友
41
转载
2026-02-12

鹭羽 发自 凹非寺
量子位 | 公众号 QbitAI

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

今天,国产大模型再次迎来硬核进阶!

科大讯飞小年放出推理王炸——星火大模型X2。

什么概念呢?从星火X1.5到星火X2,仅仅间隔3个月,推理性能直接飙升50%~

不仅快,而且猛。更重要的是,完全基于国产算力。



一方面,模型通用能力突出,Benchmark评测稳居行业一流水平,即使是和GPT-5.2、Gemini-3-Pro这些国际顶尖模型同台竞技也毫不逊色。

尤其是在数学计算、逻辑推理等核心能力上表现亮眼;同时130多种语言综合能力依旧稳稳在线,继续保持“国家队”水准。



另一方面,星火X2将升级的重点放在了场景落地上。

依靠深度优化的算法、高质量垂域数据和行业专家的参与,三位一体推动行业大模型更进一步,为各行各业提供更精准、更具实操性的支持。

正如科大讯飞董事长刘庆峰在1024开发者节所说——做更懂你的AI,满血归来的星火X2现在用通用底座+行业专才双轮驱动,再次印证了其在国产大模型赛道的实践底气。

通用能力全面升级

星火大模型作为讯飞AI架构的底层基石,按照惯例,每一次升级,都有着显著的能力跃迁。

这一次更甚:直接将深度推理训练效率再度提升50%。

众所周知,随着Scaling Laws边际效益递减,越到后期,大模型性能提升就越难。即使是1%的能力跃迁,都意味着算力和算法的指数级倍增。

而在行业普遍面临增长瓶颈的当下,星火X2能够实现50%的性能跃迁实属不易。

其背后释放的信号,比数字本身更值得深思,这透露出科大讯飞在模型核心架构和技术上有了更深层次的突破。

具体先看核心能力对比。

横向对比来看,星火X2 Thinking的各项评分已经稳居国产第一梯队,在多个维度上也与GPT-5.2 (xhigh)和Gemini-3-Pro非常接近。

其中,在多语言和翻译能力上显著优于友商模型,在数学和逻辑推理上也紧随GPT和Gemini其后。



再看星火X2在高难度基准测试中的表现,可以说含金量杠杠的。

比如在AIME 2025测试中,星火X2斩获95.7分,仅次于GPT-5.2 (xhigh),展现出其处理竞赛级数学的顶尖能力。

在MMLU Pro里,星火X2的87.3分不仅在国产模型中夺冠,且与GPT-5.2持平,说明其知识广度和深度已达国际一流水准。

在代表未来方向的智能体维度上,星火X2也是再度领跑国产模型,验证了它在理解复杂指令和调用工具方面的进阶。



总的来说,星火X2在数据上的亮眼表现,不仅彰显了讯飞在数学和逻辑推理领域的领先地位,更标志着其通用智力已足以比肩国际顶尖模型。

接下来咱们还是实测见真章。

先来一道去年11月哈佛-麻省理工数学锦标赛(HMMT)里的英文题目试试水~

之所以选择这个题目,一则是避免数据污染,题目比较新,能够避免模型“见”过该题目;其二是HMMT是全球难度最高的数学竞赛之一,能够更好地考验星火X2的即时逻辑推理能力。

A positive integer n is imbalanced if strictly more than 99 percent of the positive divisors of n are strictly less than 1 percent of n. Given that M is an imbalanced multiple of 2000, compute the minimum possible number of positive divisors of M.



果不其然非常出色,星火X2迅速给出了详细的解答过程和正确答案。换言之,它彻底吃透了英文数学题目的底层逻辑,而非简单依赖中文语境。



再试试西班牙语:



同样也是流畅给出了正确结果。



那么它是如何做到的呢?

首先,星火X2在模型架构上继承了星火X1.5的MoE稀疏架构,参数同样为293B。

但与之不同的是,在星火X1.5的基础之上,星火X2结合权重量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分层通信进行了针对性技术创新:

训推采样校准强化学习算法:

在大模型,尤其是MoE架构中,往往存在训推分布不一致的问题,这会导致模型在训练阶段学到的规律无法直接适用到实际推理应用中,甚至会出现模型性能坍塌。

为此,星火X2提出训练与推理概率重采样自适应校准算法,让算法能够根据训练的实时进度,自动调整校准力度,确保专家模型能够时刻保持逻辑闭环。

递归式高难数据合成方法:

在模型训练中,由于深度推理数据极度匮乏,星火X2专门设计了多轮迭代式推导的数据合成方案。

通过多轮迭代和递归修正,能够最终形成一套从问题到正确推导过程的高质量语料,完成对模型深度推理准确率的提升。

多阶段RL高吞吐采样方法:

在突破国产算力瓶颈上,星火X2设计了P/D(Prefill/Decoder)两阶段分离的多阶段推理采样方案。

他们将大模型推理过程中物理特性完全不同的两个阶段——Prefill(预填充)和Decoding(解码),从硬件执行层面进行彻底分离,直接解决了国产化平台在高吞吐采样下的效率干扰,训练效率提升10%。

服务高性能部署优化算法:

这一步是让星火X2推理性能大幅度提升的关键。

通过对模型进行轻量化压缩,可实现单台服务器内部的批量专家并行,也就是单机大EP并行部署。

充分解决了国产算力平台的关键瓶颈——轻量化落地和高效推理,让模型不仅能跑,还能跑得快。

带动行业大模型实现突破

除了通用能力的全面释放,星火大模型此次升级的重中之重,在于深度场景化。

这是科大讯飞从星火大模型诞生之初,就始终强调的核心逻辑:要在发展技术力的同时,更注重技术与用户体验、场景落地的结合。


图片源自智能超参数

具体体现在医疗、教育、汽车和智能体四个方面:

赋能医疗领域,持续保持业界领先

依托星火X2底座的算力优化与推理跃迁,星火医疗大模型的核心能力也得到了全面进化,继续保持行业翘楚。

在基于居民健康档案的智能健康分析、智能报告解读、运动饮食建议、辅助诊疗、智能用药审核等高精度核心场景中,星火大模型更是显著优于GPT-5.2和另外两款国产大模型,树立了医疗专业大模型的新标杆。



此外,星火医疗大模型也已率先通过上海市医疗大模型应用检测验证中心评测验证。

这是国内首个专门针对医疗大模型的评测平台,代表了目前国内最顶尖、最权威的标准,说明讯飞已经在医疗AI合规上走到了行业前列。

而在面向用户的C端,“讯飞晓医”APP也同步完成升级,包括多轮主动问诊、多轮咨询问答、问用药、检查检验单解读、体检报告单解读等多任务。



可见,“讯飞晓医”在星火X2的加持下,已经成为了普通用户可用的且能力业界顶尖的数字医生。

赋能教育领域,实现个性化教学

而在教育领域,星火大模型也让原先基础的搜索工具,进化为一对一特级老师。

其率先上线错因贯穿的个性化学习能力,能够通过你的整张卷子、整道题的解题思路,精准捕捉到你的知识点黑洞,比如是定理没记牢呢,还是运算粗心大意了。

同时它能够像阅卷老师一样,在错误之处精准批注,实现步骤级批改。

这种模式下,AI更符合苏格拉底式的教学理念,也就是通过不断提问,引导学生自己思考并得出结论。

它不是直接告诉学生答案,而是教会学生如何进行思维拆解、如何自己悟出来。而这类启发式讲解,也是未来AI教育的主导路线。



体现在硬件上,就是科大讯飞的AI学习机。它在1对1精准学、答疑辅导和互动课等多功能上,持续领先同行业,能够帮助学生更精准地提高学习效率,以及增强学习兴趣。

赋能汽车领域,全面升级智能座舱交互系统

与此同时,星火大模型在多尺寸中小模型上也同步进行了升级,并精准将其应用在汽车智能座舱交互系统中。

过去用户必须说出精准指令才能实现交互,比如调低空调至24度。但如果说“我有点冷”或者“风太大”这类模糊指令,系统往往只会回复“对不起,我没有听懂”。

但现在这个问题随着星火X2的到来迎刃而解。

模型在人人/人机对话判断、模糊意图理解、高情商回复等方面的交互体验显著提升,尤其是在模糊意图上实现了跨越式突破,终于具备了实际可用的语义联想和推理能力。



赋能智能体平台和精品智能体新升级

另外值得关注的是,智能体的突破。

星火X2从根本上解决了智能体在工作环境中长期以来的痛点,在长时复杂任务规划、多工具组合调用以及长上下文等方面均实现了显著提升。

其中星辰Agent平台,整合了语音识别、语音交互、图像理解等百余种能力,集成超130万个智能体,在星火X2帮助下,进一步强化了智能体在思考和执行上的表现,更能支撑起复杂的企业场景。

比如面向企业采购场景的招采智能体,核心场景效率提升超3倍,还能像搭积木一样定制专用智能体,开发时间从原先的几天直接缩短至分钟级。

目前讯飞开放平台已正式上线星火X2 API,平台新注册开发者可直接领取100万Tokens免费额度。

在讯飞星火网页版和APP均可体验,星火APP 5.2.0新版本也同步上线~

国产算力突围下的讯飞星火

总的来说,星火X2更像是一块国产算力的试金石。

在过去几年里,国内AI行业发展受限的根本原因就在于算力。算力被扼住脖子后,模型性能始终无法突破国际一流水平。

而当所有人都在质疑国产算力时,讯飞咬牙给它做成了。而且是国内主流大模型中,唯一基于全国产算力训练的通用大模型。



模型实现了完全自主可控,一是算力自主,模型的训练和推理过程完全基于全国产算力平台;二是技术自主,整个模型框架均由讯飞自研,在此基础上构建起特有的研发生态。

核心原因就在于讯飞走了最务实的一条路:不再单纯追求实验室里的高分,而是依据自己深耕多年的行业经验一举扎根在最难的场景应用中。

讯飞顺势提出了“1+N”战略,即1个通用底座大模型,和N个底座大模型赋能的多领域行业大模型,然后通过软硬一体化,让大模型搭载到硬件上,以看得见摸得着的方式迅速落地转化。

简单来说,讯飞的差异化路径就是底座自主、硬件协同、场景为王。

而星火X2反向证明了这条路值得继续探索,即使是在算力重压下,单靠算法创新和场景优化也能补足当中的差距,换来中国AI在全行业的先发优势。

显然,国产大模型已步入应用红利期,而讯飞率先摘到了果实。

来源:https://www.163.com/dy/article/KLHA9OT10511DSSR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

华为AI深度布局:如何引领科技变革新格局
AI
华为AI深度布局:如何引领科技变革新格局

新智元报道编辑:艾伦【新智元导读】华为诺亚方舟实验室主任王云鹤官宣离职。我们梳理了王云鹤的经历。王云鹤今日在朋友圈官宣,将辞去华为诺亚方舟实验室主任职位,告别华为。从 2025 年 3 月到今天,王

热心网友
03.28
2026中关村论坛年会:聚焦脑机接口创新与产业未来
科技数码
2026中关村论坛年会:聚焦脑机接口创新与产业未来

脑机接口技术正处于从实验室迈向产业化应用的关键转折点,其发展离不开数据创新的驱动、检测服务的支撑与产业集群的聚合。3月27日,脑机接口创新发展论坛在中关村国际创新中心举行,本次论坛以 "创新集聚·脑智

热心网友
03.28
AI成本剧变:从烧钱到精算,节点普惠如何破局降本?
科技数码
AI成本剧变:从烧钱到精算,节点普惠如何破局降本?

来源:环球网【环球网科技报道 记者 李文瑶】当AI技术从技术验证走向实际应用,算力供给的结构性调整正成为业界关注的焦点。3月26日,中关村论坛年会现场,中科曙光发布世界首个无线缆箱式超节点——sca

热心网友
03.28
Sora暂停开放,国产视频大模型的机遇与未来在哪里?
科技数码
Sora暂停开放,国产视频大模型的机遇与未来在哪里?

1两年前横空出世的Sora,曾给AI业界和全球网民带来巨大的震撼。到2026年,它突然退场,没能再掀起那样大的波澜。从商业决策的角度看,这其实早就是意料之中的事。极高的视频生成成本、少得可怜的付费用

热心网友
03.28
赵付春:建设安全智能医疗生态需破解四大核心难题
科技数码
赵付春:建设安全智能医疗生态需破解四大核心难题

人工智能(ai)大模型正加速融入医疗健康生态,但其背后的法律责任、伦理边界与风险分担问题仍缺乏明晰框架。如何让ai在守住安全与伦理底线的前提下健康发展?笔者认为,要明确ai辅助诊疗责任,构建一个安全

热心网友
03.28

最新APP

暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25

热门推荐

个人纳税记录查询:电子税务局操作与下载全指南
电脑教程
个人纳税记录查询:电子税务局操作与下载全指南

可通过电子税务局 、随申办App 小程序、个税APP三种方式查询下载个税纳税记录:电子税务局需登录后搜索或按路径进入,下载PDF用身份证后6位解密;随申办依托统一认证,支持直接保存

热心网友
03.28
智现未来联合晶合集荣获SEMICON China良率提升奖
科技数码
智现未来联合晶合集荣获SEMICON China良率提升奖

3月26日,在SEMICON China 2026“半导体智能制造-未来工厂”论坛上,一场关于半导体制造AI未来形态的思想碰撞引发行业瞩目。智现未来董事长兼CEO管健博士受邀登台,发表题为《从“+A

热心网友
03.28
珠海金湾引进30亿航空整机制造项目,布局载人飞行产业
科技数码
珠海金湾引进30亿航空整机制造项目,布局载人飞行产业

南都讯 记者李洁琼 3月28日,珠海天际航空科技有限公司在金湾区天章产业园开业。作为珠海低空经济产业的新锐力量,天际航空智能制造基地的投运,标志着金湾区在载人级飞行器制造领域迈出关键一步,为珠海“天

热心网友
03.28
神州写真:中国机器人租赁升温,二次开发成关键新赛道
科技数码
神州写真:中国机器人租赁升温,二次开发成关键新赛道

来源:中国新闻网中新社杭州3月27日电 (鲍梦妮)随着机器人产业发展以及春晚机器人表演等热点带动,今年以来,中国多地机器人租赁业务持续升温。在上海上线的全球首个开放式机器人租赁平台“擎天租”,自去年

热心网友
03.28
京东翻新打印机避雷指南:警惕以旧充新三大陷阱
科技数码
京东翻新打印机避雷指南:警惕以旧充新三大陷阱

大象新闻·大象财富记者 李莉 张迪驰315消费者权益日刚过,广东李女士在某平台购买的“全新”打印机频繁报错,维修无果。她查询最新质保发现,整机标注保修三年,系统却显示剩余保修期不足两年,经售后核实确

热心网友
03.28