国产AI春节逆袭:从南北夹击到复刻DeepSeek之路


犹记龙年春节,爆火的DeepSeek,一度把国内其他大模型“整抑郁”了。今年,互联网大厂和国产大模型公司无不期待复刻DeepSeek的奇迹,赶在春节前密集官宣上新,将新年作为最佳练兵场。
2月12日,上海大模型企业MiniMax在MiniMax Agent正式上线新一代文本模型MiniMax M2.5(以下简称“M2.5”),并于2月13日全球开源,支持本地化部署。随后,全球用户迅速在MiniMax Agent上构建1万多个“专家”,且数量仍在快速增长。
M2.5被称“王炸”,在于其性能几乎逼平由美国AI公司Anthropic开发的模型Claude Opus 4.6,价格却让人目瞪口呆,连当下最火的开源个人AI代理项目OpenClaw之父彼得·斯坦伯格也忍不住感慨。

OpenClaw之父彼得·斯坦伯格转发和评价M2.5,性能比肩Claude Opus 4.6,价格便宜20倍。
M2.5定位为“原生Agent生产级模型”的产品,能自动写代码、调用工具、分析数据、生成报告。
在编程最硬核的SWE-Bench Verified榜单上,M2.5拿到了80.2%的高分,与Claude Opus 4.6仅有微弱差距。在多语言任务Multi-SWE-Bench上,M2.5超越Claude Opus 4.6拿到第一。
针对办公场景,M2.5在Word、PPT、Excel、金融建模等高阶场景中能力出众,在测评框架GDPval-MM与主流模型的对比中,取得了59%的平均胜率。M2.5生成的表格,能将封面、数据源和详细数据分得清清楚楚,格式规整,仿佛出自强迫症员工之手。

M2.5对标美国主流模型毫不逊色。
关键在于,能干“重活”的M2.5,其激活的参数量仅10B,在全球同类第一梯队旗舰模型中“体型”最小。
“脑子好使”的同时,M2.5的杀手锏,还在于解决了模型“贵”和“慢”两大痛点。
M2.5将推理速度干到了100TPS(每秒事务数),是主流模型的约两倍;输入价格约0.3美元/百万Token(模型输入、输出基本单位),输出约2.4美元/百万Token。按每秒输出100Token计算,1美元就能让智能体连续工作一小时,堪称“白菜价”。
在算力短缺的时代,能以颠覆式创新实现模型不降智、不卡顿、体验优,是MiniMax得以持续留在大模型决赛圈牌桌上的核心王牌。
有意思的是,较MiniMax早一天在港交所上市的智谱AI,也在近期发布智谱GLM-5,同样对标Claude Opus 4.6。Claude Opus 4.6可谓受到了中国一南一北两大模型的夹击。
智谱GLM-5在编程和智能体能力上取得了开源模型佳绩。有开发者使用后认为,GLM-5在真实编程场景的使用体验已逼近Claude最强模型,而Claude的编程能力在业内处于第一梯队。在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源第一。
智谱将GLM-5形容为“系统架构师”,也就是说,AI大模型未来不再只满足于写代码完成某一项功能,而是要像工程师一样建构系统,甚至将功能任务分配给不同智能体完成。

在代理编程测试上,智谱GLM-5略胜Claude一筹。
另外,千问也在2月10日发布了新款图像生成模型Qwen-Image 2.0,支持1000个词元的超长指令,同时推理能力也更强。
几乎同一时间,字节跳动也发布了同类模型Seedream 5.0,文生图能力再次跨前一步。“以前用AI生成图像有一个缺陷,受限于推理能力,图片中的汉字经常‘牛头不对马嘴’或者直接乱码。”千问开发团队告诉记者,随着指令理解和推理能力的增强,AI图片生成的“汉字难题”将成为历史。
除了文生图、文生视频等多模态模型之外,最基础的大语言模型也“大有进步”。近日,DeepSeek悄然上线了一款新模型,虽然并非是万众期待的V4,但同样令人惊喜。
这款更新模型虽然不具备多模态识别能力,但将上下文处理能力提升至100万词元,相当于可以一次性阅读理解全套《三体》共计约90万字。一名智能体开发者告诉记者:“目前支持上下文理解百万级词元的模型不多,比如谷歌的Gemini和Anthropic的Claude,DeepSeek这次更新也算是‘上车’了。”
据了解,这一波大模型“上新潮”远未停止,豆包2.0、千问3.5等旗舰模型将于近期发布。
原标题:《美国大模型被中国南北夹击,国产AI疯抢春节档,欲复刻DeepSeek奇迹》
相关攻略
有这么一个人,他姓周,入职过阿里,和林俊旸有渊源,做的产品这两天还特别火。没错,他不是阿里的周浩,而是已经在字节主导Seedance等多模态业务的周畅。周畅在阿里的七年时间里,是通义千问大模型的技术
IT之家 2 月 27 日消息,AI 基准测试机构 Artificial Analysis 发布最新一期全球视频生成大模型榜单,在文生视频赛道上,快手可灵 3 0 系列模型(Kling 3 0 Pr
犹记龙年春节,爆火的DeepSeek,一度把国内其他大模型“整抑郁”了。今年,互联网大厂和国产大模型公司无不期待复刻DeepSeek的奇迹,赶在春节前密集官宣上新,将新年作为最佳练兵场。2月12日,
近年来,随着AI大模型的快速发展,越来越多的用户使用AI来辅助工作、提高效率。以文生图模型为例,生成的图片质量越来越高,比如以下几张:(提示词:微距视角,一只瓢虫停留在绿色叶片边缘,翅膀纹理清晰,水
新京报贝壳财经讯(记者罗亦丹)对于AI大模型应用,人们已经熟悉了“文生文”、“文生图”以及“文生视频”。而12月17日,腾讯混元发布世界模型1 5(Tencent HY WorldPlay),提供了
热门专题
热门推荐
在使用Safari浏览器时,自动填充功能确实能极大提升效率。但随着时间推移,其中可能积累大量过时地址、失效密码,甚至无意保存的敏感内容。这些残留记录不仅影响使用体验,更可能成为隐私泄露的隐患。本文将系统介绍在Mac上彻底清理Safari自动填充记录的多种实用方案,帮助您有效管理浏览器数据。 一、通过
你是否遇到过这样的困扰:电脑明明处于空闲状态,风扇却突然高速运转,硬盘指示灯频繁闪烁,任务管理器显示CPU或磁盘占用率异常飙升?这种“系统看似休息,硬件却异常忙碌”的现象,很可能源于Windows系统内置的“自动维护”功能在后台悄然运行。该功能的设计初衷是好的,旨在利用系统空闲时间自动执行磁盘碎片整
如果你在使用Windows 11时,感觉屏幕上的文字、图标或按钮有些模糊不清,看久了眼睛容易疲劳,这可能不是你的视力问题,而是系统默认的色彩搭配对比度不够。为了让界面元素更醒目、更容易识别,Windows 11内置了一个非常实用的功能——高对比度模式。它通过大幅强化前景与背景的颜色差异,能显著提升屏
当你的Mac出现运行卡顿、风扇噪音增大或应用程序启动缓慢时,很可能是因为Spotlight索引服务正在后台占用大量系统资源。Spotlight作为macOS内置的搜索工具,虽然方便,但其持续的索引过程确实可能影响性能。本文将详细介绍五种有效管理Spotlight的方法,包括彻底禁用、精准控制索引范围
当您在 macOS 上遇到 Microsoft Teams 运行缓慢、界面显示错误或登录失败等问题时,不必立即归咎于网络或系统故障。一个常见且高效的解决方案是清理应用程序的本地缓存文件。这些缓存数据在长期使用后可能损坏或过时,从而影响软件性能。本文将为您提供三种在 Mac 上安全清理 Teams 缓





