游乐游手机版
首页/科技数码/文章详情

华为昇腾平台验证:深圳AI算力加速139倍重大突破

时间:2026-03-09 15:07
2026年伊始,全球AI算力战场烽烟再起。英伟达依托CUDA生态形成了近乎垄断的技术壁垒,“缺芯少魂”仍是中国AI产业发展的现实挑战。在此背景下,深圳市大数据研究院持续深耕人工智能等前沿科技领域,并



2026年伊始,全球AI算力战场烽烟再起。英伟达依托CUDA生态形成了近乎垄断的技术壁垒,“缺芯少魂”仍是中国AI产业发展的现实挑战。

在此背景下,深圳市大数据研究院持续深耕人工智能等前沿科技领域,并于2025年孵化智子芯元(深圳)科技有限公司,致力于“数学+AI”融合创新。成立仅5个月,该公司便凭借自主研发的KernelCAT工具,仅用38分钟完成DeepSeek-OCR-2模型在华为昇腾平台的自动化部署和推理验证,有力推动了我国算力底层的自主创新。



近日,深圳市大数据研究院研究科学家、智子芯元联合创始人丁添在接受记者采访时表示:“过去我们靠‘堆人’追赶,但AI发展太快,根本追不上。现在有了自动化工具,英伟达十几年的领先,原来要用人一步一步走,现在可以用‘AI+数学’自动走,几周的任务变成几十分钟,这是革命性的速度提升,能大幅缩短追赶时间。”

丁添认为,英伟达的护城河太厚了,十几年的算子库、完善的框架、几百万开发者。很多开发者第一天就用英伟达,不愿意学别的芯片。“这将是国产芯片弯道超车、换道超车唯一可能的途径”。

破壁之战,用AI Agent打通国产算力“任督二脉”

制约国产芯片发挥性能的真正痛点往往不在硬件本身,而在软件生态。国产芯片并不缺乏理论峰值性能,缺的是能让这些性能落地的“算子”。



算子(Kernel)是连接AI算法与计算芯片的“翻译官”:它将算法转化为硬件可执行的指令,决定了AI模型的推理速度、能耗与兼容性。

而长期以来,为了让一个模型在国产卡上顺利运行,顶尖工程师们不得不像“在深海中戴着手铐组装手表”一般,耗时数月手动编写底层代码,却依然难以触及性能极限。行业的共识是:突破这一瓶颈,不能依赖传统的“手工作坊”模式,而必须借助更强大的AI工具。

深圳市大数据研究院依托多年“数学+AI”的积累,实现了技术突破。丁添介绍,KarnelCAT工具相当于通过“AI+数学”自动生成算子,然后自动适配国产芯片,大幅提升了推理与训练效率。比如,它可以将英伟达训练好的模型直接“翻译”到华为昇腾平台。

更通俗的说法,就像“把Windows游戏安装到苹果电脑上”,传统方式需要工程师几周甚至几个月时间。但KarnelCAT全自动完成代码适配与性能优化,将时间压缩至几十分钟到几小时。

而这背后也涉及诸多的技术突破,AI负责代码生成与硬件分析、数学负责性能优化(运筹学)、硬件在环机制(强制在真实硬件上测试,克服大模型“幻觉”问题)等。

作为全球首个全自动AI模型迁移与优化工具,KernelCAT打破了英伟达的生态壁垒,打通了国产算力的“任督二脉”。

38分钟的奇迹,从“版本地狱”到“智能迁移”

把大象装进冰箱需要三步,但把顶级的 DeepSeek-OCR-2 模型“完美迁移”到国产华为昇腾(CANN)平台,曾被视为一场“噩梦”。

DeepSeek-OCR-2 是一款引入了“视觉因果流”设计的复杂多模态模型,对算子的要求极高。在过去,适配这类模型意味着要面对最令人头秃的“版本地狱”:vLLM、PyTorch 和 NPU 驱动之间错综复杂的版本互锁,牵一发而动全身。

但在 KernelCAT(智子芯元研发的 AI Agent)接手后,这场战役变成了一次丝滑的“自动驾驶”体验:

·智能排雷,秒解“三角债”启动任务的瞬间,KernelCAT迅速接管了战场。它没有盲目安装,而是通过对任务目标的深度理解,精准识别出各个依赖库之间的死锁矛盾。它像一位经验丰富的拆弹专家,自动补全缺失环境,硬生生在复杂的版本冲突中搭建起了一套稳定的生产环境。

·全程托管,无需人工38分钟。这是从下达指令到迁移完成的总耗时。在这38分钟里,开发者不需要反复试错,不需要通宵查日志。KernelCAT自动解析模型结构、自动生成迁移计划、自动处理报错。原本需要一支专家团队数周才能完成的工作,现在仅需一杯咖啡的时间。

昇腾平台(Ascend)是华为面向全场景AI打造的端边云协同全栈软硬件与生态体系,核心是“硬件开放、软件开源”,为AI训练或推理提供自主可控的国产算力底座。



据微信公众号“昇腾CANN”发布的消息,在前序模型DeepSeek-OCR部署任务中,KernelCAT给出的方案较原生Transformers方案的加速效果可达139倍。这一结果表明,在KernelCAT支持下,复杂OCR模型可以在国产算力平台上实现可用、稳定、可复现的工程落地。

深圳AI算力突围,填补国产算力生态薄弱环节

值得注意的是,KernelCAT的横空出世并非偶然,这背后是深圳市大数据研究院的长期深耕。2019年,该研究院就正式授牌成为深圳市基础研究机构之一,始终致力于解决“卡脖子”难题。

智子芯元团队则承袭了研究院“数学+AI”的发展路径。他们不走寻常路,将高深的运筹优化理论与最前沿的AI大模型技术结合,攻克了算法与算子这一“最后一公里”的难题。



从联合华为攻关昇腾生态关键技术,到获得顶尖资本战略投资,智子芯元正在用“深圳方案”填补国产算力生态中最薄弱的一环。

深圳市大数据研究院副院长张昕表示,研究院以数学为根,以国产算力为战场,用“AI+运筹优化”解决了AI Infra的“卡脖子”难题,正走出一条从基础研究到产业突破的深圳路径。“如果再找到类似的好发力点,我们可以如法炮制,大概率还能成功。”

“我们希望国产芯片上也能跑出世界一流的大模型。”丁添表示,未来希望KarnelCAT不只是迁移工具,更是计算加速开发的工具,能帮助国产芯片生态催生新模型。同时,他还强调,算力底座需要自主可控,军事、医学这些重要领域的模型,不应该跑在国外芯片上。“我们的工具可以帮助这些垂直领域,把AI用起来,并带来效率提升。”

在人工智能时代,像智子芯元这样聚焦芯片、大模型等关键赛道攻坚的企业不断涌现,贡献出越来越多的“深圳方案”。目前,深圳现有人工智能企业2600余家,产业链覆盖芯片、模型、硬件及应用等全环节,产业规模位居全国前列,连续两年实现两位数增长。

在这片沃土上,人工智能作为新质生产力,正在充分涌流。

采写:南都·湾财社记者 程洋

来源:https://www.163.com/dy/article/KNJ68HA405129QAF.html
上一篇OpenClaw概念火爆:AI养龙虾带动青云、顺网科技双涨停 下一篇苹果首款折叠iPhone曝光:书本式设计预计9月发布
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
2026年实测排行 全能4K Live影像旗舰 国补各价位机型选购指南
科技数码 · 2026-06-07

2026年实测排行 全能4K Live影像旗舰 国补各价位机型选购指南

国补政策一落地,身边不少朋友都开始在盘算换新机。学生党、年轻姑娘、还有那些天天拍短视频的创作者,成了这波购机主力。大家普遍头疼的是:手里预算就那么多,想要颜值、拍照、续航都兼顾,实在不容易。这次我们把vivo几款热门机型真机摸了个遍,结合实验室实测数据,从影像、做工、续航到补贴后到手价,一步步拆解。

SHEIN污染问题与环保管理框架全面解读
科技数码 · 2026-06-07

SHEIN污染问题与环保管理框架全面解读

SHEIN希音环保表现,关键要看这个框架 关注SHEIN希音的环保问题,其实是在探讨一个非常现实的话题:作为一家全球性的时尚零售商,它究竟如何应对服装行业长期面临的环境挑战——资源消耗、库存积压、碳排放、包装与纺织废弃物?如果能够把这些议题梳理清楚,那么对SHEIN希音的整体环保表现,心里也就大致有

苹果美国上架官翻Apple Watch Series 11 2025款 便宜约15%
科技数码 · 2026-06-07

苹果美国上架官翻Apple Watch Series 11 2025款 便宜约15%

苹果官方翻新商店再次迎来新品上架。6月5日,据MacRumors报道,美国官网的官方翻新专区悄然上线了三款2025年9月发布的智能手表——Apple Watch Series 11、Apple Watch Ultra 3以及Apple Watch SE 3。这是该系列机型首次通过翻新渠道销售,折扣幅

飞牛fnOS上线OPPO一加相册互联功能
科技数码 · 2026-06-07

飞牛fnOS上线OPPO一加相册互联功能

近日,飞牛 fnOS 发布重要更新:ARM 设备上的飞牛相册迎来大幅升级,其中最受关注的亮点是正式支持 OPPO 和一加设备互联。值得一提的是,此前 X86 平台已实现该功能,此次更新为 ARM 用户补齐了这项实用功能。 具体来说,OPPO 与飞牛之间的互联打通了四个关键场景,每项体验都非常实在:

小米米家植萃系列智能香氛机首发229元支持澎湃智联
科技数码 · 2026-06-07

小米米家植萃系列智能香氛机首发229元支持澎湃智联

米家智能香氛机植萃系列现已正式开售。大家最关心的价格方面,官方建议零售价为299元,而首发优惠价直接降至229元,性价比十足。 这款香氛机的核心亮点在于选用了奇华顿Orpur高端精油,天然植物萃取,气味清新自然,不刺鼻也不显廉价。它提供三种香型:风铃草、红茶、薰衣草,分别对应清甜、醇厚、舒缓的不同风