首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
华为昇腾平台验证:深圳AI算力加速139倍重大突破

华为昇腾平台验证:深圳AI算力加速139倍重大突破

热心网友
23
转载
2026-03-09



免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

2026年伊始,全球AI算力战场烽烟再起。英伟达依托CUDA生态形成了近乎垄断的技术壁垒,“缺芯少魂”仍是中国AI产业发展的现实挑战。

在此背景下,深圳市大数据研究院持续深耕人工智能等前沿科技领域,并于2025年孵化智子芯元(深圳)科技有限公司,致力于“数学+AI”融合创新。成立仅5个月,该公司便凭借自主研发的KernelCAT工具,仅用38分钟完成DeepSeek-OCR-2模型在华为昇腾平台的自动化部署和推理验证,有力推动了我国算力底层的自主创新。



近日,深圳市大数据研究院研究科学家、智子芯元联合创始人丁添在接受记者采访时表示:“过去我们靠‘堆人’追赶,但AI发展太快,根本追不上。现在有了自动化工具,英伟达十几年的领先,原来要用人一步一步走,现在可以用‘AI+数学’自动走,几周的任务变成几十分钟,这是革命性的速度提升,能大幅缩短追赶时间。”

丁添认为,英伟达的护城河太厚了,十几年的算子库、完善的框架、几百万开发者。很多开发者第一天就用英伟达,不愿意学别的芯片。“这将是国产芯片弯道超车、换道超车唯一可能的途径”。

破壁之战,用AI Agent打通国产算力“任督二脉”

制约国产芯片发挥性能的真正痛点往往不在硬件本身,而在软件生态。国产芯片并不缺乏理论峰值性能,缺的是能让这些性能落地的“算子”。



算子(Kernel)是连接AI算法与计算芯片的“翻译官”:它将算法转化为硬件可执行的指令,决定了AI模型的推理速度、能耗与兼容性。

而长期以来,为了让一个模型在国产卡上顺利运行,顶尖工程师们不得不像“在深海中戴着手铐组装手表”一般,耗时数月手动编写底层代码,却依然难以触及性能极限。行业的共识是:突破这一瓶颈,不能依赖传统的“手工作坊”模式,而必须借助更强大的AI工具。

深圳市大数据研究院依托多年“数学+AI”的积累,实现了技术突破。丁添介绍,KarnelCAT工具相当于通过“AI+数学”自动生成算子,然后自动适配国产芯片,大幅提升了推理与训练效率。比如,它可以将英伟达训练好的模型直接“翻译”到华为昇腾平台。

更通俗的说法,就像“把Windows游戏安装到苹果电脑上”,传统方式需要工程师几周甚至几个月时间。但KarnelCAT全自动完成代码适配与性能优化,将时间压缩至几十分钟到几小时。

而这背后也涉及诸多的技术突破,AI负责代码生成与硬件分析、数学负责性能优化(运筹学)、硬件在环机制(强制在真实硬件上测试,克服大模型“幻觉”问题)等。

作为全球首个全自动AI模型迁移与优化工具,KernelCAT打破了英伟达的生态壁垒,打通了国产算力的“任督二脉”。

38分钟的奇迹,从“版本地狱”到“智能迁移”

把大象装进冰箱需要三步,但把顶级的 DeepSeek-OCR-2 模型“完美迁移”到国产华为昇腾(CANN)平台,曾被视为一场“噩梦”。

DeepSeek-OCR-2 是一款引入了“视觉因果流”设计的复杂多模态模型,对算子的要求极高。在过去,适配这类模型意味着要面对最令人头秃的“版本地狱”:vLLM、PyTorch 和 NPU 驱动之间错综复杂的版本互锁,牵一发而动全身。

但在 KernelCAT(智子芯元研发的 AI Agent)接手后,这场战役变成了一次丝滑的“自动驾驶”体验:

·智能排雷,秒解“三角债”启动任务的瞬间,KernelCAT迅速接管了战场。它没有盲目安装,而是通过对任务目标的深度理解,精准识别出各个依赖库之间的死锁矛盾。它像一位经验丰富的拆弹专家,自动补全缺失环境,硬生生在复杂的版本冲突中搭建起了一套稳定的生产环境。

·全程托管,无需人工38分钟。这是从下达指令到迁移完成的总耗时。在这38分钟里,开发者不需要反复试错,不需要通宵查日志。KernelCAT自动解析模型结构、自动生成迁移计划、自动处理报错。原本需要一支专家团队数周才能完成的工作,现在仅需一杯咖啡的时间。

昇腾平台(Ascend)是华为面向全场景AI打造的端边云协同全栈软硬件与生态体系,核心是“硬件开放、软件开源”,为AI训练或推理提供自主可控的国产算力底座。



据微信公众号“昇腾CANN”发布的消息,在前序模型DeepSeek-OCR部署任务中,KernelCAT给出的方案较原生Transformers方案的加速效果可达139倍。这一结果表明,在KernelCAT支持下,复杂OCR模型可以在国产算力平台上实现可用、稳定、可复现的工程落地。

深圳AI算力突围,填补国产算力生态薄弱环节

值得注意的是,KernelCAT的横空出世并非偶然,这背后是深圳市大数据研究院的长期深耕。2019年,该研究院就正式授牌成为深圳市基础研究机构之一,始终致力于解决“卡脖子”难题。

智子芯元团队则承袭了研究院“数学+AI”的发展路径。他们不走寻常路,将高深的运筹优化理论与最前沿的AI大模型技术结合,攻克了算法与算子这一“最后一公里”的难题。



从联合华为攻关昇腾生态关键技术,到获得顶尖资本战略投资,智子芯元正在用“深圳方案”填补国产算力生态中最薄弱的一环。

深圳市大数据研究院副院长张昕表示,研究院以数学为根,以国产算力为战场,用“AI+运筹优化”解决了AI Infra的“卡脖子”难题,正走出一条从基础研究到产业突破的深圳路径。“如果再找到类似的好发力点,我们可以如法炮制,大概率还能成功。”

“我们希望国产芯片上也能跑出世界一流的大模型。”丁添表示,未来希望KarnelCAT不只是迁移工具,更是计算加速开发的工具,能帮助国产芯片生态催生新模型。同时,他还强调,算力底座需要自主可控,军事、医学这些重要领域的模型,不应该跑在国外芯片上。“我们的工具可以帮助这些垂直领域,把AI用起来,并带来效率提升。”

在人工智能时代,像智子芯元这样聚焦芯片、大模型等关键赛道攻坚的企业不断涌现,贡献出越来越多的“深圳方案”。目前,深圳现有人工智能企业2600余家,产业链覆盖芯片、模型、硬件及应用等全环节,产业规模位居全国前列,连续两年实现两位数增长。

在这片沃土上,人工智能作为新质生产力,正在充分涌流。

采写:南都·湾财社记者 程洋

来源:https://www.163.com/dy/article/KNJ68HA405129QAF.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

具身智能研发框架Dexbotic重塑机器人开发流程
AI
具身智能研发框架Dexbotic重塑机器人开发流程

近日,开源具身智能原生框架Dexbotic宣布正式支持以RLinf作为其分布式强化学习后端。对具身智能开发者而言,这不仅是一次普通的工程适配,更意味着VLA模型研发中长期存在的「SFT与RL割裂」问题,正在被真正打通。 这是一种典型的「乐高式协作」:双方不强行Fork、不粗暴揉合代码,而是保持清晰边

热心网友
05.13
RMS-MoE模型通过检索记忆优化专家路由调度效率
AI
RMS-MoE模型通过检索记忆优化专家路由调度效率

随着大模型参数规模不断增长,混合专家(Mixture-of-Experts, MoE)架构因其稀疏激活特性,成为平衡模型性能与计算开销的主流方案。然而,在实际的Web级应用部署中,一个关键挑战日益凸显:传统MoE的路由机制通常是“无记忆”的。 试想,在搜索引擎、智能问答或多轮对话等高并发场景下,用户

热心网友
05.12
编程入门指南从零基础到理解核心概念
编程语言
编程入门指南从零基础到理解核心概念

编程十年的一点分享 在软件开发的路上走过十几年,从一个爱好者到以此为业,有些体会或许值得聊聊,就当是抛砖引玉吧。 最早接触编程,是从BASIC和C语言开始的。工作后,随着需要,陆续学习了dBase、Access这类桌面数据库的开发。真正以开发为职业,可以说始于FoxPro 5 0,之后技术栈随着项目

热心网友
05.07
编程初学者入门指南与核心思维解析
编程语言
编程初学者入门指南与核心思维解析

引言 编程,是一门实践科学。这意味着,学习它的最佳方式就是动手去敲代码。但这是否意味着,我们可以因此轻视理论的学习呢? 入门编程 如果你去各大技术社区提问“该如何入门编程”,五花八门的答案会瞬间涌来。 不过,仔细梳理一下,无外乎以下几种流派: 学院派 他们推荐从C语言入手,并辅以数据结构、操作系统等

热心网友
05.07
Agent 需要“油表”和“刹车”:一篇论文,扒光了 Agent 的“糊涂账”
科技数码
Agent 需要“油表”和“刹车”:一篇论文,扒光了 Agent 的“糊涂账”

想象一下这个场景: 你让 AI Agent 帮你修一个代码 Bug。它打开项目,读了 20 个文件,改了改,跑了一下测试,没过,又改,又跑,还是没过……来回折腾了十几轮,终于——还是没修好。 你关掉电脑,松了口气。然后收到了 API 账单。 上面的数字可能让你倒吸一口凉气——AI Agent 自主修

热心网友
05.06

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

领克GT概念跑车北京车展首发 百公里加速仅2秒
科技数码
领克GT概念跑车北京车展首发 百公里加速仅2秒

领克首款GT概念跑车亮相北京车展,由中欧团队联合打造。新车采用经典GT比例与低趴宽体设计,配备液态金属蓝涂装与2+2座舱,设有高性能模式按键可激活空气动力学套件。车辆采用后驱布局与AI智能运动控制系统,百公里加速约2秒,设计融合瑞典极简美学并参考全球用户反馈。

热心网友
05.14
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升
科技数码
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升

英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。

热心网友
05.14
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售
科技数码
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售

微星将于5月15日推出两款26 5英寸雾面WOLED显示器MAG276QRY28和276QRDY54,售价分别为2499元和6299元。均采用第四代WOLED面板,具备QHD分辨率、VESADisplayHDRTrueBlack500认证、1500尼特峰值亮度及99 5%DCI-P3色域覆盖。276QRY28刷新率为280Hz,高阶款276QRDY54支持4

热心网友
05.14
中芯国际一季度净利润13.61亿元 同比增长0.4%
科技数码
中芯国际一季度净利润13.61亿元 同比增长0.4%

中芯国际2026年第一季度营收176 17亿元,同比增长8 1%;净利润13 61亿元,同比增长0 4%。公司预计第二季度收入环比增长14%至16%,毛利率指引上调至20%至22%。这反映出公司在行业复苏中展现出财务韧性,并通过运营优化增强了短期增长势头。

热心网友
05.14
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升
AI
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升

手机修图、相机降噪、视频去雾……这些我们日常使用的图像处理功能,其背后都离不开人工智能(AI)技术的驱动。通常,AI模型的训练逻辑是:向模型展示大量“低质图像”与“优质图像”的配对数据,让它学习如何将前者转化为后者。然而,天津大学计算机视觉团队近期发表的一项研究(arXiv:2604 08172)揭

热心网友
05.14