首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
阿丘科技用生成式AI与行业视觉大模型驱动工业AI视觉2.0

阿丘科技用生成式AI与行业视觉大模型驱动工业AI视觉2.0

热心网友
59
转载
2026-05-28
5月21日,阿丘科技CEO黄耀在“北京机器视觉助力智能制造创新发展大会”上,发表了题为《AI+工业视觉探索与展望》的演讲。以下内容是根据演讲要点整理而成。

一、AI+工业检测的难点与挑战

制造企业搞AI,投入最多的场景是啥?答案很明确:质量检测,占了将近40%。这个环节看起来简单,做起来却是一个接一个的坑。 先看第一关:质量管控本身。现代化工厂产量太大,工艺控制点又多。单个产品的检测参数已经够多了,乘以产量之后,那个数据量直接让人头皮发麻。更别变钱在都在追求极限制造,对精度和品质要求高得离谱——产线既要控制过检,又要压低漏检,产线速度还在不断往上提,检测的节奏和压力可想而知。 紧接着是第二关:缺陷本身也越来越难搞。很多缺陷极其微小,特征不明显,肉眼都分不清。以往靠人眼、靠传统方法去管,投入的人力财力巨大,但漏检风险始终挂着,很难根除。 这些痛点催生了工业AI视觉检测这个新兴领域。但新兴归新兴,真要落地,挑战也是层层叠叠。 **第一,性能指标太严苛。** 工业环境的AI不能“差不多就行”,它得极度精准,还得在各种复杂、变动的情况下保持稳定,这对模型的鲁棒性要求极高。 **第二,数据基础太薄弱。** 工业数据本身就很稀缺,很多还涉及企业机密拿不到,能拿到的往往数据量不够、质量参差不齐。数据又碎又少,AI模型训练和优化的效果自然大打折扣。 **第三,AI跑不动“光杆司令”。** 在工业场景里,AI基本都得跟硬件绑死在一起。这个集成过程增加了系统复杂度,还会带来各种干扰,反过来影响AI性能。 **第四,人不好找。** 既懂AI又懂工业的复合型人才,全行业都缺。这个人才断层,直接限制了技术大规模铺开的速度和深度。

二、工业AI视觉进入2.0时代

说起来,国内工业AI视觉真正落地,大概是从2019年开始的。用五年时间积累、迭代,现在正从1.0时代跨入2.0时代。 **工业AI视觉1.0时代:聚焦工业场景的AI算法,解决“可用”问题** 1.0时代最大的难题就是数据太少,所以核心玩法是小样本技术。这个时期有几个显著特征: - **小样本学习**:工业产线上能用的标注图像样本又少又难搞,AI算法只能在极度有限的数据库里锻炼本事。 - **高精度**:产品质检标准不是闹着玩的,无论是缺陷检测、尺寸测量还是物体识别,精度得一锤定音。 - **低算力依赖**:产线实际环境能提供的算力有限,但算法经过专门优化,哪怕性能一般,也得把活儿干漂亮。 这个时期的客户群体,主要是那些对新技术特别开放、且痛点明确的企业。他们愿意投钱去试,往往能清晰定义需求边界,也有能力管理数据和模型。 但说真的,1.0时代也只是解决了“可用”问题,离“好用”还有差距。比如,数据困局始终在——缺陷数据难搜集,清洗标注又贵,AI模型的训练和整理处处受阻;部署周期拖得很长,急得人跳脚;遇到没见过的缺陷类型,AI直接懵圈,识别不了;而且落地成本高,只有那些舍得花钱的企业才能玩得转。 **工业AI视觉2.0时代:生成式AI+垂直通用模型,追求“好用”** 迈入2.0时代,技术路线有了本质变化。基于Transformer的神经网络开始大展拳脚,通用性和泛化能力上一个台阶。过去只能“一个场景一个模型”地调参,现在可以把能力扩展到一整个垂类场景。 具体来说,这意味着单场景可以规模复制,多场景之间的模型也能泛化迁移。这个能力放大了应用的灵活性,也大幅拉低了AI落地的成本。同时,成像模组、算法模组、自动化模组都得跟着革新和简化,整个解决方案会变得更轻、更好交付。 2.0时代的客户群体更广泛,他们痛点明确,同时极度关注性价比——AI成本一旦降下来,技术就能大规模铺开。 这个时代,有三个技术非常关键。 **(1)智能良品学习** 核心是“非监督分割”和“非监督分类”两个模块。它的奥妙在于:只靠良品图就能训练模型,对产线上所有已知和未知的缺陷做像素级检测和整图分类。这意味着,当你遇到从未见过的新缺陷,或在极短时间内就得部署上线时,这项技术就能派上大用场——快速验证,快速跑起来。 目前这项技术已经在几十个产线场景中落地,尤其适合那些良品率高、样本收集周期长、可能随时冒出未知缺陷的场景。当然,如果缺陷特别微小,效果还有提升空间。 **(2)生成式AI——智能缺陷数据生成** 过去搜集缺陷样本有多难?数天甚至数月的苦功夫不说,产品一旦换型,整个流程就得重来。更头疼的是,有些长尾缺陷一年才冒一次头,想集齐样本好比大海捞针。 阿丘科技利用多年积累的大量场景数据,构建了预训练模型。基于这个模型,再结合具体场景的缺陷特征描述,通过Stable Diffusion框架就能“造”出接近真实的仿真缺陷图。复杂结构缺陷、背景变化、缺陷边缘处理都不在话下,还能高度还原真实缺陷的纹理、立体度和色彩细节。 这意味着,你再也不用苦等缺陷样本出现,AI自己就能“造”出来,再拿去训练和优化模型。泛化能力和适应性都显著提升。 **(3)工业视觉大模型** 这是专门为工业应用设计的大模型,基于Transformer和大量行业特定数据训练而成。它最大的优点是具备领域泛化能力——能适应复杂多变的工业环境,单场景能规模复制,多场景之间也能泛化迁移。 因为有一定的垂直场景通用性,所以能有效降低AI算法开发和训练的成本。在智能制造和自动化质量控制领域,它的应用速度非常快。 从1.0到2.0,其实就是从“能用”走到“好用”。1.0时代靠“算法驱动”,小样本、AI算法、软件工具链和方法论是关键。到了2.0时代,“以数据为中心”成为共识——高质量数据是AI算法的基础,生成式AI又负责把有限数据变出更多可用数据,大幅降低模型训练的成本。 2.0时代另一个重点,是“平台化”。一个统一的AI平台,把以往那些软件、工具链、方法论整合在一起,专门解决企业里那些碎片化场景的应用问题,让AI在各个分厂、各种场景下都能顺利落地。

三、工业AI垂直行业视觉大模型的实践落地

从2017年创业至今,阿丘科技已经在800多家工厂落地了方案,标准工业AI视觉软件的批量部署套数超过10000套,在3C电子、动力电池、PCB等行业积累了超过50家标杆客户。 拿PCB行业打个样。 PCB(印制电路板)是电子产品的核心部件,应用范围从手机、电脑到医疗、汽车、航空航天。它的设计工艺越来越复杂,单是缺陷种类就多达上百种,不同应用场景的检测标准还存在差异。背景复杂、工艺属性强、产品尺寸规格多样,算法兼容适配的难度肉眼可见。 早期PCB厂普遍采用传统算法AOI(自动光学检测)和A VI(自动视觉检测)来检缺陷。问题在于:设备调试复杂,误报率高,最后还得靠大量人工去复判假点。一台设备平均要配3到6名质检员,人工复判成本高、一致性差,质量根本控不住。 针对这些老难题,阿丘科技用三步走策略,构建了PCB行业垂直视觉大模型: - **第一步,数据积累**:收集了大量现场私有化部署的缺陷数据,再配合部分缺陷仿真,覆盖上百种缺陷细分类别,准确率干到了95%以上。同时借助AIDG智能缺陷生成工具,低成本、快速生成海量样本,喂饱大模型。 - **第二步,标准定义**:把各个出货检测标准汇总、整理、分级,逐步明确适用于不同交付场景的检测标准。 - **第三步,预制模型训练**:在AOI、A VI等场景里,模型覆盖度达到了90%以上。 这套组合拳下来,效果显著——交付周期从原本的120天,硬生生压缩到了14天,数据处理时间大幅缩短,模型上线也更稳更快。截至目前,这套AI垂直行业视觉大模型已在PCB行业导入超过100家工厂,累计升级设备超过1000台,TOP30客户覆盖率达到70%以上。 通过数据积累、标准定义和预制模型训练,AI垂直行业视觉大模型真正在PCB行业站住了脚,检测效率、交付速度都上了新台阶。接下来需要做的,就是继续扩展技术能力,深化视觉大模型的应用范围,让模型训练更高效,缺陷检测更精准,让市场对“快速响应、高效生产”的需求得到更好的满足。
来源:https://m.elecfans.com/article/2973996.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Bedrock平台多模型AI架构解析与生成式技术详解
AI教程
Bedrock平台多模型AI架构解析与生成式技术详解

某机构Bedrock服务:提供多种生成式AI模型访问 如今,想在生成式AI领域快速上手,开发者们面临一个现实难题:各家顶尖公司的前沿模型技术路线各异,性能特点不同,如果逐一去对接、测试和集成,不仅耗时费力,背后的安全与扩展性挑战更是令人头疼。有没有一种方式,能让大家安全、无缝且规模化地一站式调用这些

热心网友
05.27
生成式AI如何重塑未来办公文档处理方式
AI教程
生成式AI如何重塑未来办公文档处理方式

生成式AI模型如何革新办公文档处理?WPS AI的核心优势解析 在科技浪潮的推动下,生成式AI技术正在深刻改变我们的工作模式,特别是在文档处理这一高频办公场景中。无论是撰写长篇报告、制作演示文稿,还是处理日常邮件,传统手动方式往往效率低下、耗时费力。如今,生成式AI的融入,为办公自动化与智能化开启了

热心网友
05.26
生成式AI如何革新文档处理流程与应用场景
AI教程
生成式AI如何革新文档处理流程与应用场景

生成式AI如何革新文档处理?解锁办公效率新范式 在当今快节奏的办公环境中,文档处理——从撰写、编辑到排版——常常是消耗时间最长的核心环节,成为制约整体效率的显著瓶颈。传统工作模式下,一份高质量专业文档的产出,往往意味着数小时甚至数天的构思与打磨。幸运的是,以生成式AI为代表的人工智能技术,正以前所未

热心网友
05.26
苹果WWDC前瞻 新域名揭示生成式AI战略动向
科技数码
苹果WWDC前瞻 新域名揭示生成式AI战略动向

苹果在WWDC前夕注册了指向生成式AI的新域名,引发业界猜测。此举明确预示其将在开发者大会上重点展示酝酿已久的生成式人工智能技术。市场预期苹果将系统性公布AI布局成果,并可能推出支持文字交互和历史回溯的新版Siri应用。

热心网友
05.24
生成式AI如何重塑内容创作与自动化行业未来
AI教程
生成式AI如何重塑内容创作与自动化行业未来

生成式AI基于深度学习和自然语言处理技术,能自动生成文本、图像等内容。它在营销、设计等领域显著提升效率,例如OpenAI的GPT模型帮助内容创作节省超60%时间,Canva集成AI后用户设计时间减少70%。该技术正推动内容创作与自动化行业向更高效、个性化的方向发展。

热心网友
05.21

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Paralives首发销量充足 支撑后续开发无需DLC
游戏攻略
Paralives首发销量充足 支撑后续开发无需DLC

《Paralives》开发商承诺所有后续更新永久免费,拒绝付费DLC模式。15人小团队依靠首发销售额即可支撑多年运营,无需依赖额外内容包维持开发,展现了与《模拟人生》系列不同的差异化竞争思路。

热心网友
05.28
比亚迪宋Ultra DM-i上市12.99万 承诺城市领航安全兜底
业界动态
比亚迪宋Ultra DM-i上市12.99万 承诺城市领航安全兜底

2025年5月28日,比亚迪王朝网全新力作——宋Ultra DM-i正式推向市场,共推出5款配置车型,官方售价区间为12 99万至15 99万元。此次定价策略极具突破性:一款拥有310公里纯电续航能力的中型插电混动SUV,直接下探至13万元级别市场。作为王朝网络的新旗舰,该车明确瞄准高频出行需求场景

热心网友
05.28
折叠屏iPhone Ultra外观已定,第三方保护壳亮相
科技数码
折叠屏iPhone Ultra外观已定,第三方保护壳亮相

先来关注一个有趣的细节:苹果首款折叠屏手机,传闻将于今年秋季正式亮相。产品命名可能为iPhone Ultra,也有媒体称之为iPhone Fold——无论最终叫什么,这都将标志着苹果在折叠形态领域首次“出手”。 近日,配件厂商iFunSmart已率先上架iPhone Ultra的首批保护壳——这绝非

热心网友
05.28
山寨币ETF批量上市后市场表现分析 哪些项目值得关注
web3.0
山寨币ETF批量上市后市场表现分析 哪些项目值得关注

山寨币ETF迎来批量上市潮,首批项目市场表现如何?一文分析 Binance币安 欧易OKX ️ Huobi火币️ 最近,市场出现了一个不容忽视的新动向:XRP、DOGE、LTC、HBAR等现货ETF已经悄然登陆美国市场。与此同时,A VAX、LINK等资产的同类产品也正在审批流程中。进入11月以来,

热心网友
05.28
即使在大幅涨价后 Steam Deck 玩家热情依旧再次售罄
游戏攻略
即使在大幅涨价后 Steam Deck 玩家热情依旧再次售罄

近日,公司对SteamDeck1TBOLED版涨价300美元至949美元,上架短短不到24小时便再度售罄。据外界分析,该公司从中国大量补货并分批投放库存,高溢价未影响众多玩家的抢购热情与速度,其人气极其旺盛无比足以支撑快速清空。

热心网友
05.28