10月17日消息,科技媒体Appleinsider昨日(10月16日)发布博文报道称,苹果公司近期公布了三项AI研究成果,深入探讨了如何利用人工智能(AI)与大语言模型(LLM)来提升软件开发与测试过程的效率。
这三项研究分别聚焦于软件自动化质量工程(QE)测试、代码错误修复以及软件缺陷预测,旨在解决传统手动测试方式耗时、成本高昂且容易出错的问题。
一、智能体RAG框架
第一项研究提出了一个名为"智能体RAG框架"(Agentic RAG Framework),专门用于软件自动化测试。

在传统模式下,质量工程师需要花费30%-40%的时间手动编写测试方案和脚本。为解决此问题,苹果设计了一个由六个专业AI智能体组成的协同系统,分别负责法规遵循、历史案例分析、测试生成等任务。
该框架成效显著:不仅将测试准确率从65%提升至94.8%,还将所需时间大幅缩短了85%,同时软件缺陷检出率也提高了35%。
二、SWE-Gym训练平台
第二项研究推出了名为"SWE-Gym"的训练环境,专门用于培养AI智能体解决现实世界的软件工程问题。
该平台整合了来自11个知名Python代码库的2438个真实GitHub问题,让AI在模拟环境中学习诊断并修复代码错误。

经过训练,基于语言模型的AI智能体成功解决了72.5%的编程任务。这项研究旨在通过AI辅助提升开发人员的生产力,并为探索"人机协作"编程模式提供了新思路。
三、ADE-QVAET预测模型
第三项研究聚焦于软件缺陷的"事前预测",并为此开发了名为"ADE-QVAET"的AI模型。

该模型结合了自适应优化技术(ADE)与量子变分自动编码器(QVAET),通过深度学习和模式识别来精准定位高维特征中的异常情况。
这项研究的目标是利用AI将软件维护从"被动修复"转变为"主动预防",从本质上提升软件产品质量。
参考资料
Agentic RAG for Software Testing with Hybrid Vector-Graph and Multi-Agent Orchestration
Training Software Engineering Agents and Verifiers with SWE-Gym
Software Defect Prediction using Autoencoder Transformer Model
