首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
月产百亿行AI代码激增76%,程序员热议:代码量不等于生产力

月产百亿行AI代码激增76%,程序员热议:代码量不等于生产力

热心网友
73
转载
2026-01-09


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新智元报道

编辑:peter东 LRST

【新智元导读】想知道硅谷的程序员怎么使用AI编程,被2000家公司使用的AI代码审查智能体Greptile基于每月用AI审核的的十亿行代码,发布了AI编程年度报告,揭示了使用AI编程后带来的生产率提升,但对此程序员们却无法感同身受。

这份报告最让人震撼的一点,是指出了在AI编程的帮助下,工程师的代码生产量飞涨。

每位开发人员,每月提交的代码行数从4450增长到7839,增长幅度达到76%,对于6-15人的中型开发团队,每位开发者提交的代码量更是接近翻倍(提升89%),这意味着AI编程工具正成为一种效率倍增器。

更值得注意的是,程序员单次提交代码时,每文件中变更的代码行数的中位数上升20%(从18变为22行),意味着代码迭代不仅「更快」,且「变化更多」,这可能反映了AI编程工具能够修改的代码及应对的需求正变的复杂。

不过对于报告提到的效率提升,ycombinator论坛上对该报告的讨论,却大多是怀疑的声音。有人说需要花大量时间修复AI生成的代码中的问题。

这些细微差别从未被这类指标所捕捉。更多的人讨论提交的代码数量增加,是不是等同于程序员真实的工作效率提升。

菜鸟程序员完成一个功能需要几十行代码,而资深程序员则只需要几行就能实现。此外,由于引入了AI编程,代码被删除和重写的频率如何?这可能不容易统计,但这却很能反映AI编程带来的工作效率提升。

另一个更对于代码提交数量增加与工作效率提升的观点是,假设员工之间具备同等的专业能力,那么生产力就取决于代码行数的产出。但事实上,有的任务很难,但不需要太多行代码,只有资深程序员才能完成;而有些任务很简单,却需要很多行代码。只看代码提交量,是将所有任务都看成是中等难度的任务。

此外,不同程序员提交的代码质量不同,这一点在该报告中也没有体现。从这个角度去看,每一行代码都应该被视为一种负担,而不是资产。开发团队需要领域专家来判断到底需要多少行代码存在。

就像你可能会通过每小时搬运的物品数量来衡量仓库员工的生产力。但如果有人只是把东西随意扔到仓库里,或者搬运本不需要移动的东西,他们就会最大化这个指标。

AI辅助下每个程序员能生成更多的代码了,但这些代码真的是完成对应任务所必须的吗?这不是业务方应对考虑的问题,仅仅衡量提交的代码数,可能会鼓励不必要的重复劳动。

从这个角度来看,或许「编辑行数」是更合适的评估程序员工作效率的指标。这样一来,通过重构来减少代码库规模的方式仍然可以被视为有生产力。每删除一行代码得1分,每添加一行代码也得1分。

OpenAI依旧领先

但差距在变小

效率跃升的背后,是支撑性技术栈的激烈重构。报告以不同大模型提供商的SDK下载量为考察变量,发现在AI记忆模块中,mem0以59%市占率一骑绝尘;而对比向量数据库「六强混战」(Weaviate 25%领先,Chroma/Pinecone/Qdrant等紧咬)。


LLMOps层,LiteLLM增长4倍至4100万下载,LangSmith借LangChain生态捆绑上位。这印证一个趋势,即模型调度、监控、降级已从「可选项」变为「基建标配」。

当编程调用的智能体数量越来越多,运维复杂度指数上升,LLMOps正在承接当年K8s之于微服务的角色。


对于模型间的军备竞赛,该报告考察模型提供商从2024年1月到2025年11月的SDK下载量,主要玩家是OpenAI、Anthropic和Google GenAI。OpenAI以一条陡峭上升的绿色曲线主导市场。其下载量从2024年初的几乎为零,一路飙升至2025年11月的1.3亿次,确立了绝对的市场领导者地位。

Anthropic(红色折线)的增长轨迹堪称「火箭式」。

虽然起步较晚且基数较小,但自2024年下半年开始,其下载量呈指数级爆发,到2025年11月已达到4300万次,实现了自2024年4月以来1547倍的惊人增长,Open AI和Anthropic的比值已从47:1缩至4.2:1——开发者正在用脚投票,向更开放、更可控、更可编程的接口迁移。

而黄色曲线代表谷歌,其增长相对平缓,在2025年11月的下载量约为1360万次,与前两者相比存在显著差距。


不同模型的参数决定模型的适配场景

这份报告还揭示了五大主流模型作为编码智能体后端的实测基准(考察指标包括第一个token出现需要等待的时间、吞吐量、成本等),见下表。

通过该表,可看出Claude Sonnet 4.5与Opus 4.5只需要等待不到2.5秒,就会返回第一个token,显著优于GPT-5系(>5秒)。而在交互式编程中,2秒是「心流」与「分心」的临界阈值。


而对于批量生成场景,GPT-5-Codex与GPT-5.1的吞吐量断崖领先,适合后台CI/CD流水线中的大规模代码生成/测试用例填充。

Gemini 3 Pro则在响应速度时显著较慢,需要等10多秒才会返回第一个token,每秒输出的token数也太少,不适合交互式编程的使用场景。

该报告的最后部分,还给出了2025年基础模型及大模型编程应用领域的关键论文,这些研究预示下一波突破方向,例如Self-MoA颠覆传统多模型集成,证明单模型多次采样+聚合可超越异构模型混合,这意味着「模型多样性」或让位于「推理路径多样性」,而Search-R1用强化学习训练模型「自主决定何时搜索」,将搜索引擎变为可学习的环境动作,而非静态的工具调用。RetroLM更是在直接在KV层面检索,绕过原始文本,改变大模型组织记忆的方式。

无论用了多少AI辅助编程,提交代码前仍需人工审查。追踪AI编程工具的使用数据,无法包含人工审核的部分,这将难以真实反映产品实际的使用体验和效果。不过如果你能证明AI编程工具有助于更快地发布功能,而不是仅仅允许更多的代码行数通过审查,那么你开发的AI编程工具将具有更强的可证明价值。

参考资料:

https://www.greptile.com/state-of-ai-coding-2025

https://news.ycombinator.com/item?id=46301886

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

来源:https://www.163.com/dy/article/KIPI8JME0511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

雷科技到底是谁?!!!悟空给出的答案,太抓人了!
科技数码
雷科技到底是谁?!!!悟空给出的答案,太抓人了!

从零到一:用AI生成一份专业的媒体影响力报告 但凡在内容或运营团队待过的人,大概都对制作《媒体影响力报告》这类活儿记忆犹新。那过程,堪称一场跨部门接力赛:运营同事得先从各个平台后台手动扒拉数据,计算阅读量、粉丝增长和互动率;拿到一堆冰冷数字后,还得拉着账号负责人反复琢磨定位和文案;最后,抱着半成品火

热心网友
05.01
全国五一劳动奖章获得者聂海平:突破国外技术壁垒 用代码“敲”出属于中国的铺丝机
科技数码
全国五一劳动奖章获得者聂海平:突破国外技术壁垒 用代码“敲”出属于中国的铺丝机

封面新闻记者 邹阿江 图由航空工业成飞提供 2026年“五一”国际劳动节前夕,航空工业成飞的技术专家聂海平,荣获了一枚全国五一劳动奖章。 消息传来,身边同事都说,“大师”拿奖是实至名归。可聂海平自己呢,还是那副老样子——摆摆手,说自己不过是个普通人,幸运地站在一个好平台上,干着点自己感兴趣的事儿罢了

热心网友
05.01
每天3小时就够了,技术大牛:在AI时代坚持8小时工作制,你不是在努力,是在自杀
业界动态
每天3小时就够了,技术大牛:在AI时代坚持8小时工作制,你不是在努力,是在自杀

编辑 | 王凤枝 “AI时代,每天干3个小时就足够了。” 这句话出自前亚马逊资深工程师、技术大牛史蒂夫·雅吉(Steve Yegge)之口,算得上是对当前AI狂热的一剂清醒剂。 当整个行业都在为“10倍提效”而欢呼雀跃时,雅吉却点出了一个被普遍忽视的代价:在AI的高强度辅助下,程序员的产出固然爆炸式

热心网友
04.22
你的代码为什么又长又乱?可能是函数没用好
业界动态
你的代码为什么又长又乱?可能是函数没用好

一、概述 每天重复相同的操作,是不是感觉有点枯燥?比如,你每天都要煮饭,得经历洗米、加水、按下煮饭键这三步。如果每次都要从头到尾念叨一遍这个过程,那可就太费劲了。 别担心,函数就是来拯救你的。在Python的世界里,函数就像一个“一键煮饭”的智能按钮。你只需要把那些重复的步骤打包成一个固定的“命令”

热心网友
04.22
Pandas 精通十:透视表/交叉表实战,复杂数据汇总一键搞定
业界动态
Pandas 精通十:透视表/交叉表实战,复杂数据汇总一键搞定

吃透Pandas两大“数据汇总神器”:透视表与交叉表实战指南 在数据处理的工具箱里,如果说基础的清洗、筛选是基本功,那么多维度、交叉式的数据汇总,往往就是区分新手与熟手的分水岭。面对诸如“按地区加品类统计销售额”、“分析不同省份的商品订单分布”这类需求,如果还停留在手动分组、多层循环的老路上,不仅代

热心网友
04.22

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

机器人通用大脑如何实现这家公司给出创新方案
业界动态
机器人通用大脑如何实现这家公司给出创新方案

旧金山初创公司PhysicalIntelligence致力于为机器人打造通用“大脑”,以解决莫拉维克悖论。公司通过海量数据与算法训练,使机器人掌握叠衣、制作咖啡等复杂技能,并展现泛化能力。投资人看好其团队与进展,目标是将人类从枯燥危险的劳动中解放,企业级应用已可见曙光。

热心网友
05.14
索塔无界创始人再创业 押注机器人大脑出海新机遇
业界动态
索塔无界创始人再创业 押注机器人大脑出海新机遇

开普勒前CEO胡德波二次创业,成立索塔无界,聚焦研发具身智能“大脑”。公司以世界动作模型为核心,旨在让机器人理解并预测物理世界。目前从欧美商超分拣场景切入,计划结合中国供应链优势,提供涵盖硬件、部署的完整解决方案,以满足海外市场对机器人替代劳动力的需求。

热心网友
05.14
2026年Web3交易平台十大排名与最新权威榜单解析
web3.0
2026年Web3交易平台十大排名与最新权威榜单解析

2026年Web3交易平台格局呈现多元化发展,头部平台在安全、资产与用户体验上持续领先。去中心化交易平台(DEX)在交易深度与跨链互操作性方面取得突破,聚合器服务优化了交易路径。新兴平台凭借细分领域创新获得关注,而合规与安全已成为用户选择的核心考量因素。未来,平台竞争将更侧重于技术整合与生态构建能力。

热心网友
05.14
2026年Web3交易平台十大排行推荐与深度评测分析
web3.0
2026年Web3交易平台十大排行推荐与深度评测分析

本文梳理了2026年Web3交易平台的格局,重点分析了几个具有代表性的平台。内容涵盖去中心化与中心化混合型平台、纯去中心化交易所以及新兴的跨链聚合器,分别探讨了它们在安全性、流动性、用户体验和创新功能方面的优势与潜在不足,旨在为用户提供多维度的选择参考。

热心网友
05.14
2026年Web3交易平台最新排名与深度评测指南
web3.0
2026年Web3交易平台最新排名与深度评测指南

本文梳理了2026年Web3交易平台的格局,从去中心化交易所、聚合器与跨链平台、新兴趋势与挑战三个维度进行分析。重点探讨了DEX在流动性、用户体验与合规方面的进展,聚合器如何优化交易路径,以及跨链技术的成熟度。同时,也审视了平台面临的监管、安全与可持续性等核心挑战,为理解未来交易生态提供参考。

热心网友
05.14