纽约时报专栏作家Kevin Roose最近发表了一篇文章,核心观点是:门外汉借助AI就能开发应用程序,初级程序员甚至所有软件工程师迟早会被AI取代。这篇文章写得相当精彩,很可能成为周末的爆款。
然而,另一位专家马库斯却公开炮轰,认为Roose只是在重复别人的创意,贩卖焦虑,误人子弟。他警告说,如果孩子们信以为真不再学编程,美国科技业将万劫不复。
这场争论的导火索,是Roose的一次“编程实验”。
他并非程序员,连一行代码都不会写,但过去几个月里,他凭一己之力创作了4款应用:一个转录和总结长播客的工具、一个整理社交媒体书签的数据库、一个判断家具能否放进汽车后备箱的网站,以及一个名为LunchBox Buddy的应用程序——能分析冰箱内容,帮他为儿子准备午餐。
在他看来,这一切全靠AI对编程的“降维打击”。像他这样的门外汉,只要有想法,就能开发出想要的应用程序。

Karpathy推动新潮流
这股新趋势名为“自动编程”(vibe coding),由AI大佬Andrej Karpathy推广。简单来说,就是通过文本提示(prompt),让非技术用户直接创建完整应用和网站。不需要会写代码,只要有想法和耐心,人人都可以参与。
Karpathy在社交平台上形容:这根本不是真正的编程,只是看东西、说需求、跑代码、复制粘贴,但它大多数时候都能正常工作。

这意味着,每个人都能打造“个人专属软件”。AI工具极大地降低了开发门槛,让更多人实现自己的创意。用一两句话描述问题,强大的AI模型就开始构建定制工具——这种体验确实令人震撼,甚至会让Roose产生一种AI眩晕感,类似第一次使用ChatGPT时的感受。
他表示:“这也是向怀疑者展示当今AI能力的最佳方式——模型现在可以自动化大部分入门级别的编程任务,并且很快在其他领域可能实现类似的进展。”
过去一两年里,完全不懂编程的用户,利用一系列新工具,能像专业开发者一样创建软件。这些工具的工作原理大同小异:用户输入需求后,AI自动完成设计,选择合适的编程语言和软件包,开始构建产品。
对于非程序员来说,自动编程简直像魔法:输入一句描述需求,神秘的代码飞速滚动。几秒钟后,一个可运行的原型就出现了。用户可以进一步调整和修改,直到满意为止。整个过程可能几分钟,也可能数小时,取决于项目的复杂程度。
Roose使用bolt,开发了那款帮儿子打包午餐的应用。

AI在接收到指令后,迅速分析任务并拆解为多个组件,自动执行:生成基础网页界面、选择图像识别工具、开发推荐算法。大约10分钟后,AI自动命名的“LunchBox Buddy”应用成功生成。

初级程序员前途堪忧
现在,只要按几次按钮,Roose就构建了以前需要一个工程师团队才能完成的产品。他认为,这一过程充分展示了AI在软件开发中的强大能力。
当然,AI偶尔也会犯错。有一次,他为当地社区的轮胎店构建网站时,AI从该店的外卖平台编造了虚假评论。另一次,在将一篇长篇文章转化为互动网站时,AI只包含了大约一半的内容。
换句话说,自动编程仍然需要人类监督。它可能最适合业余项目,而不是关键任务。但这种情况可能不会持续太久:许多AI公司正在开发可以完全取代人类程序员的软件工程智能体。AI已经在竞争性编程测试中取得了世界级成绩,包括谷歌在内的几家大型科技公司,已经将许多工程工作外包给AI系统。
根据Anthropic的说法,2025年是人类优于AI的最后一年:“到2025年底,AI编程能力将达到非常高的水平,并可能在2026年底与最优秀的程序员相当。”
初级程序员最有可能被AI取代。Roose并非盲目乐观,但他认为,构建应用程序来自动化生活中烦人或耗时的任务,似乎是AI的一个好用途。所以他会继续利用自动编程——至少直到他孩子能自己打包午餐为止。

马库斯:纽约时报可真能吹
马库斯则认为,Roose的文章充分暴露了他根本不懂软件工程。文章聚焦AI在编程领域的应用,充满了理想化色彩,却有意无意地淡化了实现这一愿景面临的重重阻碍。坦率地说,这类文章很多都像是为大科技公司做营销,只会让科技寡头变得更强大。

Roose在文中描述了用AI工具开发应用的“令人震撼的体验”——仅用寥寥一两句话描述问题,AI便开始自动构建定制工具。这种描述让读者对AI编程的未来充满憧憬。然而,深入剖析细节,却发现许多严重问题。
代码和应用并非原创
从创新来看,Roose提出的从照片生成食谱的点子并非原创。网上早已存在大量拍摄冰箱照片并推荐食谱的代码库与教程,比如“深度美食”(deep-food)项目。他所使用的AI系统很可能是基于这些已有代码进行训练的。他似乎并未深入思考技术的原创性和独特性,只是在重复已有的成果,而忽略了编程中最关键的创新要素。


Roose不懂编程实际困难
其次,Roose对“二八法则”存在严重的误解。在AI领域,获得正确率达到80%的解决方案相对容易,但要实现最后的20%的精准度却异常困难。以汽车无人驾驶为例,几十年来一直面临这种困境。Roose虽然承认当前AI系统存在缺陷,却严重低估了实现更高精准度的难度。2023年,在他对聊天机器人的报道中,也犯了类似的错误,低估了“幻觉”问题的顽固性。新的研究表明,即使是最新的GPT 4.5系统,在标准化测试中仍有超过三分之一的输出结果存在“幻觉”现象。

AI编程中的代码错误,很可能会在未来数十年内持续存在。Roose从未真正编写过代码,所以缺乏对实际编程困难的认识。
调试与维护才是重头戏
编写代码只是第一步,调试代码以及长期维护代码才是更为艰巨的任务。对于非程序员来说,修复AI编写的代码更是难上加难。如果“午餐盒伙伴”的图像识别系统出现故障,用户将面临诸多困扰。而在自动电子邮件编写等场景中,代码错误可能造成更严重的后果。Roose却对调试和维护方面的挑战避而不谈,这无疑扭曲了AI编程系统的实际应用难度。
几乎任何一位专业人士都能指出,他所用的例子过于简单,根本无法有效测试AI编程能力。同时,他严重低估了调试及更复杂场景所需的工作量。很多专业程序员对Cursor AI等自动编程工具深感沮丧:
“我取消了Cursor订阅。在设计和构建UI及交互方面,它们并没有太大帮助。我发现自己浪费了大量时间,试图引导它们生成更好的内容。最终我总是感到沮丧和疲惫。我自己可以做得更好。”

科技作家Mayo Olshin一针见血地指出:“如果因为缺乏专业知识,或者不愿意仔细检查结果,而盲目信任AI的输出,那么长远来看,它所带来的危害,将远远超过短期内的生产力提升。”

盲目炒作、误人子弟
这种对AI的盲目炒作影响深远,尤其是教育领域。许多家长和教育工作者会对《纽约时报》中的观点深信不疑。这可能导致越来越多的人劝阻孩子学习编程——认为随着AI发展,学习编程已不再重要。然而,至少在未来一二十年甚至更长时间内,大型项目开发仍然离不开经验丰富的软件架构师。
如果这种不切实际的炒作导致孩子们对编程望而却步,科技发展将面临严重的人才短缺问题。曾经出现过类似情况:2016年,Geoff Hinton断言“我们现在就应该停止培训放射科医生,因为深度学习将在五年内超越他们”。九年过去了,数百家相关初创公司涌现,但至今没有一位放射科医生被完全取代。这充分说明,对技术发展的预测不能过于盲目乐观。
对自动编程技术的大肆炒作,很可能导致程序员短缺的困境。不加批判地鼓吹技术,实际上是在增强科技寡头的影响力,而社会最终将为此付出沉重代价。
