首页 游戏 软件 资讯 排行榜 专题
首页
AI
Jeff Dean:性能依旧至关重要的五大深层原因

Jeff Dean:性能依旧至关重要的五大深层原因

热心网友
62
转载
2025-12-29


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新智元报道

编辑:倾倾

【新智元导读】很多人背着「过早优化是万恶之源」的名言,写出的却是处处漏风的代码。Google传奇Jeff Dean的这份笔记破了真相:性能不是最后调出来的,而是你在选第一个容器、敲第一行代码时,就已经注定的物理结局。

2025年,是个很容易让人产生错觉的时间点。

这时算力不再稀缺,云资源随叫随到,AI已经能写出准确无误的代码。

在这样的环境里,「性能」似乎正在悄悄贬值。因为代码写得慢一些,好像也没什么大不了。

就在这种氛围下,Google的传奇工程师Jeff Dean更新了一份老文档:Performance Hints。


比起一篇炫技的论文,它更像是一份老派工程师的随笔,里面重新整理了基础法则。

它反复重申一个事实:计算机底层的物理规则,从未因为云原生、AI或硬件的进步而改变。

硬件的进步掩盖了代码的低效,这些问题会在系统中不断堆积,直到成为无法绕开的成本。

「过早优化」,成了平庸代码的豁免权

所有工程师都听过一句老话:

Premature optimization is the root of all evil.(过早优化是万恶之源)。

它原本是提醒我们,别为了抠几行代码,把系统搞成一团乱麻。

但在实践中,这句话慢慢变了味,成了一个免责口令——只要遇到性能质疑,一句「别过早优化」就能把所有问题挡回去。

结果走向了另一个极端:写代码时,性能被整体忽略。抽象可以多一层,数据可以多拷贝一次,API可以写得更「通用」。


瑞士奶酪模型:单个小漏洞没事,但是一层层叠加,对齐了会出大事

大家总觉得将来有profiler,等真慢下来再说。

可等系统上线,流量涌入,响应开始变拖沓,大家终于打开性能分析图,却发现屏幕上什么都没有。

没有一个函数占掉40%的时间,没有明显的性能热点。你看到的只有一张异常平坦的火焰图——每一层都慢一点,每一个看似无关紧要的选择,都给未来埋下隐患。

你很难指出哪里出了错,因为问题从一开始就没有集中出现——这正是Jeff Dean反复强调的一种模式。

性能不是被某个错误决定拖垮的,而是被一连串「看起来没问题」的决策慢慢稀释掉的。


一旦走到这一步,优化会变得异常昂贵,因为你失去了明确的下手点。

所谓「关键的3%」,指的从来不是写完代码后再去抠字眼,而是在写第一行代码时,就要避开那些虽然方便、但明显低效的路径。

这不只是技巧,更像一种素养。真正拉开差距的地方,往往发生在profiler还没派上用场之前。

5ns和5ms之间,隔着整个物理世界

如果说前面的区别发生在「已经来不及了」,那么接下来要说的是:「为什么我们会在一开始就走错路」。

事实上,很多工程事故并不是因为「不会优化」,而是因为对「慢」没有感觉。

在编辑器里,5ns和5ms看起来只是多了几个0。缩进一样,语法一样,在Code Review时看起来合理合规。

但在物理世界,这些数字根本不属于同一个尺度。

Jeff Dean在清单里列出了一张延迟对照表。一旦把这些数字还原成现实中的时间,很多所谓的设计直觉会当场崩塌。

L1缓存命中:约0.5ns,等于微观世界里的一次脉搏。

分支预测失败:5ns,是连续十次脉搏。

主存访问:50ns,相当于起个身,走下楼,取了个外卖。

随机磁盘寻址:10000000ns,相当于从北京一路走到了上海。


最早由Google工程师整理,Jeff Dean在多次演讲中用过这个思路

如果你的方案里出现了一次磁盘寻址,后面无论代码写得多优雅、逻辑多漂亮,在物理尺度上都已经输透了。

这就是顶级工程师脑子里的「物理地图」。他们本能地知道:哪些操作属于同一量级,而哪些操作一旦混进来,系统的节奏就彻底乱了。

这也是「信封背面估算」(Back-of-the-envelope calculation)的价值所在。

它是一次动手之前的排查:这个方案会触发多少次内存访问?有没有隐藏的分配?循环里会不会撞上网络IO?

如果答案里出现了一个不合时宜的量级,这个方案就应该被扔进垃圾桶。

很多性能问题并非「实现得不够好」,而是选错了路径。

一旦建立起这种尺度感,很多无意义的争论就能一眼看穿。

反直觉的真相:Google大佬的代码为什么看起来很「土」?

真正拉开差距的地方,不在于「写得多聪明」,而在于知道哪些地方「不值得聪明」。

翻开这份Performance Hints,我们能发现一个反直觉的事实:没有复杂的算法,很多改动看起来都有点「土」。

但这些细碎的选择,却被Jeff Dean反复拿出来强调。

对内存的节制

「尺度感」让我们意识到分配内存的珍贵,在实战中,这种意识会转化成对容器的极致考究。

为什么他们偏爱InlinedVector?因为在绝大多数场景下,它根本不碰堆内存,数据直接躺在栈上。

这带来的是实实在在的物理收益:少一次分配,多一次缓存命中。

同样的,使用Arena(内存池)也不只是为了管理方便,而是为了让数据在物理内存上变得连续,顺应CPU缓存的节奏。

对数据分布的尊重

所谓的Fast Path(快路径),本质上是承认世界是不均匀的。99%的请求和输入都比想象中普通。

如果坚持让每一次调用都走那条「最通用、最保险」的路,实际上是在用极少数的边缘情况,绑架绝大多数的正常流量。


清单里提到的UTF-8处理就是一个典型:现实中大量字符串其实只有纯ASCII字符。

如果一上来就按完整的解析逻辑走,那每一个字节都在为万分之一的极端情况买单。

看一眼,是ASCII就直接放行——这种行为,建立在对数据规律的尊重之上。

对抽象成本的自觉

清单里举了个例子:把Protobuf逻辑改成原生结构体,性能提升20倍,让很多人不安。

Protobuf确实解决了跨语言和版本演进的难题,但便利从不是免费的,每一层封装、每一次解析,都是一笔隐蔽的「抽象税」。

就像在透支信用卡,你可以尽情购物,可一旦账单寄来,就要付出相应代价。


抽象并不会消失,只是被编译器展开,最终落实到一行行具体的实现上。

当抽象层数不断叠加,成本也会在底层被一并兑现。

这就是为什么他们建议在热路径里避开不必要的层级、避开那些「为了完整而完整」的设计。

目的是让你清楚地意识到,你到底在为什么付费。

顶级工程师关心的,从来不是如何写出最聪明的代码,而是如何避免那些本不该出现的开销。

当你在敲键盘时,能对分配、分布、抽象成本保持警惕,很多性能瓶颈在发生之前,就已经被挡在了门外。

想提高性能,就不能对代价视而不见

很多人把性能理解成一种阶段性的工作:系统慢了,就开始优化;不慢,就先放一边。

但读完这份清单,你很难再这样看待它。

Jeff Dean们反复强调的,其实不是「如何省下几纳秒」,而是「你是否真正理解自己正在使用的计算资源」。

CPU、内存、缓存、磁盘......这些底层的物理规律并没有因为云原生或AI的流行而消失,它们只是被包装得更抽象了。

顶级工程师之所以显得从容,是因为他们很少走到「火场」里:在写第一行代码时,他们就已经避开了那些注定昂贵的路径。

这份Performance Hints读起来不像教程,更像是一份肌肉记忆。它不要求你处处极限优化,而是要求你在做决策时,不要假装不知道代价。

也许真正的分界线一直是——当你写下一个循环、设计一个数据结构、决定要不要多加一层时,脑海中是否浮现出那张时间和尺度的地图。

一旦有了它,很多平庸的代码,你就再也写不下去了。

参考资料:

https://x.com/JeffDean/status/2002089534188892256?s=20

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

来源:https://www.163.com/dy/article/KHSOHP7T0511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Omdia:Win11换机成本压力下的美国PC市场明年增长3%
科技数码
Omdia:Win11换机成本压力下的美国PC市场明年增长3%

智通财经APP获悉,Omdia最新研究显示,2025年第四季度,美国PC出货量(不含平板)同比增长3%,达到1820万台,扭转了此前连续两个季度的同比下滑。这一增长主要得益于Windows 11商用

热心网友
03.31
苹果3月停产Mac Pro等14款设备,3款将无继任产品
礼仪与书信
苹果3月停产Mac Pro等14款设备,3款将无继任产品

IT之家 3 月 31 日消息,科技媒体 9to5Mac 今天(3 月 31 日)发布博文,指出苹果公司本月发布大量全新硬件的同时,也悄然下架多达 14 款旧设备,且 Mac Pro 等 3 款产品

热心网友
03.31
联想IdeaPad 5i 11代二合一笔记本,英特尔与AMD平台任选
礼仪与书信
联想IdeaPad 5i 11代二合一笔记本,英特尔与AMD平台任选

IT之家 3 月 31 日消息,联想现已在海外市场推出第十一代 Idea Pad 5i 二合一笔记本,可选英特尔 Panther Lake、AMD Gorgon Point 平台,最高可选配 32G

热心网友
03.31
存储芯片价格翻倍超黄金,汽车行业利润流向何方?
科技数码
存储芯片价格翻倍超黄金,汽车行业利润流向何方?

今年以来,或许没有比存储芯片更疯狂的市场了。“春节后整个市场的关注度都在车规级芯片。”多位车规级存储芯片分销商告诉21世纪经济报道记者,“涨完一波总要等市场消化,价格站稳了,终端市场才有下一步涨价动

热心网友
03.31
传长鑫获LPDDR6首发:性能飙升成行业焦点
电脑教程
传长鑫获LPDDR6首发:性能飙升成行业焦点

据硬件世界报道,有业内人士爆料,长鑫的LPDDR6已开始悄然送样,有望今年下半年全球首发量产。如果真成了,这将是国产存储厂商第一次全球首发主流旗舰产品!以当下存储需求和内存产品的迭代速度来看,LPD

热心网友
03.30

最新APP

你说我猜
你说我猜
休闲益智 03-31
史莱姆农场
史莱姆农场
休闲益智 03-31
凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29

热门推荐

小米SU7智能座舱升级:更自然对话与流畅车外交互
网络安全
小米SU7智能座舱升级:更自然对话与流畅车外交互

IT之家 3 月 31 日消息,小米新一代 SU7 已于本月(3 月 19 日晚)正式上市,售价 21 99 万-30 39 万元。小米新一代 SU7 的超级小爱迎来了全新升级,小米智能助手最新微博

热心网友
03.31
AO3官网可用地址与在线入口说明
电脑教程
AO3官网可用地址与在线入口说明

AO3镜像 当前可用地址为https: archiveofourown org ,另提供https: ao3 cubeart club 、https: xiaozhan ic

热心网友
03.31
QQ邮箱SSL加密设置方法:3步开启安全传输
手机教程
QQ邮箱SSL加密设置方法:3步开启安全传输

在网络环境日益复杂的今天,保障邮箱信息安全至关重要。qq邮箱提供了ssl加密功能,能有效提升邮件传输的安全性,防止信息被窃取或篡改。下面就来详细介绍如何开启qq邮箱的ssl加密。登

热心网友
03.31
望月天角色千里强度实测与玩法指南
游戏攻略
望月天角色千里强度实测与玩法指南

在望月天月市这个充满奇幻与神秘的地方,角色千里犹如一颗独特的星辰,散发着别样的魅力。千里拥有着出众的外貌。他有着一头乌黑亮丽的短发,总是显得精神抖擞。深邃的眼眸犹如夜空中闪烁的星辰

热心网友
03.31
张凌赫、田曦薇等众星发文告别《逐玉》
《逐玉》收官:张凌赫、田曦薇与众主演深情告别
娱乐
张凌赫、田曦薇等众星发文告别《逐玉》 《逐玉》收官:张凌赫、田曦薇与众主演深情告别

播得轰轰烈烈的《逐玉》,终于是会员大结局了。之前网传的庆功宴,也是没机会举办。《逐玉》这部剧,也是从开播就伴随着争议。直到最后大结局播出,观众都能感受到剧情的前言不搭后语,拿个6 8分都是抬高它了。

热心网友
03.31