2025 年 2 月 12 日,计算机科学教授 Sally A. McKee 在美国南卡罗来纳州 Greenville 因短暂疾病去世,享年 61 岁。

很多人记住她,不是因为一台机器,也不是因为一场发布会,而是一个词:memory wall,内存墙。

这个词来自 1994 年她在博士生时期合著的论文《Hitting the Memory Wall: Implications of the Obvious》。三十年过去,AI 训练、推理、高性能计算、数据中心芯片仍在和同一件事较劲:芯片越来越能算,数据却没那么容易喂进去。

她是谁:一位学者,和一个被说清的瓶颈

Sally A. McKee,1963—2025,计算机科学教授。

她本科毕业于 Yale University,硕士毕业于 Princeton University,博士毕业于 University of Virginia,专业都是计算机科学。她曾在 Digital Equipment Corporation、Microsoft 工作,也曾在 DEC Systems Research Center 和前 AT&T Bell Laboratories 实习。

后来,她任职于 Oregon Graduate Institute、University of Utah、Cornell University、瑞典 Chalmers University of Technology,以及 Clemson University。到 2021 年前,她是 Clemson University 的 C. Tycho Howle Chair in Collaborative Computing Environments,也曾受聘负责协作计算相关中心。

把关键事实压成一张卡片:

问题信息
她是谁Sally A. McKee,计算机科学教授,1963—2025
何时去世2025 年 2 月 12 日,因短暂疾病去世,享年 61 岁
最被记住的贡献1994 年博士生时期合著《Hitting the Memory Wall: Implications of the Obvious》
不能误写成什么不能说她是唯一发现“内存墙”问题的人
更准确的说法她因合著论文和“memory wall”术语的传播被长期记住
研究方向协作计算、网络安全、内存系统等
悼念里反复出现的词慷慨、幽默、直率,支持学生和女性计算机科学家

这里要把分寸放准。

McKee 不是神话里的“唯一发明者”。内存访问跟不上处理器速度,这个问题在体系结构里不是凭空冒出来的。她和合作者的重要性,在于把一个长期瓶颈用足够锋利、足够好传播的方式说了出来。

她本人也最以这篇文章为傲。

这类贡献很容易被低估。因为它不炫目,没有发布会镜头,也不像产品那样能被立刻买到。但工程世界里,命名常常是转向的开始。

内存墙不是容量问题,而是数据搬运问题

内存墙最容易被误解成“内存太小”。

不是。

它指的是处理器计算能力增长很快,但内存访问延迟、带宽和数据搬运成本没有同步追上。芯片可以更快地算,数据却不能同样快地送到计算单元旁边。

一句话:算力在前面跑,内存在后面追,系统中间开始堵车。

1994 年那篇论文的副标题叫 “Implications of the Obvious”——“显而易见之事的后果”。这句话很硬。很多瓶颈不是没人看见,而是看见了也容易被局部优化遮住。

缓存能缓解问题,但缓存不是墙本身。墙在更深处:计算和数据供给之间的结构性失衡。

今天看 AI 硬件,这个判断没有过时。GPU、加速器、HBM、片上互联、Chiplet、近存计算、数据中心网络,表面是不同赛道,底层都在回答同一个问题:怎么让数据更快、更便宜、更少折腾地靠近计算。

对几类读者,这件事不是怀旧。

读者真正受影响的点更现实的动作
体系结构研究者单纯堆计算单元不够,内存层级、带宽、能耗仍是硬约束选题要继续盯数据路径、内存系统、互联和软硬协同
AI 硬件与数据中心团队推理成本、吞吐、延迟,很多时候卡在数据搬运而非峰值算力采购和架构评估不能只看算力指标,要看带宽、内存容量、互联和实际工作负载
高性能计算开发者程序跑不满硬件,常常不是代码“不努力”,而是访存模式不配合优化重点会落到数据布局、局部性、通信和内存访问模式
科技史读者技术转折不总是由产品命名,也会由瓶颈命名看行业叙事时,要分清“更快的机器”和“真正限制机器的东西”

这也是为什么很多团队会在硬件采购、模型部署和系统优化上变得更谨慎。峰值算力好看,但账单不会只按峰值算。

模型参数越来越大,token 吞吐要上去,推理成本要下来,最后都要回到数据搬运。算力叙事很性感,内存和带宽才是账本。

这里也有现实限制。

不能把所有 AI 成本问题都塞进“内存墙”一个词里。模型结构、软件栈、调度、网络、能源、业务负载都会影响结果。内存墙不是万能解释。

但它至少提醒一件事:如果一个系统的宣传只讲算力,不讲数据怎么进出,那它多半还没把最难的账摊开。

命名瓶颈,也是一种技术贡献

我更在意的,不是“memory wall”后来有多流行,而是它说明了一种行业常识:真正改变计算机行业的,常常不是更响亮的产品发布,而是有人提前把长期瓶颈说准。

技术圈喜欢庆祝“做出来”。芯片发布、模型刷新、系统上线,热闹、具体、可传播。

但工程路线很多时候先被问题牵引。

像铁路时代,瓶颈不只在火车跑多快,也在枢纽、调度和运力组织。电力时代,难点不只在发电,也在输电、负载和调度。类比不完全一样,但结构相近:瓶颈一旦被命名,资源、论文、预算和人才就会重新排队。

“名不正,则言不顺。”放在技术史里也成立。

瓶颈没有名字时,它只是项目里的麻烦;有了名字,它才变成行业必须面对的议题。

这也是 McKee 的位置。她留下的不是一个孤立术语,而是一种看问题的方式:不要只盯最快的那一段,要看整条链路哪里开始失衡。

接下来该观察什么,也不复杂。

看 AI 硬件,不要只看新芯片报了多少算力。更该看三件事:内存带宽有没有跟上,数据搬运能耗有没有下降,真实负载下吞吐和延迟有没有改善。

看高性能计算,也别只看排行榜。更该看应用能不能吃到硬件能力,编程模型和内存层级有没有让开发者少受折磨。

看学术人物,则要少一点“谁发明了一切”的英雄叙事。很多关键贡献并不是独自创造世界,而是把世界已经疼了很久的地方准确指出来。

McKee 的讣告和悼念留言里,还有另一面不能删。

人们反复提到她的慷慨、幽默、直率,提到她支持研究生,帮助女性计算机科学家,也提到她爱巧克力、会做饭、愿意照顾朋友和动物。

这些不是边角料。

学术共同体不是靠论文编号自己运转的。它靠导师、合作者、会议里的直话、年轻人低谷时的一把支撑,也靠那些愿意把机会递出去的人。

如果只把 McKee 写成“内存墙”三个字,反而把人写窄了。技术史有冷的一面:概念、架构、性能曲线。也有热的一面:学生、朋友、同事,以及一个人如何在系统里留下位置。

这篇讣闻真正提醒我的,是科技行业的记忆太偏爱喧哗。

发布会会过去,参数会刷新,产品会退场。可有些词会留下来,继续约束后来者的想象力。

内存墙就是这样的词。

墙还在。有人继续造更快的机器,有人继续找绕墙的路。McKee 做过的事,是让这堵墙不再只是工程师心里的一声叹气,而变成了行业共同承认的问题。