2025 年 2 月 12 日,计算机科学教授 Sally A. McKee 在美国南卡罗来纳州 Greenville 因短暂疾病去世,享年 61 岁。
很多人记住她,不是因为一台机器,也不是因为一场发布会,而是一个词:memory wall,内存墙。
这个词来自 1994 年她在博士生时期合著的论文《Hitting the Memory Wall: Implications of the Obvious》。三十年过去,AI 训练、推理、高性能计算、数据中心芯片仍在和同一件事较劲:芯片越来越能算,数据却没那么容易喂进去。
她是谁:一位学者,和一个被说清的瓶颈
Sally A. McKee,1963—2025,计算机科学教授。
她本科毕业于 Yale University,硕士毕业于 Princeton University,博士毕业于 University of Virginia,专业都是计算机科学。她曾在 Digital Equipment Corporation、Microsoft 工作,也曾在 DEC Systems Research Center 和前 AT&T Bell Laboratories 实习。
后来,她任职于 Oregon Graduate Institute、University of Utah、Cornell University、瑞典 Chalmers University of Technology,以及 Clemson University。到 2021 年前,她是 Clemson University 的 C. Tycho Howle Chair in Collaborative Computing Environments,也曾受聘负责协作计算相关中心。
把关键事实压成一张卡片:
| 问题 | 信息 |
|---|---|
| 她是谁 | Sally A. McKee,计算机科学教授,1963—2025 |
| 何时去世 | 2025 年 2 月 12 日,因短暂疾病去世,享年 61 岁 |
| 最被记住的贡献 | 1994 年博士生时期合著《Hitting the Memory Wall: Implications of the Obvious》 |
| 不能误写成什么 | 不能说她是唯一发现“内存墙”问题的人 |
| 更准确的说法 | 她因合著论文和“memory wall”术语的传播被长期记住 |
| 研究方向 | 协作计算、网络安全、内存系统等 |
| 悼念里反复出现的词 | 慷慨、幽默、直率,支持学生和女性计算机科学家 |
这里要把分寸放准。
McKee 不是神话里的“唯一发明者”。内存访问跟不上处理器速度,这个问题在体系结构里不是凭空冒出来的。她和合作者的重要性,在于把一个长期瓶颈用足够锋利、足够好传播的方式说了出来。
她本人也最以这篇文章为傲。
这类贡献很容易被低估。因为它不炫目,没有发布会镜头,也不像产品那样能被立刻买到。但工程世界里,命名常常是转向的开始。
内存墙不是容量问题,而是数据搬运问题
内存墙最容易被误解成“内存太小”。
不是。
它指的是处理器计算能力增长很快,但内存访问延迟、带宽和数据搬运成本没有同步追上。芯片可以更快地算,数据却不能同样快地送到计算单元旁边。
一句话:算力在前面跑,内存在后面追,系统中间开始堵车。
1994 年那篇论文的副标题叫 “Implications of the Obvious”——“显而易见之事的后果”。这句话很硬。很多瓶颈不是没人看见,而是看见了也容易被局部优化遮住。
缓存能缓解问题,但缓存不是墙本身。墙在更深处:计算和数据供给之间的结构性失衡。
今天看 AI 硬件,这个判断没有过时。GPU、加速器、HBM、片上互联、Chiplet、近存计算、数据中心网络,表面是不同赛道,底层都在回答同一个问题:怎么让数据更快、更便宜、更少折腾地靠近计算。
对几类读者,这件事不是怀旧。
| 读者 | 真正受影响的点 | 更现实的动作 |
|---|---|---|
| 体系结构研究者 | 单纯堆计算单元不够,内存层级、带宽、能耗仍是硬约束 | 选题要继续盯数据路径、内存系统、互联和软硬协同 |
| AI 硬件与数据中心团队 | 推理成本、吞吐、延迟,很多时候卡在数据搬运而非峰值算力 | 采购和架构评估不能只看算力指标,要看带宽、内存容量、互联和实际工作负载 |
| 高性能计算开发者 | 程序跑不满硬件,常常不是代码“不努力”,而是访存模式不配合 | 优化重点会落到数据布局、局部性、通信和内存访问模式 |
| 科技史读者 | 技术转折不总是由产品命名,也会由瓶颈命名 | 看行业叙事时,要分清“更快的机器”和“真正限制机器的东西” |
这也是为什么很多团队会在硬件采购、模型部署和系统优化上变得更谨慎。峰值算力好看,但账单不会只按峰值算。
模型参数越来越大,token 吞吐要上去,推理成本要下来,最后都要回到数据搬运。算力叙事很性感,内存和带宽才是账本。
这里也有现实限制。
不能把所有 AI 成本问题都塞进“内存墙”一个词里。模型结构、软件栈、调度、网络、能源、业务负载都会影响结果。内存墙不是万能解释。
但它至少提醒一件事:如果一个系统的宣传只讲算力,不讲数据怎么进出,那它多半还没把最难的账摊开。
命名瓶颈,也是一种技术贡献
我更在意的,不是“memory wall”后来有多流行,而是它说明了一种行业常识:真正改变计算机行业的,常常不是更响亮的产品发布,而是有人提前把长期瓶颈说准。
技术圈喜欢庆祝“做出来”。芯片发布、模型刷新、系统上线,热闹、具体、可传播。
但工程路线很多时候先被问题牵引。
像铁路时代,瓶颈不只在火车跑多快,也在枢纽、调度和运力组织。电力时代,难点不只在发电,也在输电、负载和调度。类比不完全一样,但结构相近:瓶颈一旦被命名,资源、论文、预算和人才就会重新排队。
“名不正,则言不顺。”放在技术史里也成立。
瓶颈没有名字时,它只是项目里的麻烦;有了名字,它才变成行业必须面对的议题。
这也是 McKee 的位置。她留下的不是一个孤立术语,而是一种看问题的方式:不要只盯最快的那一段,要看整条链路哪里开始失衡。
接下来该观察什么,也不复杂。
看 AI 硬件,不要只看新芯片报了多少算力。更该看三件事:内存带宽有没有跟上,数据搬运能耗有没有下降,真实负载下吞吐和延迟有没有改善。
看高性能计算,也别只看排行榜。更该看应用能不能吃到硬件能力,编程模型和内存层级有没有让开发者少受折磨。
看学术人物,则要少一点“谁发明了一切”的英雄叙事。很多关键贡献并不是独自创造世界,而是把世界已经疼了很久的地方准确指出来。
McKee 的讣告和悼念留言里,还有另一面不能删。
人们反复提到她的慷慨、幽默、直率,提到她支持研究生,帮助女性计算机科学家,也提到她爱巧克力、会做饭、愿意照顾朋友和动物。
这些不是边角料。
学术共同体不是靠论文编号自己运转的。它靠导师、合作者、会议里的直话、年轻人低谷时的一把支撑,也靠那些愿意把机会递出去的人。
如果只把 McKee 写成“内存墙”三个字,反而把人写窄了。技术史有冷的一面:概念、架构、性能曲线。也有热的一面:学生、朋友、同事,以及一个人如何在系统里留下位置。
这篇讣闻真正提醒我的,是科技行业的记忆太偏爱喧哗。
发布会会过去,参数会刷新,产品会退场。可有些词会留下来,继续约束后来者的想象力。
内存墙就是这样的词。
墙还在。有人继续造更快的机器,有人继续找绕墙的路。McKee 做过的事,是让这堵墙不再只是工程师心里的一声叹气,而变成了行业共同承认的问题。
