AI 数据中心的扩张,正在把存储市场的紧张传导到互联网记忆的保存现场。404 Media 报道称,过去数月,消费级和企业级 SSD、硬盘、内存价格明显上涨,部分型号缺货,Internet Archive、Wikimedia Foundation、学术归档项目和个人数据收藏者都开始调整采购和保存策略。

这条新闻的重点不在“硬盘又涨价了”。更关键的变化是,训练和运行 AI 所需的数据中心正在与公共知识基础设施争夺同一批硬件。前者有企业级预算和长期订单,后者依赖捐赠、年度预算和旧设备维护。市场一紧,承压的往往是后者。

存储涨价正在传导到互联网归档项目

Internet Archive 创始人 Brewster Kahle 对 404 Media 表示,存储成本上涨已经“真实地耗费时间和金钱”。该机构每天新增超过 100TB 材料,现有存档超过 210PB,还要持续升级和维护承载这些资料的机器。它偏好的 28TB 至 30TB 硬盘,如今要么难买,要么价格很高。

Wikimedia Foundation 也称,自 2025 年底以来,存储和内存价格上涨已经影响其服务器交付周期和未来下单能力。维基百科已有超过 6500 万篇条目,Wikimedia Commons 还承载大量自由版权媒体。它不是云服务商,却必须像基础设施公司一样维护数据中心。

机构或群体直接变化现实影响
Internet Archive28-30TB 硬盘难买或高价新增归档和旧机器维护成本上升
Wikimedia Foundation内存、硬盘涨价,服务器交付变慢硬件投资优先级被重新排序
学术归档项目RAM、SSD 刷新成本上升服务器扩容计划被压缩或推迟
个人数据收藏者大容量硬盘难以下手暂停下载、延长旧盘寿命、减少备份保留

这里有一个容易被忽略的限制:归档机构需要的不是随便一块便宜硬盘。大规模存档看重容量、可靠性、可替换性、机架密度和维护成本。容量段一旦被企业客户提前锁走,小机构很难靠“换个型号”完全解决问题。

AI 同时带来硬件短缺和抓取封锁

存储紧张并不能全部归因于 AI,供应链、产品周期和企业采购节奏都会影响价格。但原文给出的行业信号很清楚:AI 数据中心需求是核心驱动之一。Western Digital 已表示,其 2026 年库存基本被企业客户买走,其中许多客户运营数据中心。Micron 则宣布退出 Crucial 消费业务,把资源转向数据中心等增长更快的战略客户。

这与过去加密货币热潮推高 GPU 价格有相似处。区别在于,显卡涨价主要影响游戏玩家、开发者和小型算力用户;这轮存储紧张波及的是“保存”这件事本身。互联网归档不像游戏帧率,可以先降画质凑合。一个网页、一份政府文件、一次媒体改版,错过窗口就可能永远消失。

AI 还制造了第二层压力。许多网站为了阻止 AI 公司抓取内容,设置登录墙、修改 robots.txt、封锁爬虫。一些网站有意或误伤了 Internet Archive 等归档机器人。EFF 曾提醒,封锁 Internet Archive 阻止不了 AI,却会抹掉网络历史记录。这里的矛盾很现实:网站防 AI 有正当性,但粗暴封锁会把公共归档也挡在门外。

非营利和个人档案者只能先收缩策略

受影响最直接的是预算弹性小的人。北得克萨斯大学教授 Mark Phillips 参与的 End of Term Archive 会在美国总统换届期间保存政府网站。他说,近期服务器刷新时,RAM 和 SSD 成本明显上升,团队不得不重新考虑原本希望配置的容量。

个人档案爱好者的选择更窄。Reddit 的 r/DataHoarder 社区里,有人暂停购买新硬盘,只维护现有数据;有人改用旧的小容量盘;也有人开始压缩备份保留周期。这些动作听起来琐碎,却反映了数字保存的底层现实:归档不是按一次按钮,而是长期付电费、买硬盘、换坏盘、迁移格式。

接下来最该看三件事:大容量 HDD 和企业 SSD 的供货是否继续被长期订单锁定;Wikimedia、Internet Archive 这类机构能否获得厂商支持或更稳定的采购渠道;网站反爬规则能否区分 AI 训练爬虫和公共归档机器人。现在还看不清价格何时恢复,也不能断言这些机构陷入财务危机。但可以确定的是,互联网记忆的保存成本已经被 AI 基础设施竞争抬高了。