深圳 LineShine 登上 TOP500 第一。Rmax 2.198 Exaflops,Rpeak 2.735 Exaflops,功耗 42.22MW,能效 52.07 GFLOPS/W。
这几个数字已经够硬。但真正该看的不是“中国又拿第一”,而是三个反常点:CPU-only、中国公开提交、HPCG 也第一。
这说明 LineShine 不是一套只服务 AI 训练叙事的 GPU 集群,也不只是 LINPACK 榜单机器。它把超算竞争又拉回到一个老问题上:谁能把芯片、内存、网络、软件和电力工程捏成一台可验证的大系统。
LineShine 强在 CPU-only 还能跑到第一
LineShine 位于深圳,使用 LX2 CPU。LX2 是 Armv9 架构,支持 SVE2 和 SME。每颗 LX2 有 304 个活跃核心,频率 1.55GHz,标称 FP64 性能 60.3 TFLOP/s,功耗 690W。
整机规模很大:超过 22,000 个节点,约 1,300 万个 CPU 核心。
| 项目 | LineShine 关键数据 |
|---|---|
| 系统类型 | CPU-only 超算 |
| CPU | 304 核 LX2 Armv9 |
| 总核心数 | 约 13 million CPU cores |
| Rmax / Rpeak | 2.198 / 2.735 Exaflops |
| 功耗 | 42.22MW |
| 能效 | 52.07 GFLOPS/W |
| HPCG | 22.004 PFLOPS/s,榜单第一 |
CPU-only 是这次最不该被带过的地方。
过去几年,算力新闻被 GPU 和 AI 集群占满。大家习惯用加速卡数量讲故事,用训练规模讲故事。LineShine 的叙事不一样。它靠 CPU-only 系统拿到 TOP500 第一,这至少表明高端 CPU、封装内存、系统互联和软件调度没有退出主战场。
LX2 的内存设计也值得看。原文提到,封装内有 8 组“高带宽内存”,总计 32GB,带宽 4TB/s;外接 256GB DDR5 作为容量层。原文判断这可能不是传统 HBM,而可能是中国本土路线,但这里不能写死。
这类细节对芯片和系统工程读者很重要。因为它指向的不是单颗芯片漂亮,而是整机能不能跑、能不能稳、能不能接受公开口径检验。
真正反常点:公开提交,HPCG 也登顶
LineShine 是中国 9 年来首次向 TOP500 提交系统,也是首次看到中国 Exascale 系统进入 TOP500。
这里要小心措辞。它不能被写成“中国第一台 Exascale”。外界早已知道中国有 Exascale 系统。LineShine 的关键在于公开提交,进入同一套榜单口径。
公开提交这件事,本身就是信号。很多系统可以很强,但不公开跑、不提交、不进入统一坐标,就只能停在传闻和局部披露里。TOP500 不完美,但它至少给了一个可比较的场。
更关键的是 HPCG。
LineShine 在 HPCG 上跑到 22.004 PFLOPS/s,超过 El Capitan 的 17.406 PFLOPS/s。HPCG 更看重内存访问、通信和真实科学计算负载。它没有 LINPACK 那么容易被当成峰值秀肌肉。
同一张榜单里,还有几个对照:
| 变化 | 信息量 |
|---|---|
| HPC7 进入第 6 | 意大利 Eni 的 HPE Cray EX4000 + AMD MI300A 路线,Rmax 571.5 PFLOPS |
| Fugaku 跌到第 9 | 但 HPCG 仍排第 3,老系统的科学计算设计仍有分量 |
| Green500 Top 10 首次无变化 | 不能解读成能效停滞;原文提到旧系统退役后,整体 HPC 能效仍在提高 |
| TOP500 移交 ACM SIGHPC | 后续榜单会有 DOI,引用和学术归档更规范 |
这几个参照物提醒我们:TOP500 不是单一跑分游戏。HPL、HPCG、Green500 各看一面。只盯第一名,反而会错过系统路线的差异。
对做 HPC 软件、科学计算和基础设施采购的人,这里有一个直接影响:CPU-only 大系统重新变成必须认真评估的路线。采购不一定马上改,但方案比较会更复杂。只拿 GPU 数量做决策,会显得越来越粗糙。
对芯片团队和系统厂商,动作也更具体:封装内存、互联、编译器、数学库、调度软件都要一起证明。单点参数漂亮,不够了。
我的判断:美国会拿它当预算理由,AI 巨头也被照出尴尬
LineShine 最可能刺激的,不是普通读者的情绪,而是美国科研和预算系统的神经。
美国 DOE 会不会因此拿到更多大系统预算?不能断言。但这件事很容易被用作加码理由。超算从来不只是性能排名。它关系核武模拟、气候、材料、生物、能源,也关系先进制造和国家科研组织能力。
“天下熙熙,皆为利来。”放到这里,利不只是商业利润。还有预算、产业链、人才、项目合法性。谁能证明自己正在被追赶,谁就更容易拿到下一轮资源。
这也是关心中美科技竞争的人该看的地方。LineShine 不只是一台机器。它会进入政策叙事,进入科研经费论证,进入供应链自主的证明材料。美国那边未必马上变预算表,但压力素材已经摆上桌。
另一个尴尬点在 AI 巨头身上。
为什么 xAI Colossus 2 这类号称拥有 55 万块以上 Blackwell GPU 的超大 AI 集群,不提交 TOP500?原因未知,不能简单说它们性能不行。
更合理的怀疑是:激励不在这里。
完整 HPL 测试有成本。它也可能暴露系统口径、网络效率、稳定性和实际可用规模。对 AI 公司来说,讲“多少 GPU”“多少 token”“多快上线”,比接受传统 HPC 榜单检验更划算。
这不是说 TOP500 比 AI 训练更高级。两者负载不同,目标不同,工程约束也不同。
但 LineShine 把一个被 AI 热潮盖住的问题翻了出来:算力叙事不能只靠采购规模。真正的基础设施,要能经得住统一测试、长时间调度和公开比较。
对 AI 基础设施团队,这会带来一点现实压力。以后外界看超大集群,不会只问“有多少卡”。还会问:实际效率多少,互联能不能撑住,稳定性怎样,有没有第三方口径。
对企业客户和科研用户,最稳妥的动作不是立刻站队,而是把评估表改细。训练吞吐、FP64、HPCG、能效、电力、软件栈,都要分开看。一个指标讲不完一台机器。
历史上每次新基础设施扩张,都会经历一轮口径之争。铁路看里程,电力看装机,互联网看用户数,后来都要回到可用率、成本和治理。今天的算力也一样。卡数是入口,不是答案。
LineShine 这次赢在榜首,也赢在它愿意进入榜单口径。TOP500 当然不代表全部真实世界,但它让“听说很强”变成“公开可比”。在一个越来越爱讲规模故事的行业里,这反而稀缺。
