In the Weights 给名字打分：被 AI 记住，正在变成新的虚荣搜索

核心摘要 Summary

前 OpenAI 员工 Thomas Dimson 和 Joey Flynn 推出 In the Weights，用 Grok、Gemini、GPT、Claude、Llama 等模型测试一个名字能否在不联网时被识别，并生成 strength score。
这个分数不是权威影响力排名，更像 AI 搜索时代的“搜自己”：看模型是否会默认想起你。
最该在意它的，是创作者、科技媒体人和公众人物；最该警惕的，是把模型回声误读成真实声望。

输入一个名字，In the Weights 会问一圈大模型：这个人是谁？

如果 Grok、Gemini、GPT、Claude、Llama 等模型在不联网的情况下能说出一些描述，网站就把相似回答聚类，再给出一个 strength score。分数越高，看起来越像“AI 更记得你”。

这件事有意思的地方，不是它终于发明了一个可靠的影响力榜单。恰好相反，它暴露的是另一个变化：当搜索入口从 Google 转向大模型，“我能不能被 AI 认出来”，开始变成新的虚荣搜索。

它怎么给一个名字打分

In the Weights 的做法并不复杂。

用户输入名字后，网站会向多个模型提问，要求模型回答“某人是谁”，并给出简短描述和置信度。网站再把相近描述归到一起，生成一个 strength score。

TechCrunch 作者 Anthony Ha 的页面显示，他得了 641 分，位列前 6%。报道当时，榜单前列包括《小鬼当家》演员 Macaulay Culkin、歌唱家 Luciano Pavarotti 等知名人物。

结果页还会显示哪些模型识别了这个名字，也会标注可能的幻觉。这个设计很关键：模型开口回答，不等于它答对了。

你看到的结果	它实际说明什么	不能推出什么
某个模型识别了名字	模型在当前提示下生成了相关描述	不能证明训练集中一定有这个人
strength score 较高	多个模型给出较一致的回答	不能等同于真实影响力排名
页面标注幻觉	网站承认回答可能有错	不能把错误描述当人物资料
榜单出现名人	知名人物更容易被模型说出来	不能说明榜单有完整代表性

所以，In the Weights 更像一个可比较的 AI 记忆小游戏。它有信号价值，但不是身份认证。

这也是最容易误读的地方。

大模型的训练来源、数据清洗、更新节奏，外部用户都看不见。一个名字被模型说出来，可能来自公开资料，也可能来自同名混淆、统计联想，甚至是幻觉。把这些回答直接折算成“我有多重要”，步子就迈大了。

为什么它击中了 AI 时代的虚荣搜索

Thomas Dimson 和 Joey Flynn 不是随手蹭热点的外行。

他们曾在 OpenAI 工作。此前，两人创办的设计创业公司 Global Illumination 被 OpenAI 收购。离开 OpenAI 后，Dimson 对 TechCrunch 说，他们想重新激发创作状态，也在思考一个问题：到 2026 年，再做 Google 式虚荣搜索，可能已经不是正确目标。

原因很直接。越来越多流量正在转向大语言模型。

过去，公众人物、创作者和媒体人会搜自己的 Google 结果，看新闻收录、维基百科、社交平台排名。现在，多了一个新动作：问 ChatGPT、Claude 或 Gemini 知不知道我。

这个变化不大声，但很实际。

对科技媒体人和独立创作者来说，下一步可能不是立刻追分数，而是检查几件事：公开简介是否一致，权威页面是否清楚，同名人物是否容易混淆，模型是否把作品、身份、机构写错。

对公关和品牌团队来说，它可能变成一种新的监测项。过去看搜索结果页，现在还要看大模型默认回答。不是为了把 In the Weights 当 KPI，而是为了提前发现错误归因、旧信息残留和身份混淆。

这里可以想起 Klout。

Klout 曾试图用社交网络数据给人算“影响力分”。它的问题是指标粗糙，还会诱导用户为分数而行动。In the Weights 更轻，也更像玩具，但心理机制相近：把模糊的社会存在感压成一个数字，让人忍不住比较。

差别在于，Klout 至少看的是公开社交行为。In the Weights 看的是模型权重里吐出的回答。

前者还能追到一些互动数据，后者更像隔帘听音。你听见了回声，但不知道墙后面到底有什么。

分数好玩，但最该观察三件事

Dimson 说，网站上线后的反应超出预期。他认为，这和人们想知道自己是否会被“超级智能”记住有关。

这个说法有点夸张，但心理是真实的。

人很难拒绝一个关于自己的分数。尤其是这个分数还披着 AI 的外衣，看起来像来自未来的点名册。

问题在于，分数越容易传播，误读成本越高。

最该观察的不是谁冲到榜首，而是三件更具体的事。

观察变量	为什么重要	对谁影响最大
模型是否稳定识别同一个人	同一名字在不同模型、不同版本里可能变化	创作者、媒体人、创业者
幻觉和同名混淆有多常见	错误身份可能被搜索、引用和转述放大	公关团队、公众人物
外部机构会不会引用这类分数	一旦进入招聘、投资、邀约或合作判断，玩具就会变成成本	品牌、公关、内容团队

目前看，In the Weights 只能说明模型回答了什么。它不能解释模型为什么这样回答，也不能证明一个人的真实影响力。

更现实的用法，是把它当体检表的一小项。

如果你是创作者或科技媒体人，可以用它查错：模型是否认错人，是否漏掉主要身份，是否把旧经历写成现在状态。发现问题后，能做的也不是“优化权重”，而是把公开资料整理得更一致，比如官网简介、机构页面、作者页和权威资料不要互相打架。

如果你是公关或品牌负责人，也不该把 strength score 写进战报。更靠谱的动作，是定期抽查主流模型对核心人物和品牌的回答，记录错误类型，再决定是否补充公开资料或调整说明口径。

分数可以看。

但别跪着看。

当 AI 成为新的搜索入口，被模型“记住”会越来越像一种软资产。可它仍然不是青史，也不是盖章。它只是模型在某一刻、某一组提示下给出的回声。

回到开头那个问题：你的 In the Weights 分数是多少？

真正该问的也许是另一句：如果模型记错了你，谁会替你付成本？

In the Weights 给名字打分：被 AI 记住，正在变成新的虚荣搜索

AI记名

打分机制

强度分

幻觉标注

入口迁移

自搜升级

人群集中

分数误读

来源不透明

同名混淆

现实用法

资料一致

品牌监测

它怎么给一个名字打分

为什么它击中了 AI 时代的虚荣搜索

分数好玩，但最该观察三件事