输入一个名字,In the Weights 会问一圈大模型:这个人是谁?
如果 Grok、Gemini、GPT、Claude、Llama 等模型在不联网的情况下能说出一些描述,网站就把相似回答聚类,再给出一个 strength score。分数越高,看起来越像“AI 更记得你”。
这件事有意思的地方,不是它终于发明了一个可靠的影响力榜单。恰好相反,它暴露的是另一个变化:当搜索入口从 Google 转向大模型,“我能不能被 AI 认出来”,开始变成新的虚荣搜索。
它怎么给一个名字打分
In the Weights 的做法并不复杂。
用户输入名字后,网站会向多个模型提问,要求模型回答“某人是谁”,并给出简短描述和置信度。网站再把相近描述归到一起,生成一个 strength score。
TechCrunch 作者 Anthony Ha 的页面显示,他得了 641 分,位列前 6%。报道当时,榜单前列包括《小鬼当家》演员 Macaulay Culkin、歌唱家 Luciano Pavarotti 等知名人物。
结果页还会显示哪些模型识别了这个名字,也会标注可能的幻觉。这个设计很关键:模型开口回答,不等于它答对了。
| 你看到的结果 | 它实际说明什么 | 不能推出什么 |
|---|---|---|
| 某个模型识别了名字 | 模型在当前提示下生成了相关描述 | 不能证明训练集中一定有这个人 |
| strength score 较高 | 多个模型给出较一致的回答 | 不能等同于真实影响力排名 |
| 页面标注幻觉 | 网站承认回答可能有错 | 不能把错误描述当人物资料 |
| 榜单出现名人 | 知名人物更容易被模型说出来 | 不能说明榜单有完整代表性 |
所以,In the Weights 更像一个可比较的 AI 记忆小游戏。它有信号价值,但不是身份认证。
这也是最容易误读的地方。
大模型的训练来源、数据清洗、更新节奏,外部用户都看不见。一个名字被模型说出来,可能来自公开资料,也可能来自同名混淆、统计联想,甚至是幻觉。把这些回答直接折算成“我有多重要”,步子就迈大了。
为什么它击中了 AI 时代的虚荣搜索
Thomas Dimson 和 Joey Flynn 不是随手蹭热点的外行。
他们曾在 OpenAI 工作。此前,两人创办的设计创业公司 Global Illumination 被 OpenAI 收购。离开 OpenAI 后,Dimson 对 TechCrunch 说,他们想重新激发创作状态,也在思考一个问题:到 2026 年,再做 Google 式虚荣搜索,可能已经不是正确目标。
原因很直接。越来越多流量正在转向大语言模型。
过去,公众人物、创作者和媒体人会搜自己的 Google 结果,看新闻收录、维基百科、社交平台排名。现在,多了一个新动作:问 ChatGPT、Claude 或 Gemini 知不知道我。
这个变化不大声,但很实际。
对科技媒体人和独立创作者来说,下一步可能不是立刻追分数,而是检查几件事:公开简介是否一致,权威页面是否清楚,同名人物是否容易混淆,模型是否把作品、身份、机构写错。
对公关和品牌团队来说,它可能变成一种新的监测项。过去看搜索结果页,现在还要看大模型默认回答。不是为了把 In the Weights 当 KPI,而是为了提前发现错误归因、旧信息残留和身份混淆。
这里可以想起 Klout。
Klout 曾试图用社交网络数据给人算“影响力分”。它的问题是指标粗糙,还会诱导用户为分数而行动。In the Weights 更轻,也更像玩具,但心理机制相近:把模糊的社会存在感压成一个数字,让人忍不住比较。
差别在于,Klout 至少看的是公开社交行为。In the Weights 看的是模型权重里吐出的回答。
前者还能追到一些互动数据,后者更像隔帘听音。你听见了回声,但不知道墙后面到底有什么。
分数好玩,但最该观察三件事
Dimson 说,网站上线后的反应超出预期。他认为,这和人们想知道自己是否会被“超级智能”记住有关。
这个说法有点夸张,但心理是真实的。
人很难拒绝一个关于自己的分数。尤其是这个分数还披着 AI 的外衣,看起来像来自未来的点名册。
问题在于,分数越容易传播,误读成本越高。
最该观察的不是谁冲到榜首,而是三件更具体的事。
| 观察变量 | 为什么重要 | 对谁影响最大 |
|---|---|---|
| 模型是否稳定识别同一个人 | 同一名字在不同模型、不同版本里可能变化 | 创作者、媒体人、创业者 |
| 幻觉和同名混淆有多常见 | 错误身份可能被搜索、引用和转述放大 | 公关团队、公众人物 |
| 外部机构会不会引用这类分数 | 一旦进入招聘、投资、邀约或合作判断,玩具就会变成成本 | 品牌、公关、内容团队 |
目前看,In the Weights 只能说明模型回答了什么。它不能解释模型为什么这样回答,也不能证明一个人的真实影响力。
更现实的用法,是把它当体检表的一小项。
如果你是创作者或科技媒体人,可以用它查错:模型是否认错人,是否漏掉主要身份,是否把旧经历写成现在状态。发现问题后,能做的也不是“优化权重”,而是把公开资料整理得更一致,比如官网简介、机构页面、作者页和权威资料不要互相打架。
如果你是公关或品牌负责人,也不该把 strength score 写进战报。更靠谱的动作,是定期抽查主流模型对核心人物和品牌的回答,记录错误类型,再决定是否补充公开资料或调整说明口径。
分数可以看。
但别跪着看。
当 AI 成为新的搜索入口,被模型“记住”会越来越像一种软资产。可它仍然不是青史,也不是盖章。它只是模型在某一刻、某一组提示下给出的回声。
回到开头那个问题:你的 In the Weights 分数是多少?
真正该问的也许是另一句:如果模型记错了你,谁会替你付成本?
