一个 hackathon 原型,做了件很容易被误读的事:输入公众人物名字,小模型 agent 去公开网页找资料,整理成 persona,再回答 10 个开放问题。

反常点在这里:它不看答案对不对。它看回答的语气、立场、抽象程度、怀疑程度和推理习惯。换句话说,Persona Atlas 想测的不是“谁更聪明”,而是“谁更像某种说话方式”。

这比“复活名人”有意思,也危险得多。因为一旦风格能被量化,产品经理就会想把它塞进客服、教育、陪伴、写作助手里;用户也会很容易把一张热力图看成某种人格真相。

它把公众人物变成可比较的风格坐标

Persona Atlas 来自 Hugging Face build-small hackathon,是 Spaces 上的原型项目,不是 Hugging Face 官方成熟商业产品。

它的流程很短,产品味很重。

环节做了什么现实限制
网页研究agent 搜索公开网页,整理人物资料、来源事实和风格假设公开网页质量决定画像底座,同名噪声会污染结果
开放回答persona 回答 10 个开放式问题,涉及身份、伦理、真理、自由意志、意义、机器意识等没有标准答案,测的是回答姿态
空间比较把回答 embedding 成向量,用距离和 trait anchor 热力图比较结果是相对倾向,不是绝对人格分数

界面里有两类比较。

一类是群体距离数值。它看不同 persona 在 embedding 空间里离得多远。

另一类是十个 trait anchor 热力图。维度包括细致、清晰、创造性、怀疑、信心、善意、幽默、好奇、务实、抽象。

这里最容易看错。热力图是 double-centered。暖色不代表“这个人幽默值很高”,只代表在你放进来的这组 persona 里,它相对更偏向这个 trait。

所以它不是心理测评表。它更像一张对照地图。

技术栈也贴着 build-small 的主题走:小型 hosted model 驱动 agent,轻量 embedding 做几何比较,通过 Hugging Face Inference Providers 跑起来,前端用 Gradio。页面还能看 agent trace,知道它访问了哪些来源。

这点很重要。人格化 AI 最怕只给一段漂亮回答,却不告诉你它从哪儿来。

它删掉排行榜,是这次最正确的产品判断

Persona Atlas 早期有数学题、trivia 和排行榜,后来删了。

这个决定很对。

一道数学题答对了,说明底层模型会算,或者检索到了答案。它很难说明“某个公众人物式的思考风格”是否出现。

客观题测模型能力。开放问题才更接近 persona 风格。

路线看起来在测什么实际更可能测到什么适合谁
数学题、trivia、排行榜persona 是否聪明底层模型能力、检索质量、事实记忆模型评测
开放问题、embedding、热力图persona 如何表达和推理语气、立场、抽象程度、相对倾向人格化产品设计

这件事击中了人格化 AI 的老毛病。

过去很多产品说自己有“专家人格”“苏格拉底式提问”“乔布斯风格”。实际做法往往很薄:prompt 里塞几句形容词,冷静、幽默、批判、鼓励。听起来丰满,用起来发飘。

Persona Atlas 的聪明处,是把这种“飘”往可检查方向推了一步。

它不保证像谁。它至少让你看到:同一组问题下,不同 persona 的回答差异能不能呈现;差异落在哪些维度;来源链路能不能追到。

对 AI 产品经理来说,这会改变需求写法。

不要再只写“做一个温暖、专业、有同理心的助手”。更具体的动作是:先定义 5 到 10 个开放问题,再定义一组 trait anchor,然后比较不同 prompt、不同小模型、不同检索材料下的输出距离。

对开发者来说,也别急着换大模型。更该做的是把 agent trace、输入材料、embedding 版本、同日多次输出都记录下来。否则你看到的“人格差异”,可能只是一次采样波动。

我不太买账的是那种急着把 persona 包装成“数字分身”的说法。证据还不够。公开网页、单一模型、一次输出,撑不起这么大的词。

真正要观察的,是风格能不能稳定复现

我更在意的不是它能不能“还原苏格拉底”或“模拟丘吉尔”。这个目标本来就不诚实。

真正的问题是:小模型能不能承担一种新任务——不追求最强知识能力,而是稳定生成某种可比较的表达风格。

如果这个方向成立,最先受影响的不是心理学家,而是两类人。

一类是做客服、教育、写作、陪伴产品的团队。他们下一步不该立刻采购一套“人格系统”,而该先做小范围对照测试:同一批问题、同一批用户任务、不同 persona 输出,看看用户是否真的更愿意继续对话,是否更少误解,是否更快完成任务。

另一类是做企业知识助手的团队。他们要警惕“风格好”遮住“事实错”。企业场景里,语气稳定不等于答案可靠。采购可以延后一点,先要求供应商给出来源追踪、输出波动测试和 trait 解释方式。

接下来最该观察的变量,不是 demo 多好看,而是三件事:

  • 同一个 persona,隔天跑,坐标是否大幅漂移;
  • 换一批公开网页资料,trait 热力图是否明显改变;
  • 换一个小型 hosted model,风格差异还能不能保留。

如果这三件事都不稳,Persona Atlas 就更像一个好看的原型。能启发产品,但不能直接进严肃场景。

如果它们相对稳定,价值就出来了:小模型未必只能拼知识和推理,也可以拼“可控表达”。

但边界必须钉死。

公开网页不是人的内心。同名人物会混。网页材料有偏见。单一模型单日输出会波动。embedding 距离看起来精密,却不自动等于真实人格差异。

技术行业有个老毛病:只要能量化,就忍不住把它当真理。十九世纪有人用颅相学解释性格,今天那套东西已经站不住脚;但把复杂的人压成漂亮指标的诱惑,还在换皮重演。

Persona Atlas 好就好在,它目前承认自己照的是回答风格,不是灵魂深处。

产品可以聪明。营销不能装神。

小模型人格化的分水岭就在这里:能不能把“像不像”拆成可检查的过程、可比较的输出、可承认的误差。做到了,它是工具。忘了边界,它很快会变成玄学仪表盘。