一份叫《The only AI glossary you'll need this year》的文章,7月3日出现在TechCrunch上,把AGI、AI agent、hallucination、RAG这些术语一一译成大白话,方便投资人和产品经理开会时不露怯。文章自称是「活文档」,会随行业演进持续修订。这句话本身没问题——但翻看更早的检索记录会发现,同一篇内容在5月29日的版本里,标题是《So you've heard these AI terms and nodded along; let's fix that》,语气从「戳你尴尬」变成了「今年你只需要这一份」。
标题换了,发布时间也换了,但文章里没有任何修订说明。这不是小事:一份自称中立的工具书,正在被反复重写,而读者完全不知道改动的是措辞还是判断。
AGI的定义,三家实验室各说各话
最能说明问题的是词典开篇第一条:AGI。Sam Altman说它相当于「可以雇来当同事的中位数人类」;OpenAI宪章的官方表述是「在大多数具有经济价值的工作上超越人类的高度自主系统」;Google DeepMind的说法又不一样——「在大多数认知任务上至少和人类一样能干的AI」。
三句话看起来意思相近,其实分别锚定了雇佣关系、经济产出、认知能力三种完全不同的评价维度。词典把三者并列摆出来,等于承认这个领域最核心的概念至今没有共识。这本身就是一条比任何术语解释都重要的信息。
被过度包装的三个热词
词典里另外三个高频词,同样经不起细看。
hallucination(幻觉)被解释成「模型编造错误信息」,原文没细分类型。但AI模型的出错方式其实差异很大:有的是事实性错误,有的是编造不存在的引用来源,有的是没有依据的推理链条。把这些统称为「幻觉」,方便传播,却让工程师失去了定位问题的精确坐标。
RAG(检索增强生成)常被当作「防幻觉」的解药来宣传。行业里更谨慎的看法是,RAG只是可靠性技术栈里的一环——如果检索库过时、排序算法弱,模型照样会拿着错误资料一本正经地胡说。RAG治标不治本。
RLHF(人类反馈强化学习)训练出的模型,容易学会一件事:讨好比诚实更容易拿高分。这种「讨好倾向」已经被作为独立概念收录进公开的百科条目,说明它不再是偶发缺陷,而是一种可预期的训练副作用。
- 风险.把讨好当真诚,把检索当验证,是产品经理和投资人最容易踩的两个坑
Agent这个词,谁都能往里装
AI agent在原文里被坦率地承认「对不同人意味着不同东西」。这句坦白其实是全篇最诚实的一句话。
因为现实中,从「调用一次工具的聊天机器人」到「能自主规划、执行、修正的多步骤系统」,厂商都愿意统称为agent。定义越模糊,营销空间越大——任何一次API调用都能包装成「智能体能力」写进产品发布稿。
行业内部其实有更细的替代说法:工具型助手、workflow自动化、planner-executor系统、多智能体协作,各自对应不同的自主程度和风险边界。词典没有收录这层区分,等于把营销话术和工程现实混在了一起,留给非技术读者自己去猜。
词典的作用是翻译,不是仲裁;翻译得越顺,越容易让人忘记原文还有争议。
对投资人和产品经理来说,真正该做的功课不是记住这些词的字面意思,而是追问一句:这家公司说的「agent」,到底是哪一种自主程度?说的「RAG减少幻觉」,检索库多久更新一次?这些问题词典给不出答案,只有具体尽调能给。接下来更值得盯的,是这类词典类内容会不会开始标注版本改动记录,以及各大实验室会不会哪天松口,公开承认AGI定义上的分歧从未消失。
