当 AI 开始替你和销售打擂台:GitHub 上这个小项目,想把企业采购从“听故事”变成“看证据”

一个不起眼的 GitHub 仓库,盯上了企业采购最痛的环节
GitHub 上最近出现了一个名叫 buyer-eval-skill 的公开仓库,来自 salespeak-ai。表面看,它只是一个给 Claude Code 使用的技能包,功能描述也很直白:帮助企业买方评估 B2B 软件供应商,包含领域专家式提问、与厂商 AI 代理对话、以及基于证据的评分机制。
但如果你在科技行业待得够久,就会知道这件事并不“小”。企业采购软件,尤其是 CRM、客服系统、安全产品、数据平台、财务系统这类 B2B 软件,向来是一个“信息极不对称”的世界。销售团队最擅长讲愿景,采购团队最怕踩坑,中间夹着一堆模糊的需求、漂亮的案例、精心设计的演示环境,以及那句熟悉得让人想叹气的话:“这个功能我们 roadmap 上有。”
这个项目的野心,就是把这场长期由销售主导的话语游戏,改造成一次更像尽职调查的流程。按照仓库介绍,它会先研究买方公司本身——行业、规模、技术栈、成熟度——而不是让用户先填一份十几页的表。然后它会抛出更接近领域专家的问题,帮助买方挖出那些自己原本都没意识到的隐性需求。接着,再设定预算、合规、集成能力等硬约束,先排除明显不合格的厂商,避免后面浪费时间。
光看到这里,我就已经能理解为什么这个项目会让不少懂行的人眼前一亮。因为现实里的企业软件选型,经常不是“不会比较”,而是“比较得太晚”。很多团队往往在和三家厂商开完四轮会议后,才想起来问:它真的支持我们现有的身份系统吗?它符合我们所在行业的监管要求吗?迁移成本到底谁承担?这类问题如果问晚了,前面的时间几乎都白花了。
它最有意思的地方,不是打分,而是“替买方追问”
根据仓库提交记录和说明,这个技能的核心能力包括七个维度的证据化评分、交叉验证厂商说法、输出对比建议,以及分析“隐藏风险”。更特别的是,它还会通过 Salespeak Frontdoor API 去和厂商的 AI 代理对话。翻译成人话就是:不是采购经理自己去听销售讲,而是让一个 AI 买方代表,先去和一个 AI 卖方代表过几轮招。
这很像把传统的售前沟通,变成了“机器对机器的预审查”。乍看有点科幻,细想又很现实。过去几年,几乎所有 SaaS 公司都在给官网、客服、销售流程塞进 AI。厂商开始拥有越来越能说会道的 AI 销售助手,那买方这边如果还靠人工记笔记、开 Excel,确实有点像拿算盘对战自动柜员机。
更关键的是,buyer-eval-skill 不是单纯做一个“智能推荐器”。它强调 evidence-based scoring,也就是证据导向评分。这个词在 B2B 采购里很重要,因为它对应的是一个长期存在的行业顽疾:很多采购决策看似理性,实则被品牌光环、销售关系和 Demo 表演牵着走。你很难说服一个预算委员会“我感觉这个产品更靠谱”,但你可以拿出一份带证据链的评估报告:哪些说法来自厂商,哪些来自第三方资料,哪些能力经过独立交叉验证,哪些风险尚未证实。
说白了,这类工具真正想解决的不是“信息不够多”,而是“信息太会骗人”。在大模型时代,内容生成越来越便宜,厂商能产出的白皮书、案例、对比页、FAQ、竞品战报,只会越来越多,越来越像那么回事。于是问题从“没有资料可看”,变成“看什么都像真的”。在这个背景下,强调证据透明度,不是锦上添花,而是在给采购流程补一块越来越重要的刹车片。
为什么它出现在现在,而不是三年前
这件事放在今天看,时机其实非常微妙。过去一年,AI Agent 这个概念被说得有点泛滥,仿佛什么流程都能交给 agent 自动跑一遍。但绝大多数 agent 产品的问题也很明显:它们在低风险任务里显得花哨,在高风险任务里又显得不够可信。企业采购偏偏就是一种高风险任务,因为它牵涉预算、集成、合规、迁移和长期锁定效应,一旦买错,代价不是“生成了一段不够好的文案”,而可能是一个部门未来三年的工作方式都被绑死。
也正因为如此,buyer-eval-skill 这种项目才显得比一般的“AI 办公助手”更有现实感。它没有把自己包装成全自动采购机器人,而是把重点放在结构化评估、证据透明、硬约束筛选和风险揭示上。这其实是一种更成熟的产品思路:AI 不直接替你拍板,但先帮你把那些最容易被忽略、最容易被营销话术覆盖的问题逼出来。
还有一个背景不能忽视:Claude Code 这类面向开发者和高级用户的 AI 工作流,正在从“写代码”扩展到“处理复杂知识任务”。buyer-eval-skill 出现在这样的生态里,也说明一件事——大模型平台的竞争,已经不只是比谁会聊天,而是比谁能沉淀出一套可复用的专业能力模块。今天它可以评估 B2B 软件,明天就可能评估云服务、外包团队、甚至保险方案。所谓“skill”的价值,不在于名字,而在于它开始把行业经验编码成半自动化流程。
如果把它和更常见的采购工具做个对比,会发现差异很明显。传统采购平台往往强在流程管理、审批留痕、供应商档案;而这个项目更像是前置的智力劳动自动化,是在采购动作发生之前,先把“该问什么、该信什么、该怀疑什么”整理出来。前者管理流程,后者试图管理认知偏差。后者未必更容易做,但如果做成了,价值反而更大。
这个方向很诱人,但也有几个绕不过去的难题
我对这个项目的第一反应是兴奋,第二反应是警惕。兴奋是因为它抓到了一个真实痛点;警惕则来自它要处理的问题,本身就充满灰度。
最大的挑战,是“证据”本身未必真的客观。厂商官网、产品文档、第三方评测、客户案例、分析师报告,这些都可以成为证据来源,但它们的可信度并不相同。AI 即便能做交叉引用,也未必总能判断某条证据是营销包装、语义偷换,还是真正的能力证明。比如一家公司说自己“支持企业级安全”,这句话在营销材料里几乎等于没说;真正关键的是支持哪些标准、默认配置如何、审计日志是否完整、权限模型是否足够细。AI 能不能持续问到这个颗粒度,决定了这类工具是“采购助手”还是“高级搜索器”。
另一个难题,是厂商 AI 代理之间的“博弈升级”。如果买方开始用 AI 盘问,卖方也一定会训练 AI 更擅长应答、更擅长模糊边界、更擅长在不撒谎的情况下显得自己无所不能。到那时,所谓 agent-to-agent conversation 就有可能变成一场更高效的攻防战:一边负责拆穿,一边负责包装。听上去像黑色幽默,但它很可能就是未来企业软件销售的一部分日常。
还有一个更值得思考的问题:采购判断究竟能被标准化到什么程度?buyer-eval-skill 试图用七个维度去评分,这当然比拍脑袋好得多,但任何评分框架都天然有偏见。你把可量化的部分做得越漂亮,就越容易忽略那些难量化却非常关键的因素,比如供应商团队响应速度、合作文化、路线图稳定性、甚至创始人的可信度。在企业世界里,很多失败采购并不是输在功能,而是输在“合作起来太别扭”。这恰恰是 AI 最难写进表格的东西。
它可能不会颠覆采购,但会先改写售前这件小事
我不认为这样一个 GitHub 项目,会立刻改变整个 B2B 软件行业。至少短期内,真正的大单子仍然会有人情、品牌、价格谈判和长期合作历史的影响,董事会也不会因为一份 AI 报告就轻易拍板。企业采购从来不是纯技术问题,而是组织问题。
但我很看好它改变另一件事:售前沟通的起点。过去,买方第一次和厂商接触时,往往还处在需求模糊、问题零散的阶段,厂商自然更容易掌握节奏。以后如果越来越多买方先用这种工具把关键问题、证据缺口、淘汰条件都梳理好,再去见销售,整个对话结构就会变。销售不再那么容易用一场炫目的 Demo 把讨论带跑,买方也更可能从一开始就站在“审查者”而不是“被说服者”的位置上。
这背后其实折射出一个更大的变化:AI 不只是帮企业“提升效率”,也开始帮助弱势一方“提升议价能力”。这点非常有意思。过去几年,AI 工具大多优先服务内容生产者、开发者、客服团队和销售团队,因为这些岗位更容易被量化成效率指标。而 buyer-eval-skill 这样的方向,某种意义上是在给买方、采购方、内部评审者配武器。它不浪漫,但很实用。
从仓库目前的状态看,这还是一个非常早期的项目:Star 不多,提交记录也很短,版本号却已经写到了 3.1.0,说明它背后很可能已有内部迭代过程。项目文档里还提到会在每次调用时自动检查更新,这种设计也透露出一个信号:维护者知道评估标准和市场信息是会快速过时的,工具必须动态更新,不能做成一份静态模板。
我反而觉得,这种“小而尖”的开源项目,比那些动不动号称“重构万亿市场”的 AI 平台更值得观察。因为它没有试图包打天下,而是盯住企业决策中一个具体、昂贵、又让人头疼的环节下手。只要它真能减少几次选型失误,哪怕只帮一家中型企业避开一个不合适的 SaaS 合同,它创造的价值都可能远大于一个漂亮的聊天机器人。
对于今天的企业软件行业,这或许才是 AI 更成熟的落点:不是让机器替人做梦,而是替人多问几句难听但必要的话。