当 AI 开始替你和销售打擂台：GitHub 上这个小项目，想把企业采购从“听故事”变成“看证据”

人工智能 2026年3月27日

Salespeak AI 在 GitHub 开源的 buyer-eval-skill，看上去只是一个面向 Claude Code 的“小技能”，但它瞄准的是 B2B 软件采购里最古老也最顽固的问题：买方信息不足、卖方过度包装。它真正有意思的地方，不是让 AI 帮你做表格，而是试图让 AI 代替采购方去追问、核验、打分，把软件选型这件事从“谁 PPT 做得好”拉回到“谁真的经得起盘问”。

一个不起眼的 GitHub 仓库，盯上了企业采购最痛的环节

GitHub 上最近出现了一个名叫 buyer-eval-skill 的公开仓库，来自 salespeak-ai。表面看，它只是一个给 Claude Code 使用的技能包，功能描述也很直白：帮助企业买方评估 B2B 软件供应商，包含领域专家式提问、与厂商 AI 代理对话、以及基于证据的评分机制。

但如果你在科技行业待得够久，就会知道这件事并不“小”。企业采购软件，尤其是 CRM、客服系统、安全产品、数据平台、财务系统这类 B2B 软件，向来是一个“信息极不对称”的世界。销售团队最擅长讲愿景，采购团队最怕踩坑，中间夹着一堆模糊的需求、漂亮的案例、精心设计的演示环境，以及那句熟悉得让人想叹气的话：“这个功能我们 roadmap 上有。”

这个项目的野心，就是把这场长期由销售主导的话语游戏，改造成一次更像尽职调查的流程。按照仓库介绍，它会先研究买方公司本身——行业、规模、技术栈、成熟度——而不是让用户先填一份十几页的表。然后它会抛出更接近领域专家的问题，帮助买方挖出那些自己原本都没意识到的隐性需求。接着，再设定预算、合规、集成能力等硬约束，先排除明显不合格的厂商，避免后面浪费时间。

光看到这里，我就已经能理解为什么这个项目会让不少懂行的人眼前一亮。因为现实里的企业软件选型，经常不是“不会比较”，而是“比较得太晚”。很多团队往往在和三家厂商开完四轮会议后，才想起来问：它真的支持我们现有的身份系统吗？它符合我们所在行业的监管要求吗？迁移成本到底谁承担？这类问题如果问晚了，前面的时间几乎都白花了。

它最有意思的地方，不是打分，而是“替买方追问”

根据仓库提交记录和说明，这个技能的核心能力包括七个维度的证据化评分、交叉验证厂商说法、输出对比建议，以及分析“隐藏风险”。更特别的是，它还会通过 Salespeak Frontdoor API 去和厂商的 AI 代理对话。翻译成人话就是：不是采购经理自己去听销售讲，而是让一个 AI 买方代表，先去和一个 AI 卖方代表过几轮招。

这很像把传统的售前沟通，变成了“机器对机器的预审查”。乍看有点科幻，细想又很现实。过去几年，几乎所有 SaaS 公司都在给官网、客服、销售流程塞进 AI。厂商开始拥有越来越能说会道的 AI 销售助手，那买方这边如果还靠人工记笔记、开 Excel，确实有点像拿算盘对战自动柜员机。

更关键的是，buyer-eval-skill 不是单纯做一个“智能推荐器”。它强调 evidence-based scoring，也就是证据导向评分。这个词在 B2B 采购里很重要，因为它对应的是一个长期存在的行业顽疾：很多采购决策看似理性，实则被品牌光环、销售关系和 Demo 表演牵着走。你很难说服一个预算委员会“我感觉这个产品更靠谱”，但你可以拿出一份带证据链的评估报告：哪些说法来自厂商，哪些来自第三方资料，哪些能力经过独立交叉验证，哪些风险尚未证实。

说白了，这类工具真正想解决的不是“信息不够多”，而是“信息太会骗人”。在大模型时代，内容生成越来越便宜，厂商能产出的白皮书、案例、对比页、FAQ、竞品战报，只会越来越多，越来越像那么回事。于是问题从“没有资料可看”，变成“看什么都像真的”。在这个背景下，强调证据透明度，不是锦上添花，而是在给采购流程补一块越来越重要的刹车片。

为什么它出现在现在，而不是三年前

这件事放在今天看，时机其实非常微妙。过去一年，AI Agent 这个概念被说得有点泛滥，仿佛什么流程都能交给 agent 自动跑一遍。但绝大多数 agent 产品的问题也很明显：它们在低风险任务里显得花哨，在高风险任务里又显得不够可信。企业采购偏偏就是一种高风险任务，因为它牵涉预算、集成、合规、迁移和长期锁定效应，一旦买错，代价不是“生成了一段不够好的文案”，而可能是一个部门未来三年的工作方式都被绑死。

也正因为如此，buyer-eval-skill 这种项目才显得比一般的“AI 办公助手”更有现实感。它没有把自己包装成全自动采购机器人，而是把重点放在结构化评估、证据透明、硬约束筛选和风险揭示上。这其实是一种更成熟的产品思路：AI 不直接替你拍板，但先帮你把那些最容易被忽略、最容易被营销话术覆盖的问题逼出来。

还有一个背景不能忽视：Claude Code 这类面向开发者和高级用户的 AI 工作流，正在从“写代码”扩展到“处理复杂知识任务”。buyer-eval-skill 出现在这样的生态里，也说明一件事——大模型平台的竞争，已经不只是比谁会聊天，而是比谁能沉淀出一套可复用的专业能力模块。今天它可以评估 B2B 软件，明天就可能评估云服务、外包团队、甚至保险方案。所谓“skill”的价值，不在于名字，而在于它开始把行业经验编码成半自动化流程。

如果把它和更常见的采购工具做个对比，会发现差异很明显。传统采购平台往往强在流程管理、审批留痕、供应商档案；而这个项目更像是前置的智力劳动自动化，是在采购动作发生之前，先把“该问什么、该信什么、该怀疑什么”整理出来。前者管理流程，后者试图管理认知偏差。后者未必更容易做，但如果做成了，价值反而更大。

这个方向很诱人，但也有几个绕不过去的难题

我对这个项目的第一反应是兴奋，第二反应是警惕。兴奋是因为它抓到了一个真实痛点；警惕则来自它要处理的问题，本身就充满灰度。

最大的挑战，是“证据”本身未必真的客观。厂商官网、产品文档、第三方评测、客户案例、分析师报告，这些都可以成为证据来源，但它们的可信度并不相同。AI 即便能做交叉引用，也未必总能判断某条证据是营销包装、语义偷换，还是真正的能力证明。比如一家公司说自己“支持企业级安全”，这句话在营销材料里几乎等于没说；真正关键的是支持哪些标准、默认配置如何、审计日志是否完整、权限模型是否足够细。AI 能不能持续问到这个颗粒度，决定了这类工具是“采购助手”还是“高级搜索器”。

另一个难题，是厂商 AI 代理之间的“博弈升级”。如果买方开始用 AI 盘问，卖方也一定会训练 AI 更擅长应答、更擅长模糊边界、更擅长在不撒谎的情况下显得自己无所不能。到那时，所谓 agent-to-agent conversation 就有可能变成一场更高效的攻防战：一边负责拆穿，一边负责包装。听上去像黑色幽默，但它很可能就是未来企业软件销售的一部分日常。

还有一个更值得思考的问题：采购判断究竟能被标准化到什么程度？buyer-eval-skill 试图用七个维度去评分，这当然比拍脑袋好得多，但任何评分框架都天然有偏见。你把可量化的部分做得越漂亮，就越容易忽略那些难量化却非常关键的因素，比如供应商团队响应速度、合作文化、路线图稳定性、甚至创始人的可信度。在企业世界里，很多失败采购并不是输在功能，而是输在“合作起来太别扭”。这恰恰是 AI 最难写进表格的东西。

它可能不会颠覆采购，但会先改写售前这件小事

我不认为这样一个 GitHub 项目，会立刻改变整个 B2B 软件行业。至少短期内，真正的大单子仍然会有人情、品牌、价格谈判和长期合作历史的影响，董事会也不会因为一份 AI 报告就轻易拍板。企业采购从来不是纯技术问题，而是组织问题。

但我很看好它改变另一件事：售前沟通的起点。过去，买方第一次和厂商接触时，往往还处在需求模糊、问题零散的阶段，厂商自然更容易掌握节奏。以后如果越来越多买方先用这种工具把关键问题、证据缺口、淘汰条件都梳理好，再去见销售，整个对话结构就会变。销售不再那么容易用一场炫目的 Demo 把讨论带跑，买方也更可能从一开始就站在“审查者”而不是“被说服者”的位置上。

这背后其实折射出一个更大的变化：AI 不只是帮企业“提升效率”，也开始帮助弱势一方“提升议价能力”。这点非常有意思。过去几年，AI 工具大多优先服务内容生产者、开发者、客服团队和销售团队，因为这些岗位更容易被量化成效率指标。而 buyer-eval-skill 这样的方向，某种意义上是在给买方、采购方、内部评审者配武器。它不浪漫，但很实用。

从仓库目前的状态看，这还是一个非常早期的项目：Star 不多，提交记录也很短，版本号却已经写到了 3.1.0，说明它背后很可能已有内部迭代过程。项目文档里还提到会在每次调用时自动检查更新，这种设计也透露出一个信号：维护者知道评估标准和市场信息是会快速过时的，工具必须动态更新，不能做成一份静态模板。

我反而觉得，这种“小而尖”的开源项目，比那些动不动号称“重构万亿市场”的 AI 平台更值得观察。因为它没有试图包打天下，而是盯住企业决策中一个具体、昂贵、又让人头疼的环节下手。只要它真能减少几次选型失误，哪怕只帮一家中型企业避开一个不合适的 SaaS 合同，它创造的价值都可能远大于一个漂亮的聊天机器人。

对于今天的企业软件行业，这或许才是 AI 更成熟的落点：不是让机器替人做梦，而是替人多问几句难听但必要的话。

Summary: buyer-eval-skill 现在还只是一个早期项目，但它切中的方向非常准：在生成式 AI 让营销更廉价、说服更自动化的时代，采购端同样需要“武装起来”。我判断，未来一年会出现更多“买方代理”工具，它们未必取代采购经理，却会重塑售前流程和厂商竞争方式。真正的分水岭不在于谁的 AI 更会说，而在于谁能拿出经得起追问的证据。

B2B软件采购评估buyer-eval-skillSalespeak AIClaude Code证据驱动评分AI代理企业采购供应商核验GitHub开源项目信息不对称