AI 训练淘金热背后,印度专家网络又捧出一家新独角兽候选:Deccan AI 融资 2500 万美元

一笔 2500 万美元融资,照见 AI 产业链的真实地板
当外界还在把目光集中在 OpenAI、Anthropic、Google DeepMind 这些“造模型”的明星公司时,另一条没那么耀眼、却越来越重要的赛道正在迅速膨胀:模型后训练。美国初创公司 Deccan AI 就踩中了这个机会。它刚刚完成 2500 万美元的 A 轮融资,由 A91 Partners 领投,Susquehanna International Group 和 Prosus Ventures 参投。公司成立于 2024 年 10 月,算是相当年轻,但已经拿下 Google DeepMind、Snowflake 等客户。
如果把大模型比作一个天赋异禀但毛病不少的“学霸”,预训练阶段是把海量知识塞进脑子里;后训练则更像请家教、做题、打磨表达、纠正坏习惯,甚至教它如何调用外部工具、如何在真实业务里少犯错。Deccan AI 做的,正是这类脏活累活但极其关键的事情:数据生成、模型评估、强化学习环境搭建、专家反馈收集,以及帮助模型提升 coding、agent 和 API 工具调用能力。
这件事为什么重要?因为今天的大模型竞赛,已经从“谁参数更多”逐渐转向“谁在真实世界更靠谱”。用户不太关心模型内部到底有几层 Transformer,他们更关心的是:它会不会胡说八道?能不能真的调起企业系统?写代码时是帮忙还是添乱?Deccan AI 押注的,就是这一层最接地气的价值。
AI 不只是算力战争,也是“人力密度战争”
Deccan AI 最特别的一点,不是融资额本身,而是它的人力组织方式。公司总部在旧金山湾区,但大规模运营团队放在海得拉巴,现有大约 125 名员工,并且依赖一个超过 100 万人的贡献者网络,其中活跃贡献者每月约 5000 到 10000 人。这些人包括学生、领域专家以及博士群体。按照创始人 Rukesh Reddy 的说法,约 10% 的贡献者拥有硕士或博士学位,而在一些高要求项目里,高学历人群占比会更高。
这其实点破了一个常被忽略的现实:AI 不是全自动工业,至少现在还远远不是。大模型要变得“更像样”,背后往往要靠大量人工标注、人工审核、人工构造评估任务、人工提供高质量反馈。过去几年,Scale AI、Surge AI、Turing、Mercor 等公司都在争夺这块市场。Deccan AI 选择把专家网络重点放在印度,某种程度上并不意外——印度拥有足够庞大的英语人才储备、工程教育基础和相对可控的人力成本,天然适合承接这类高密度知识劳动。
但这里真正有意思的,不只是“印度便宜”。更关键的是,后训练并非传统意义上的低端外包。越往前沿模型走,任务越复杂,很多工作不是机械点选标签,而是要求懂代码、懂专业知识、懂模型行为,甚至懂怎么设计一套能把模型弱点逼出来的测试体系。说得直白一点,这不再是简单的数据标注工厂,而更像一支分布式、半隐形的“AI 教练团”。
后训练为什么突然这么值钱
过去一年,行业对“后训练”的态度已经发生明显变化。预训练当然仍然重要,但随着基础模型能力逐步接近、训练成本越来越高,后训练开始成为差异化竞争的主战场。一个模型能否胜任代码生成、客服、金融分析、企业自动化、机器人控制,往往不取决于它读过多少互联网文本,而取决于它是否经过足够细致、足够场景化的打磨。
Deccan AI 提供的服务,正踩在这个拐点上。它不仅帮客户做专家反馈、评估和强化学习,还在做针对企业的产品,比如评估套件 Helix,以及一个运营自动化平台。这意味着它不满足于做“人力中介”,而是想做一层更可复用的工具基础设施。这个方向很聪明,因为纯粹卖劳动力,天花板和护城河都有限;把流程产品化、平台化,才可能从项目制服务走向更稳定的收入模型。
还有一个更大的背景是,模型能力正在从纯文本扩展到“世界模型”——也就是更好地理解物理环境、视觉输入和机器人交互。这类系统要训练得可用,难度会比聊天机器人高得多。你可以容忍一个聊天机器人偶尔说得啰嗦,但你很难接受一个机器人在工厂里“理解错了”操作指令。越接近真实世界,模型容错率就越低,后训练的价值也就越贵。Reddy 说“质量仍然是个尚未解决的问题”,这话一点都不夸张。
这门生意的光鲜背后,也有两道阴影
第一道阴影,是质量控制。Deccan AI 之所以强调把大量专家集中在印度,本质上是在试图解决这个行业最棘手的问题:市场长得太快、参与者太杂、交付标准又极其严苛。后训练不像做内容众包,错一个标签可能只是小问题;它更像在给一台即将上线的自动驾驶系统做路测,错误会被放大到真实生产环境里。模型一旦学偏,影响的可能是成千上万用户。这也是为什么前沿实验室虽然愿意外包部分工作,却仍然对质量近乎偏执。
第二道阴影,是劳动价值的再分配。AI 产业如今最讽刺的地方之一,是台前站着的是估值惊人的模型公司,幕后撑着的却是一大群不怎么被看见的知识劳动者。无论在印度、菲律宾还是非洲,一批高学历人才正在进入“AI 训练流水线”。他们做的工作远比“点点鼠标”复杂,却未必能分享 AI 暴涨的利润。Deccan AI 当然不是唯一面临这个问题的公司,Scale AI、Remotasks 乃至更广义的众包平台都曾被讨论过类似议题:当 AI 产业说自己代表未来,它是否也该更认真地回答“谁在为这个未来打工”?
我并不认为这会阻止行业继续扩张。相反,AI 公司只会越来越依赖这类人力基础设施。但接下来,投资人和客户看重的不会只是“你能调动多少人”,而是“你能不能证明这些人真的在提升模型,而不是用低价堆出一堆看似忙碌的数据”。未来两三年,AI 训练服务市场很可能会像早年的云服务一样分层:底层拼成本,中层拼交付,上层拼行业 know-how 和工具化能力。谁能从“外包公司”长成“质量基础设施提供商”,谁才有机会跑出来。
Deccan AI 会成为下一个 Scale AI 吗?
短期看,Deccan AI 的位置相当不错。它已经有头部客户,也有明确的供给侧优势,还赶上了后训练这股资金和需求同时涌入的风口。和 Mercor 这类强调人才匹配的平台相比,Deccan AI 更像是把“专家供给 + 项目交付 + 工具产品”揉在一起;和 Turing 这类偏重代码任务的玩家相比,它的覆盖面更宽;和 Scale AI 这样的巨头相比,它又更灵活,也更容易在一些新型任务上快速试错。
但要说它会不会成为下一个 Scale AI,我会更谨慎一点。因为这门生意真正难的,不是今天签下多少客户,而是当模型越来越强、越来越会自我评估、越来越能合成训练数据时,人类专家的角色会怎么变化。也许未来最值钱的,不再是大规模众包,而是更小、更精、更垂直的专家团。那时,Deccan AI 这种公司必须证明自己不是“人海战术的升级版”,而是一套能持续提炼高质量反馈的系统。
说到底,Deccan AI 这轮融资的意义,不只在于又一家 AI 创企拿到钱,而在于它提醒我们:AI 革命从来不是只有芯片、参数和炫目的演示视频。真正让模型走向可用、可信、可部署的,往往是最不浪漫的那部分工作。而这部分工作,如今正在印度这样的地方,悄悄变成一门全球生意。