Hacker News每周都有人发"我们用AI解析文档",点进去大多是OCR加个大模型套壳。这次YC P25公司Parsewise的发帖角度不一样:它不讲"抽取多准",讲"每个输出值你都能点进去看它从哪来"。
这个角度戳中了企业用AI最痛的一块骨头:不是模型能不能抽出数据,而是抽出来的东西,业务团队敢不敢直接拿去做决策。
它到底在卖什么
| 项目 | 说明 |
|---|---|
| 输入 | 成百上千份PDF、Excel、邮件、电话转录等非结构化文件 |
| 输出 | 符合schema的CSV/JSON,每个值可跨文档追溯到词级引用 |
| 差异点 | 不是RAG式抽样检索,声称对相关值做穷举搜索 |
| 模型分工 | 小模型负责大规模搜索,大模型负责决策与标注不确定性 |
| 部署 | 模型和云无关,可私有网络部署 |
创始人一位来自Palantir,做过ETL和AI工作流;一位来自Bain,做过金融复杂数据分析。这个组合不算意外——两边都天天和"一堆脏文档变干净数据"打交道。
帖子里举的例子是保险公司:一个数值可能分散在保单PDF、通话转录、邮件里,系统得自己判断该抽哪个、怎么合并。这是跨文档推理,比单文档抽取难一个量级。
卡住企业AI的从来不是模型,是验证成本
过去两年,模型demo越做越炫,但业务团队敢不敢用AI处理的数据,从来卡在验证环节,不是精度。让大模型读一堆文件吐个CSV,谁都能做;难的是让保险核保员、合规专员在五秒内确认某个数字没有被模型编造。
Parsewise把赌注押在这个验证环节,而不是继续卷模型精度。这个判断站得住——企业买AI买的不是聪明,是责任链:出了错,得知道错在哪一步、谁签字负责。
| 对比项 | 传统RAG | Parsewise主张 |
|---|---|---|
| 检索方式 | 抽样检索,可能漏值 | 穷举查找相关值 |
| 结果验证 | 难以逐条核对 | 每个值带词级引用 |
| 业务专家介入 | 门槛高 | 号称可即时校验 |
对保险核保、合规审查这类岗位来说,词级可追溯意味着他们不用逐字重新核对原文,理论上能把审核时间压缩到"点开引用看一眼"。这类岗位大概率会是最先愿意小范围试点的人,但会先拿小批量文档测试,再决定要不要接入生产流程。
好方向,账还没算完
SOTA、跑赢Claude Fable这些说法,目前只是创始人自述,没有第三方基准复现。穷举搜索意味着更高的计算成本和延迟,面对成千上万份文档,这笔账怎么算,帖子里没给答案。
材料里也没提合规认证、定价、部署成本——这些恰恰是保险、金融合规团队签单前必须问清楚的问题,目前都看不清。
古人说"兵马未动,粮草先行",技术叙事也一样。可追溯性确实是企业AI从demo走向生产环境的分水岭,但SOTA、跑赢对手这些标签,得靠真实客户在复杂文档上跑出来的成绩单验证。
接下来最该盯的,是Parsewise会不会放出可复现的基准数据,以及第一批真实客户在什么文档量级、什么成本下把它用起来。这两件事没兑现,自述就还是自述。
