五角大楼最近给生成式 AI 交了一份很敏感的活:起草国会强制要求的报告。
美国国防部 CTO Emil Michael 说,把材料交给 AI 后,原本可能要约 200 小时的人力起草,可以压到约 5 小时。这个数字很漂亮。但国会报告不是部门周报,它是国会监督军方、追问纳税人资金去向的工具。
省下 195 小时,当然诱人。问题是,省下的是重复劳动,还是把一段本该可追责的链条也磨薄了。
发生了什么:AI 已经进入国防部文书流程
这件事的事实不复杂,但边界必须说清。
| 问题 | 已知事实 | 不能越界理解 |
|---|---|---|
| 谁在用 | 国防部通过 GenAI.mil 向六大军种开放生成式 AI 工具 | 150 万用户不等于 150 万人都在写国会报告 |
| 写什么 | 官员称用于起草国会强制报告,也用于评语、嘉奖词、辅导记录等文书 | 原文没有说 AI 独立提交正式报告 |
| 省多少时间 | Emil Michael 称约 200 小时起草可压到约 5 小时 | 这是官员说法,不是独立审计结果 |
| 规模变化 | GenAI.mil 用户从 2025 年 12 月约 8 万增至 2026 年 6 月约 150 万 | 只能说明工具总体使用扩张很快 |
另一个细节更能说明问题。
国防部科技基础副助理部长 Jacob Glassman 曾说,一个人手不足的团队被要求用 GenAI.mil 完成国会要求的报告。一周后,团队称这是他们近五年写得最好的报告。
但他没有披露是哪份报告。
这就留下一个硬缺口:AI 起草了哪些段落,事实由谁核,判断由谁定,最终文本由谁承担责任。现在能看到的是“用了”,看不到的是“怎么被约束”。
对国防部内部团队来说,AI 会先变成减压工具。人少、活多、期限紧,能把初稿拉出来,就会有人用。
对国会工作人员来说,麻烦也会随之增加。他们不能只看报告是否准时送达,还要追问报告背后的生成和审核过程。否则收到的是一份顺滑文本,却未必是一份可靠说明。
为什么重要:国会报告不是行政作文
五角大楼确实有苦衷。
国会强制报告数量从 2000 年略超 500 份,涨到 2020 年逾 1400 份。美国政府问责局也提到,五角大楼光是逐行梳理法律条文、分派报告任务,就可能耗时 3 到 6 个月。
这不是轻松活。很多也不是高价值创造。
所以军方用 AI,我不意外。真正需要警惕的是,它把国会监督文本当成普通文书来谈效率。
国会报告的价值不在文采,也不在交稿速度。它的价值在可追责:项目花了多少钱,计划推进到哪一步,风险有没有被弱化,问题有没有被藏进措辞里。
生成式 AI 的风险恰好在这里。它最危险的地方不是写不出来,而是写得太像已经查清楚了。
商业世界已经有过教训。KPMG 曾发布一份关于企业 AI 使用的报告,其中案例被发现存在多处 AI 生成错误和虚假说法,最后撤回。商业报告错了,损害品牌;国防报告错了,污染监督链条。
美国国防部 2027 财年预算请求高达 1.5 万亿美元。这个数字面前,“大体正确”不够用。
普通纳税人未必会逐字读这些报告,但他们会承担后果。国会监督若被低质量自动化文本稀释,最终影响的是军费是否被问到点上、项目是否被及时纠偏。
政策从业者和国会助手接下来要做的动作也很具体:不能只催报告数量和期限,要把 AI 使用披露写进审阅清单。至少要问四件事:输入了什么材料,模型生成了哪些内容,人工核验到哪一层,谁签字负责。
真正的账:军方减负,厂商拿单,责任容易变轻
这件事不能只看成“AI 帮公务员少加班”。它牵动三本账。
军方算的是组织账。报告越多,流程越慢,AI 越像救命工具。官僚系统喜欢这种技术,因为它能把积压工作变成仪表盘上的增长:用户数增长、工时下降、流程提速。
科技公司算的是合同账。GenAI.mil 起步接入 Google Cloud 的 Gemini for Government。后续国防部又宣布与 OpenAI、Google、Nvidia、Microsoft、AWS、Oracle、SpaceX、Reflection AI 等公司推进更多 AI 工具进入涉密网络,面向“合法作战用途”。
政府没有披露这些新合同到底付多少钱。
Anthropic 没在名单里。按原文说法,特朗普政府据称将其拉黑,原因是 Anthropic 据称拒绝让 Claude 模型以无限制方式用于自主战争和大规模监控。
这里不能写成官方定论。但它至少提示了一件事:在国防 AI 采购里,技术能力只是门票,边界态度也会影响商业命运。
监管者算的是责任账。国会要报告,是为了约束行政部门。现在行政部门用 AI 批量起草给国会看的材料,如果审核机制不透明,监督会变成一个别扭循环:被监督者用机器写自我说明,监督者再拿这份说明去监督。
“天下熙熙,皆为利来。”这句话放在这里不是讽刺,是提醒。
军方要省工时,厂商要拿大单,国会要文件准时到桌上。每一方都有合理动机。可合理动机叠在一起,不会自动生成可靠制度。
我不反对政府用 AI 写初稿。1400 多份强制报告压在系统上,不用工具才奇怪。
但国会报告这种文本,必须有披露边界。哪些材料被输入,哪些段落由模型生成,哪些事实由人工核验,最终责任落在哪个办公室、哪个签字人身上,这些不能含糊。
接下来最该观察两个变量。
一是国防部会不会公开 AI 起草报告的审核规则。只说“有人类把关”不够,必须说明把关到什么颗粒度。
二是国会会不会把 AI 使用披露纳入强制报告要求。没有这条,AI 会先从提效工具变成责任缓冲层。
模型越会写,文件越顺滑,监督反而越容易失真。这才是五角大楼这次展示成绩里最硬的风险。
