2026年6月4日,美国商务部长签发了一份看起来技术性很强、实际杀伤力很大的指令——DAO 216-26。它规定人口普查局和经济分析局(BEA)今后编制统计数据,只能用“粗化”(四舍五入、区间化、合并口径)和作为最后手段的“抑制”(直接删掉数字),过去二十多年发展出来的差分隐私、噪声注入、数据交换等技术一律禁用。
指令签发仅仅六天后,商务部下属这两个机构就交出了两份互相矛盾的答卷:BEA立刻换轨,普查局却因为一批数据已进入终审流程侥幸沿用了旧法。一纸命令落到执行层面,裂缝比“禁不禁差分隐私”这个问题本身更值得盯。
商务部一纸指令,把隐私保护打回1970年代
哈佛大学教授Cynthia Dwork——差分隐私这套理论的开创者之一——联合John Abowd、Salil Vadhan等一批理论计算机科学界的学者发文,指DAO 216-26绕过了法定行政程序,是把半个世纪的隐私保护进展一笔勾销。
这不是危言耸听。数据交换自1990年起用于十年一次的人口普查,噪声注入从2002年起支撑季度劳动力指标,差分隐私自2008年起用于通勤模式统计OnTheMap,2020年普查也首次大规模采用。原本,2030年普查也计划继续用差分隐私——现在全部要退回粗化和抑制。
粗化不是更安全,只是看不见
联署文章举了一个县级酿酒厂的例子:一个县里只有几家啤酒相关企业,统计局为保护隐私,把地理、行业、所有制这几类口径都做了粗化,只公布几个合计数字。听起来足够模糊,但只要把这几个粗化后的数字联立起来,用初中代数就能反推出每家企业的确切员工数。
这才是问题的要害。粗化只是把数字调糙,不改变数字之间的算术关系——噪声注入恰恰是为了打断这种可以被解方程解出来的关联。禁了噪声注入,统计局要么把数据模糊到没人能用,要么在压力下发布看似安全实则一算就破的数字。两难之间,没有第三条路。
- 风险.企业和个人一旦发现统计口径可被反推,将更倾向于拒答或谎报,这对靠自愿申报支撑的联邦统计体系是致命打击。
政治链条清楚,但反对声音不全是政治
这道禁令的政治意图并不隐晦。特朗普政府的施政蓝图Project 2025明确要求在人口普查中加入公民身份问题;OMB主任Russell Vought创立的智库CRA则直言,只要还用差分隐私,就算问了公民身份,也“不可能确定个人的身份状态”。换句话说,禁差分隐私的真正目标,是让公民身份数据能被用来重新划分选区。
但把这场争论简化成“纯政治迫害科学”也不够准确。2020年普查采用差分隐私时,地方规划者、人口学家和选区划分从业者就批评过它拉低了小区域和少数族裔群体的数据精度——这层技术性质疑早于此次政治攻击存在,也不会因为禁令被撤回就自动消失。
同一天,两种答卷
指令生效后的执行落差,比条文本身更能说明问题。BEA在6月9日更新披露政策,把粗化列为首选方法,6月10日发布的外国直接投资数据已经改用聚合和四舍五入。同一天,普查局发布的县级商业形成年度数据却仍用了差分隐私几何噪声——原因很简单,这批数据在指令下达前已进入终审流程,普查局同时声明未来发布将遵守新规。
一纸禁令,六天内就撞出两种做法,说明政策落地远比条文复杂
对研究者、地方政府和依赖细粒度经济数据做决策的从业者来说,眼下最实际的动作是尽快下载和归档还在用旧法发布的数据集——因为下一批,很可能就换成粗化后的、算不出真相但也用不了的版本。接下来该盯的,是2030年普查会不会正式落实这道禁令,以及是否会有诉讼挑战它绕开行政程序的合法性。
