GitHub 去 AI 水印项目提醒：AI 溯源不能只靠文件标签

核心摘要 Summary

GitHub 上的 remove-ai-watermarks 项目宣称可处理 Gemini、DALL-E、Stable Diffusion、Firefly、Midjourney 等 AI 图像的可见水印、隐形水印和来源元数据。
它未必证明 AI 水印体系已经失效，但至少说明：把平台标识和合规判断押在本地文件标签上，风险很高。
对平台安全和合规团队来说，下一步不是相信或封杀某个工具，而是减少对单一元数据字段的依赖。

GitHub 上出现了一个名为 remove-ai-watermarks 的开源项目。项目文档称，它可以去除 AI 图片里的可见水印、不可见水印，以及 C2PA、EXIF、XMP、PNG 文本块等来源信息。

它点名的对象不少：Google Gemini/Nano Banana、OpenAI DALL-E/ChatGPT、Stable Diffusion、Adobe Firefly、Midjourney。项目还声称，可以移除触发 Instagram、Facebook、X 等平台“Made with AI”标签的元数据。

这件事最该看的，不是它能不能“清掉一切”。更关键的是：AI 内容治理到底有多少判断，正在依赖一张图片文件里那点可被编辑、可被转码、可被复制的标识。

它宣称能清三类标识，但不要把作者说法当验证结论

项目文档把能力分成三类。

一类是可见水印，比如 Gemini/Nano Banana 图片上的 sparkle 标识。项目声称可通过图层反推和修补去除。

一类是元数据，包括 C2PA、EXIF、XMP、PNG 文本块。项目声称可清理其中和 AI 生成相关的字段。

还有一类是隐形水印。项目声称可通过扩散再生成，尝试削弱 SynthID、StableSignature、TreeRing 等不可见水印。

这三件事不能混在一起看。

清理 EXIF、XMP、PNG 文本块并不新鲜。很多图像工具、转码流程、社交平台压缩链路，本来就可能改变或删除这些信息。真正敏感的是 C2PA 来源凭证和隐形水印。

C2PA 牵涉内容凭证生态。隐形水印是否能稳定失效，则需要第三方检测器、大样本测试和不同编辑链路验证。仅凭项目作者文档，不能写成已被外部验证的事实。

标识类型	项目宣称做法	更稳妥的判断
Gemini 可见 sparkle 标识	修补或移除固定样式标识	对固定样式更可行，遇到裁剪、压缩、样式变化会受影响
C2PA / EXIF / XMP / PNG 文本块	删除 AI 生成相关字段	本地副本可被清理，但不等于平台或模型服务端记录消失
SynthID 等隐形水印	用扩散再生成削弱水印	目前主要来自作者声明，仍需第三方验证

所以，这个项目更像一次压力测试。它暴露了 AI 溯源体系的脆弱点，但还不能直接得出“所有水印都没用”的结论。

真正高风险的地方在用途。

如果它只被用于研究水印鲁棒性，问题还在安全测试范畴内。如果被用于规避平台“Made with AI”标签、广告审核、新闻发布规范或选举内容要求，性质就变了。那不是单纯的图像处理，而是对平台和监管判断的绕行。

元数据不是护身符，水印也不是身份证

AI 内容标识现在大致有三条路线：可见水印、不可见水印、加密来源凭证。

Google 推 SynthID。Adobe、Microsoft、OpenAI 等支持 C2PA Content Credentials。Meta 等社交平台会利用来源信息给内容打上 AI 标签。

这些路线都有用，但都不是护身符。

可见水印最直观，也最容易被裁切、修补或覆盖。元数据适合平台间传递，但会在截图、转码、编辑、二次上传中丢失。隐形水印更隐蔽，却要面对压缩、滤镜、再生成和对抗性处理。

老问题并不陌生。

相机 EXIF 曾被用来辅助判断拍摄设备和时间，后来也被广泛清理。数字版权管理长期试图用技术限制复制，最后仍要和法律、平台分发、商业激励一起运作。

AI 图像溯源正在走同一条路：技术能抬高造假和规避成本，但不能单独承担治理责任。

还有一个容易误解的点：去标识不等于匿名化。

项目文档也提示，去水印副本不能删除平台或模型服务端已有的生成记录。比如一张 Gemini 图片，如果曾经存在账号历史、产品上传记录或服务端备份里，本地文件被清理，不代表生成链路从世界上消失。

这句话很重要。

对普通读者来说，它能防止一个危险误判：清掉文件里的标签，不等于清掉责任。对平台和监管来说，它也说明本地文件只是证据链的一段，不是全部。

最受影响的是平台安全和合规团队

这类工具最直接冲击的，不是普通用户修图习惯，而是平台安全、内容治理和企业合规流程。

过去，平台可以把 C2PA、XMP DigitalSourceType、EXIF 字段当作自动标识依据之一。若这类字段被规模化清理，审核策略就要迁移到多信号判断。

这会增加成本，也会增加误判。

平台安全团队需要减少对单一元数据字段的依赖。更现实的做法，是把上传链路、账号行为、图像检测、传播上下文、人工复核放在一起看。开发者也要预期：只靠写入文件元数据来证明来源，抗删改能力有限。

合规从业者的动作更具体。

如果企业营销、媒体机构或广告团队已经把“文件自带 AI 标签”当作主要合规证明，就该延后对这类单点方案的采购判断，或要求供应商说明服务端记录、凭证校验、审计日志如何配合。采购不一定停，但不能只看一张图片下载后的字段。

关注 AI 内容治理的科技读者，也要把问题看窄一点。

这个项目并不证明所有 AI 标识都失效。它说明的是：本地文件标识很容易成为薄弱环节。真正能降低误导风险的，是多层证据链，而不是某一种水印格式的宣传页。

法律压力也在加大。

欧盟 AI Act 对 AI 内容标识设有义务安排。美国联邦和州层面，围绕来源信息、选举深伪和性深伪已有规则推进。中国深度合成相关规定要求显著标识。不同司法辖区口径不同，但共同方向很清楚：带有欺骗意图地移除来源信息，风险会变高。

接下来要看三件事，且都很具体。

GitHub 等代码托管平台会不会按滥用风险处理这类项目。Google、OpenAI、Adobe 会不会强化服务端核验和检测入口。社交平台会不会降低对单一元数据字段的权重，转向更重的风控链路。

若这些动作发生，AI 内容标识会从“文件里的一枚标签”，变成一套更贵、更慢、也更难绕开的系统。代价会落到平台审核、创作者发布和企业合规流程上。

回到开头那个项目，它真正刺中的不是某个水印方案，而是一个治理幻想：只要给 AI 图片贴上标签，后面的识别、审核和问责就会自动成立。

事实没那么省事。

GitHub 去 AI 水印项目提醒：AI 溯源不能只靠文件标签

水印风险

项目出现

能力边界

标识脆弱

元数据

证据链

服务端记录

受影响方

平台安全

它宣称能清三类标识，但不要把作者说法当验证结论

元数据不是护身符，水印也不是身份证

最受影响的是平台安全和合规团队