47 个 Meta IP,7 年,2396 部成人视频,6008 次 BT 下载。
这组数字来自 Strike 3 Holdings 的诉状。它旗下有 Blacked、Vixen、Tushy 等成人视频站点。美国加州北区联邦法官 Eumi K. Lee 现在驳回了 Meta 的撤诉请求,让这起版权诉讼继续往下打。
边界要先说清。Meta 还没有被判侵权。法院也没有认定这些成人视频已经被拿去训练 Meta AI。眼下成立的是:Strike 3 的指控足够具体,Meta 不能用“可能是员工私下下载”提前把案子打掉。
法官为什么不让 Meta 直接脱身
这案子的核心,不是“成人视频”三个字,而是公司 IP 上出现的下载模式。
| 问题 | 目前已知信息 |
|---|---|
| 谁告谁 | Strike 3 Holdings 起诉 Meta |
| 涉及内容 | Blacked、Vixen、Tushy 等站点的 2396 部成人视频 |
| 涉嫌行为 | 2018-2025 年间,47 个 Meta IP torrent 相关视频 6008 次 |
| Meta 辩解 | 可能是员工使用公司网络私下下载,不代表公司行为 |
| 法官关注 | 多个 Meta IP 同日下载带相同关键词的文件,更像协调收集数据 |
判决文件里有个细节很扎眼:多个 Meta IP 在同一天下载文件,文件名里带有相同关键词,比如 “teen”。这些文件不全是成人视频,也包括动画片、情景剧、电影。
这就削弱了“员工各自摸鱼”的说法。一个员工偷懒下载一部片,和多个公司 IP 同日围绕同一关键词抓一批内容,不是一个味道。
法官用了很重的表述:Meta 的说法 “strains credulity”,大意是难以令人相信。
还有一个容易被误读的点:是否实际用于训练 AI,并不决定版权案能不能继续。BT 下载和做种传播本身就是问题。AI 训练只是背景,不是侵权判断的唯一门槛。
真正难看的是甩锅逻辑
我不太买账的是 Meta 的辩解姿势。
它当然可以抗辩。公司网络被员工滥用,也不是完全不可能。但 47 个 IP、跨多年、数千次下载、同日同关键词,这些事实叠在一起,“员工个人行为”就变薄了。
如果数据抓取成功,公司享受规模收益;如果版权方追上门,行为又被切成“个人私事”。这套话术,在互联网行业并不陌生。
AI 只是把胃口放大了。过去抓网页、图片、文本,很多公司喜欢用“公开可得”打马虎眼。到了生成式 AI,模型吞吐更大,训练集更黑箱,数据边界就更容易被压扁。
“天下熙熙,皆为利来。”放在这里不玄。数据越多,模型越可能变强;数据越便宜,商业账越好看。版权、同意、分成、审计这些慢问题,就会被高速扩张推到角落。
但法庭不看口号。它看记录、模式、归属和责任链。
这也是本案对 AI 行业最刺的一点:问题不在模型有没有胃口,技术当然有胃口。问题在公司是否把这种胃口制度化,然后在出事时装作只是几名员工偶发手滑。
谁会被这案子影响,接下来盯什么
对关注 AI 训练数据争议的科技读者,这案子给了一个很实用的判断口径:以后别只听“我们尊重版权”这类声明,要看数据来源能不能被审计。
如果一家 AI 公司说不清训练数据来自哪里,不能说明授权、过滤、留痕和删除机制,那它的风险就不是舆论风险,而是诉讼风险。开发者和企业采购团队会更谨慎。接入模型、采购 API、做企业知识库时,合同里会更想写清数据来源、侵权赔偿和下架机制。
对内容版权和创作者经济从业者,信号也很直接:维权不一定要从“证明模型学了我的作品”开始。至少在本案里,法官认为下载和做种本身已经足够重要,值得进入下一阶段审理。
这会改变一部分版权方的动作。小网站、图库、视频发行方、创作者机构,可能会更重视日志、哈希匹配、IP 记录和取证链。维权成本仍然很高,但证据路径更清楚了。
成人内容创作者尤其不该被写成猎奇背景板。成人内容行业长期流量巨大、污名也大。拍摄、制作、发行、订阅系统都是成本。不能因为内容类型敏感,就默认它更适合被免费拿走。
本案接下来最该看三个变量。
| 观察变量 | 为什么重要 |
|---|---|
| Strike 3 能否证明下载行为与 Meta 公司活动有关 | 决定“公司责任”能不能站住 |
| Meta 能否解释公司 IP 的使用、管控和员工行为边界 | 决定“员工个人行为”是不是还能成立 |
| 证据是否指向数据收集或训练用途 | 不决定下载侵权本身,但会影响公众和行业对 AI 数据链的判断 |
限制也要摆出来。现在不能把“涉嫌下载”写成“已经用于训练 AI”。也不能从这个案子推导出“所有 AI 公司都在盗版成人视频训练模型”。证据没到那一步。
但这次法官至少划出一条线:公司 IP 上发生的大规模、模式化下载,不能被一句“员工私事”轻轻洗掉。
这条线很重要。生成式 AI 的下半场,不只比模型参数,也比数据账本能不能见光。模型看着越聪明,背后的授权、留痕和责任越不能糊涂。
回到开头那组数字:47 个 IP、2396 部视频、6008 次下载。真正刺眼的不是数字大,而是它暴露了一种行业习惯——先把世界抓进来,等有人敲门,再讨论门票。
