Meta 被成人视频公司告了：AI 数据饥饿，不能靠“员工摸鱼”糊弄过去

核心摘要 Summary

美国加州北区联邦法官驳回 Meta 撤诉请求，允许 Strike 3 Holdings 继续起诉 Meta 涉嫌通过公司 IP 批量 BT 下载并传播 2396 部成人视频。
Meta 尚未被判侵权，法院也未认定这些视频被用于 AI 训练；但法官认为“员工个人行为”的解释难以令人相信。
这案子刺中的不是成人视频猎奇，而是 AI 公司数据来源的审计问题：公司吃下规模红利，就不能出事后把账切给个人。

47 个 Meta IP，7 年，2396 部成人视频，6008 次 BT 下载。

这组数字来自 Strike 3 Holdings 的诉状。它旗下有 Blacked、Vixen、Tushy 等成人视频站点。美国加州北区联邦法官 Eumi K. Lee 现在驳回了 Meta 的撤诉请求，让这起版权诉讼继续往下打。

边界要先说清。Meta 还没有被判侵权。法院也没有认定这些成人视频已经被拿去训练 Meta AI。眼下成立的是：Strike 3 的指控足够具体，Meta 不能用“可能是员工私下下载”提前把案子打掉。

法官为什么不让 Meta 直接脱身

这案子的核心，不是“成人视频”三个字，而是公司 IP 上出现的下载模式。

问题	目前已知信息
谁告谁	Strike 3 Holdings 起诉 Meta
涉及内容	Blacked、Vixen、Tushy 等站点的 2396 部成人视频
涉嫌行为	2018-2025 年间，47 个 Meta IP torrent 相关视频 6008 次
Meta 辩解	可能是员工使用公司网络私下下载，不代表公司行为
法官关注	多个 Meta IP 同日下载带相同关键词的文件，更像协调收集数据

判决文件里有个细节很扎眼：多个 Meta IP 在同一天下载文件，文件名里带有相同关键词，比如 “teen”。这些文件不全是成人视频，也包括动画片、情景剧、电影。

这就削弱了“员工各自摸鱼”的说法。一个员工偷懒下载一部片，和多个公司 IP 同日围绕同一关键词抓一批内容，不是一个味道。

法官用了很重的表述：Meta 的说法 “strains credulity”，大意是难以令人相信。

还有一个容易被误读的点：是否实际用于训练 AI，并不决定版权案能不能继续。BT 下载和做种传播本身就是问题。AI 训练只是背景，不是侵权判断的唯一门槛。

我不太买账的是 Meta 的辩解姿势。

它当然可以抗辩。公司网络被员工滥用，也不是完全不可能。但 47 个 IP、跨多年、数千次下载、同日同关键词，这些事实叠在一起，“员工个人行为”就变薄了。

如果数据抓取成功，公司享受规模收益；如果版权方追上门，行为又被切成“个人私事”。这套话术，在互联网行业并不陌生。

AI 只是把胃口放大了。过去抓网页、图片、文本，很多公司喜欢用“公开可得”打马虎眼。到了生成式 AI，模型吞吐更大，训练集更黑箱，数据边界就更容易被压扁。

“天下熙熙，皆为利来。”放在这里不玄。数据越多，模型越可能变强；数据越便宜，商业账越好看。版权、同意、分成、审计这些慢问题，就会被高速扩张推到角落。

但法庭不看口号。它看记录、模式、归属和责任链。

这也是本案对 AI 行业最刺的一点：问题不在模型有没有胃口，技术当然有胃口。问题在公司是否把这种胃口制度化，然后在出事时装作只是几名员工偶发手滑。

对关注 AI 训练数据争议的科技读者，这案子给了一个很实用的判断口径：以后别只听“我们尊重版权”这类声明，要看数据来源能不能被审计。

如果一家 AI 公司说不清训练数据来自哪里，不能说明授权、过滤、留痕和删除机制，那它的风险就不是舆论风险，而是诉讼风险。开发者和企业采购团队会更谨慎。接入模型、采购 API、做企业知识库时，合同里会更想写清数据来源、侵权赔偿和下架机制。

对内容版权和创作者经济从业者，信号也很直接：维权不一定要从“证明模型学了我的作品”开始。至少在本案里，法官认为下载和做种本身已经足够重要，值得进入下一阶段审理。

这会改变一部分版权方的动作。小网站、图库、视频发行方、创作者机构，可能会更重视日志、哈希匹配、IP 记录和取证链。维权成本仍然很高，但证据路径更清楚了。

成人内容创作者尤其不该被写成猎奇背景板。成人内容行业长期流量巨大、污名也大。拍摄、制作、发行、订阅系统都是成本。不能因为内容类型敏感，就默认它更适合被免费拿走。

本案接下来最该看三个变量。

观察变量	为什么重要
Strike 3 能否证明下载行为与 Meta 公司活动有关	决定“公司责任”能不能站住
Meta 能否解释公司 IP 的使用、管控和员工行为边界	决定“员工个人行为”是不是还能成立
证据是否指向数据收集或训练用途	不决定下载侵权本身，但会影响公众和行业对 AI 数据链的判断

限制也要摆出来。现在不能把“涉嫌下载”写成“已经用于训练 AI”。也不能从这个案子推导出“所有 AI 公司都在盗版成人视频训练模型”。证据没到那一步。

但这次法官至少划出一条线：公司 IP 上发生的大规模、模式化下载，不能被一句“员工私事”轻轻洗掉。

这条线很重要。生成式 AI 的下半场，不只比模型参数，也比数据账本能不能见光。模型看着越聪明，背后的授权、留痕和责任越不能糊涂。

回到开头那组数字：47 个 IP、2396 部视频、6008 次下载。真正刺眼的不是数字大，而是它暴露了一种行业习惯——先把世界抓进来，等有人敲门，再讨论门票。