一项内部 AI 项目,如果要记录键盘输入、鼠标移动、点击位置,甚至屏幕内容,员工能不能说不?

Meta 员工近日发起请愿,要求 Mark Zuckerberg 和 Meta 领导层明确承诺:不得收集正式员工、合同工和实习生的 “computer-use data”,用于训练 AI 或机器学习模型。请愿指向公司内部项目 MCI,也就是 Model Capability Initiative。

这件事最容易写过头。现有材料不能证明 Meta 已经实施了全面员工监控。它更像一次围绕内部项目的员工反弹。

但它有意思的地方也在这里:AI agent 想学会操作软件,最想要的正是人怎么点、怎么输、怎么切屏。训练数据的边界,开始贴近员工的工作桌面。

MCI 被质疑采集的,是工作过程本身

请愿称,Meta 领导层曾在一个有限受众群组 MSL Infra FYI 中宣布 MCI 将推出。员工担心,项目涉及的不是普通系统日志,而是更靠近个人工作过程的人机交互数据。

被点名的数据类型包括:键盘输入、鼠标移动、点击位置、屏幕交互、设备使用习惯、导航行为和屏幕内容。

这些数据的敏感性不在单点,而在组合。一次点击可能没什么,一串键鼠轨迹加屏幕内容,就可能还原一个人的工作流、代码路径、内部文档访问习惯,甚至身份信息。

数据类型员工担心什么对企业意味着什么
键盘输入、鼠标移动、点击位置还原工作内容和行为节奏需要解释采集目的、范围和必要性
屏幕交互、屏幕内容扫入代码、文档、聊天、客户资料增加敏感数据和公司机密暴露面
设备使用习惯、导航行为形成员工行为画像涉及员工数据审查和目的限制

员工反对的直接原因也很具体。请愿称,他们询问项目做过哪些隐私审查、是否完成处理员工数据所需的 people data review,但没有看到已完成的审查结果。

请愿还提到,高管存在选择性 opt-out。这个细节很刺眼。

如果项目风险很低,为什么少数人需要退出通道?如果退出是合理的,为什么不是所有受影响员工都能有真实选择?

这就是主线:问题不只是采不采数据,而是谁有权拒绝。

争议核心不是 AI 要不要数据,而是员工能否有效同意

AI agent 要学会操作软件,确实需要高质量的人机交互数据。行业里,Anthropic、OpenAI、Google 都在推进能看屏幕、点按钮、调用工具的智能体能力。

但公开产品测试、用户授权数据、企业内部员工数据,不是一回事。

消费者可以不用一款应用。员工面对的是雇主、绩效、权限和岗位关系。公司给了告知,不等于员工就能自由说不。

这也是请愿最有分量的地方。它把“提升模型能力”这个技术目标,拉回到雇佣关系里的有效同意、比例原则和信任成本。

请愿还把风险放进了法律语境。它提到,员工数据受 CCPA 和 CPRA 保护,员工拥有知情、删除、更正以及限制使用等权利。它也引用 Meta 过往因明文存储用户密码在 2024 年被爱尔兰数据保护委员会罚款 9100 万欧元的案例,作为 GDPR 风险参照。

这里不能推出 MCI 已经违法。请愿不是监管裁决,项目实际采集范围和上线状态也还看不清。

但它至少说明,员工已经不愿意接受一句“为了 AI 能力提升”就交出工作桌面。

对企业隐私、安全和人力合规负责人来说,动作应该更具体:在键鼠、屏幕、导航数据接入训练集前,先暂停采购或内测推进;要求业务团队拿出已完成的隐私评估、员工数据审查、数据最小化方案、保留期限和退出机制。

如果这些文件拿不出来,风险就不是理论风险,而是上线风险。

Meta 和同行最该回答的,是四个可核验问题

这件事影响最大的,不是普通 Facebook 或 Instagram 用户。更直接的是 Meta 内部员工,以及所有准备拿员工操作数据训练 AI agent 的公司。

敏感数据泄露风险也不是抽象担忧。请愿提到,SSN、受保护健康信息、个人身份信息或公司机密,可能被一并采集和存储。

屏幕内容采集天然难做“只拿无害样本”。员工电脑上混着代码、客户记录、内部聊天、绩效材料和安全凭据。技术上可以做过滤和脱敏,但这不能替代事前边界。

现在最该看的不是口号,而是四个问题:

  • MCI 的实际采集范围是什么,是否包括键盘输入、屏幕内容和导航行为;
  • 项目处于什么状态,是测试、灰度,还是准备扩大;
  • 隐私审查和 people data review 是否已经完成,结论能否向受影响员工说明;
  • opt-out 是少数高管的选择,还是正式员工、合同工和实习生都能真实拒绝。

这里有一个现实约束:企业想训练更强的 AI agent,不会放弃高质量工作流数据。合成数据、公开任务数据、志愿测试数据都能用,但和真实办公环境相比,质量与覆盖面会打折。

也正因为如此,边界更要先讲清。

如果 Meta 不能把这些问题说明白,MCI 即便能提升模型能力,也会给同行留下一个反面样本:用员工信任换训练数据,短期看是数据捷径,长期看是治理负债。

回到开头那个问题。员工能不能说不?

在 AI 训练进入工作桌面之后,这不再是福利政策或内部沟通问题,而是企业能不能证明自己没有越界。