Atlassian 改口了。它过去说不会用客户数据训练或改进 AI 服务,现在改成从 2026 年 8 月 17 日开始,默认收集 Jira、Confluence 等云产品里的客户元数据和部分应用内内容,用来训练自家的 Rovo、Rovo Dev 等 AI 功能。影响面大约 30 万客户。

这件事真正重要的地方,不在于 Atlassian 也想喂饱 AI——同行几乎都在这么干——而在于它把“不同意”的权利做成了分级商品。低价档客户的数据更容易被拿去训练,高价档客户才有更强的退出权。天下熙熙,皆为利来,SaaS 厂商这次连遮羞布都懒得多披一层。

默认收集已经写进套餐逻辑

Atlassian 把数据分成两类。

一类是元数据,包括可读性和复杂度评分、任务分类、语义相似度、story points、Sprint 结束时间、Jira Service Management 的 SLA 数值等。另一类是应用内内容,包括 Confluence 页面标题和正文、Jira 议题标题、描述、评论,以及自定义表情名、状态名、工作流名称。

套餐差别很直白:

  • Free、Standard.元数据始终开启,不能退出;应用内内容默认开启,但可配置
  • Premium.元数据仍然始终开启;应用内内容默认关闭
  • Enterprise.两类都默认关闭,并保留更完整的退出控制

还有几类客户被排除在外,比如用了客户自管密钥、Atlassian Government Cloud、Isolated Cloud,或者有 HIPAA 合规要求的环境。

Atlassian 说会去标识化、做聚合保护。应用内数据在删除或退出后 30 天内清除,用过这些数据训练的模型会在 90 天内重新训练;元数据最长保留 7 年。

问题也就在这里。所谓“元数据”不是无害边角料。Story points、SLA、工作流名字、项目节奏,足够让外部模型看出一家团队怎么协作、哪里卡顿、谁在赶工。它未必暴露身份证号,却可能暴露组织结构和经营压力。对很多企业来说,这比个人信息还敏感。

真正卖的不是 AI,而是数据主权

Atlassian 的算盘不难懂。Rovo 这类企业 AI 助手要好用,离不开真实工作流数据。公开网页语料教不会它理解 Jira ticket 的优先级,也教不会它读懂 Confluence 里那套公司黑话。厂商最缺的,从来不是模型口号,而是企业内部的活数据。

所以这更像一笔交换:你买的是协作软件,厂商盯上的却是你组织运行时留下的数字脚印。奥斯本说过,"数据是新的原材料"。放到今天,这句话后半句更关键:谁掌握原材料,谁就有定价权。

横向看,这不是 Atlassian 一家在飘。微软把 Copilot 深嵌进 Microsoft 365,Google 也在 Workspace 里猛推 Gemini,企业软件行业都想把办公行为重新包装成 AI 资产。但 Atlassian 这次更刺耳,因为它把控制权和价格绑定得太明白:想彻底少交数据?去买更贵的套餐,或者迁到更特殊的部署。

这不是技术升级,更像经典平台治理手法。铁路时代卖的是通行权,云时代卖的是算力,AI 时代开始卖“谁能决定你的数据怎么被再利用”。其形不同,其理一也。

谁最难受:不是大企业,是夹在中间的团队

最受影响的不是最有钱的大客户,恰恰是中型公司、创业团队、预算卡得很死的 IT 负责人。Enterprise 客户通常有法务、采购和架构团队,能谈条件,也能迁移。真正难受的是那批已经深度用 Jira 和 Confluence、又上不起 Enterprise 的组织。

他们接下来要面对几个很现实的动作:

  • 盘点每个租户的最高有效套餐,因为默认策略跟这个直接挂钩
  • 检查应用内数据开关,别等上线后才发现默认状态已经变了
  • 重新评估是否继续把敏感项目、工单和知识库留在 Atlassian Cloud
  • 把“AI 功能值不值”改成“数据控制值不值这个价”

还有一个外界容易忽略的限制:Atlassian 说 90 天内会对已训练模型做再训练,以移除退出数据贡献的影响。听上去体面,执行上却很重。到底是全量重训、局部再训练,还是靠其他技术路径“冲淡”影响,目前看不清。企业最该盯的,不是公关文案里的承诺,而是之后是否给出可审计、可验证的删除与模型更新证据。

如果这套做法没有遭到强力反弹,别指望它停在 Atlassian。企业 SaaS 下一轮竞争,卖点表面是 AI 助手,底层其实是:谁能更顺手地把客户工作过程变成自己的模型燃料。