一名独立博客作者在 5 月 20 日发文指控:AI 公司未经作者同意抓取网上内容训练模型,后来又有人用 ChatGPT 复制或改写他的电商教程,发到别的网站上,并在 Google 搜索结果里排到原文前面。\n\n最扎眼的细节不是“AI 写了文章”。而是复制文里还保留了指向原作者网站的链接,连锚文本都一样。\n\n这像是搬运时没擦干净的脚印。\n\n但话要说清楚。原文没有给出涉事网站、查询词、排名截图,也没有给出指向具体 AI 公司的证据链。所以它不是一个可以直接下法律结论的案件。\n\n它更像一个样本:原创作者花时间写教程,别人用 AI 降低改写成本,搜索平台再决定谁拿走流量。麻烦就在这条链路里。\n\n## 个案的关键线索:链接和锚文本没改掉\n\n作者称,自己写的是电商教程。后来他在 Google 搜索中发现,有网站发布的相关文章排在自己前面。\n\n点进去后,他看到对方文章里还保留着指向自己网站的链接。锚文本也相同。\n\n这条线索很关键。它不能单独证明“某家 AI 公司侵权训练”,但足以支持一个更窄的判断:至少在这篇文章上,对方很可能参考、复制或改写了原教程,而且处理得很粗糙。\n\n这里要把两件事分开。\n\n| 层面 | 涉及对象 | 核心问题 | 目前能看到什么 |\n|---|---|---|---|\n| 模型训练 | AI 公司、内容作者 | 未经授权抓取内容训练模型,是否需要授权或补偿 | 原作者提出指控,但没有给出具体公司证据链 |\n| AI 改写发布 | 使用 AI 批量产文的网站作者 | 是否复制了原文结构、链接、表达,再低成本发布 | 作者称复制文保留了相同链接和锚文本 |\n| 搜索排序 | Google 搜索 | 为什么改写文能排到原文前面 | 个案显示风险,但缺少可复现排名和流量数据 |\n\n这张表里的区别很重要。\n\n训练争议,是 AI 公司和内容版权方之间的长期拉扯。直接改写他人教程再发布,则更接近过去的洗稿和搬运,只是工具从人工变成了模型。\n\n作者真正不满的,也不是“机器不能写字”。他不满的是:自己的研究和写作未获授权、未获补偿,却被别人低成本加工、再发布,甚至可能被拿去再售卖。\n\n对独立作者来说,这不是面子问题。教程类内容常常连接着咨询、课程、订阅、广告或电商转化。搜索入口被截走,后面的收益也会被截走。\n\n## 争议不只在 AI,而在谁拿走了原创的回报\n\nChatGPT 在 2022 年 11 月上线后,AI 写作进入了普通内容生产流程。到 2024 年,Google 也开始在搜索中测试和推广 AI Overviews,用生成式摘要回答部分查询。\n\n搜索、生成、发布靠得越来越近。原创作者的风险也变得更具体。\n\n过去的内容农场也会洗稿,但人力成本还在。生成式 AI 改变的是边际成本。\n\n一篇教程可以被快速改成多篇相似文章。标题、段落、内链、FAQ 都能批量生成。再配合 SEO 操作,就能去抢原文的关键词排名。\n\n这不是说所有 AI 内容都等于抄袭。企业用 AI 写产品说明、编辑用 AI 润色自有稿件、作者用 AI 整理提纲,都不能和搬运他人文章混为一谈。\n\n真正的问题是来源和收益不对称。\n\n原作者承担研究成本。改写者承担很低的生成成本。搜索平台把流量分出去。最后,原创者可能只剩下申诉成本。\n\n对内容创作者,动作要比情绪更重要。几件事可以先做:\n\n- 定期用核心段落、独特标题、站内链接锚文本搜索,监测是否被复制;\n- 用 Google Search Console 观察异常排名下滑和被抢占的关键词;\n- 被明显搬运时,保留原文发布时间、网页快照、截图和链接,再走版权投诉或 DMCA 流程;\n- 在页面里强化作者署名、首发信息、站内 canonical、更新记录和品牌识别。\n\n这些做法不能根治问题,但能降低维权时的举证成本。\n\n对企业站和内容团队,另一条线也要管住:不要把“用 AI 提效”变成“让模型改写竞品文章”。短期省人,长期会带来下架、投诉、搜索降权和品牌风险。\n\n## Google 不能只说排序是算法结果\n\n这个个案最难的地方,是外部读者很难复现。\n\nGoogle 排名会受地区、时间、账号状态、设备和搜索词影响。AI 改写也可能混合多个来源,不一定留下大段逐字复制。\n\n所以,把这件事直接升级成“某家公司已经侵权”,证据不够。把所有 AI 生成内容都说成抄袭,也不严谨。\n\n但平台责任不能因此消失。\n\nGoogle 多年来一直强调原创性、经验、专业性和可信度。Helpful Content、E-E-A-T 这些规则,说的都是同一件事:搜索应该奖励真正有帮助的来源,而不是奖励更会包装的复制品。\n\n如果一篇保留原站链接痕迹的改写文,还能排到原文前面,至少说明排序系统在三个地方有漏洞:\n\n- 对首发来源识别不够强;\n- 对引用关系和搬运痕迹判断不够准;\n- 对低成本批量内容的惩罚不够稳定。\n\n接下来真正该看的,不是平台口头支持原创,而是三类机制有没有变硬。\n\n| 观察对象 | 应该看什么 | 对创作者的实际影响 |\n|---|---|---|\n| Google 搜索 | 是否更稳定识别首发来源、降低改写站排名 | 决定原创文章还能不能拿回搜索入口 |\n| AI 公司 | 是否提供清晰的退出训练、授权、补偿机制 | 决定作者能否控制内容被训练和使用 |\n| 发布平台和站长 | 是否披露 AI 改写来源、处理版权投诉 | 决定搬运者的成本会不会上升 |\n\n我更在意的是第一项。\n\n因为对很多独立作者来说,搜索流量就是生计入口。授权机制可以慢慢谈,版权官司也可以慢慢打。但排名一旦被抢,损失往往已经发生。\n\n这也是这起指控的警示。AI 本身不是唯一问题。真正让原创者难受的,是 AI 把复制成本打下来,搜索又没能及时把来源秩序立起来。\n\n原创内容如果总是先被拿去训练,再被改写发布,最后还在搜索里输给改写者,那就不是技术进步的副作用。那是分配规则出了问题。