旧金山营销和网页设计机构 Qontour 做了一个《The Dictionary of Obscure Sorrows》网站。

它的域名是 thedictionaryofobscuresorrows.com。John Koenig 原项目域名是 dictionaryofobscuresorrows.com。只多了一个 “the”。

麻烦就从这里开始。

这个仿站收录作者介绍、媒体报道和购书链接,还转载了书中 311 个词条、定义、词源和短文。页面里有 DALL-E 2 生成图,也有 GPT-4 造词功能,还有 Amazon 联盟链接。

Koenig 本人已在邮件中否认参与该站。按目前公开材料看,这不是普通粉丝做了一个漂亮网页,更像是把一本仍在销售的书,重新包装成机构作品集、搜索入口和流量页面。

仿站为什么看起来像官方

《The Dictionary of Obscure Sorrows》不是一个突然冒出来的网络词典。

Koenig 从 2009 年起在 Tumblr 上发起这个项目,为那些真实存在、但不好命名的情绪造词。后来项目扩展到视频短片。词条 “sonder” 传播很广。

2021 年,Simon & Schuster 出版同名图书。这本书后来进入《纽约时报》畅销书榜。

Qontour 的站点大约在 2023 年前后上线。它在页脚和作品集中署名,称自己是这本书的粉丝,并把项目展示为 Webflow 设计、AI 图像库和互动功能案例。

问题不在“粉丝”两个字。

问题在于,它同时做了几件会制造官方感的事:接近原站的域名、完整的内容呈现、作者介绍、购书入口、AI 互动功能,再加上机构自己的作品集署名。

对比项Koenig 原项目 / 正规来源Qontour 站点带来的问题
域名dictionaryofobscuresorrows.comthedictionaryofobscuresorrows.com读者很容易误认
内容来源Tumblr 项目与 2021 年出版图书转载书中词条、定义、词源和短文涉嫌未经授权复制
图像呈现原书插图与原项目视觉DALL-E 2 生成图像改变作品呈现方式
新功能原项目没有 AI 造词入口GPT-4 生成新词混淆作者风格与机器生成内容
商业入口出版社和正规购书渠道Amazon 联盟链接存在流量变现机制
署名位置John KoenigQontour 页脚和作品集容易让人误判参与方

这里要守住事实边界。

目前没有法院认定 Qontour 侵权,也没有可靠证据说明联盟链接带来多少收入。能确定的是:Koenig 否认参与,站点转载了书中内容,Qontour 用它展示自己的网页和 AI 能力,并放入了可变现入口。

这已经不是“我喜欢这本书,所以做个导航页”的范围。

真正被抢走的是搜索入口

这起事件更麻烦的一层,是搜索。

公开材料显示,Google 对书名、词条名,甚至 John Koenig 本人姓名的搜索结果中,Qontour 站点常常排在官方 Tumblr、出版社页面或 Wikipedia 之前。ChatGPT、Gemini 等问答结果也曾把该站当作官方来源,并把站点归到 Koenig 名下。

传统盗版站多半是把内容复制过去,等人访问。

这一次的玩法更像是:复制内容,优化网页,加 AI 功能,争夺搜索和答案入口。

对读者来说,结果很直接。你搜一本书,点进一个看似更完整、更现代的网站,可能以为这就是作者本人维护的页面。你再引用、转发、购买,错误来源就继续扩散。

对创作者和出版方来说,损失也不只是哪几本书的销量。

更大的成本是纠错。作者要解释“这不是我做的”;出版社要提交投诉;读者和媒体要重新核对来源。一个十多年积累出来的语言项目,被一个优化更好的页面盖在前面,署名和来源就会慢慢变脏。

Simon & Schuster 去年曾向 Google 提交 DMCA 移除请求。公开材料显示,请求涉及盗版站的两个页面。但从后续可见性看,这并没有明显改变该站在搜索结果里的位置。

这说明一个现实约束:版权方可以投诉具体页面,却很难马上修正搜索系统和 AI 摘要系统里的“来源判断”。

出版、媒体和内容团队遇到类似情况,动作不能只停在发声明。更现实的做法是三件事:

  • 核对高频搜索词,确认仿站是否压过官方页面;
  • 固定证据,整理域名、页面、版权声明、联盟链接和 AI 功能;
  • 同时向搜索平台、托管服务、联盟平台和 AI 问答产品提交更正或移除请求。

这不浪漫,但有用。

AI 放大了未经同意的再包装

这件事不能简单写成“AI 写了一本假书”。

事实不是这样。Koenig 的原文被转载,AI 主要被用在两处:一是 DALL-E 2 图像,二是 GPT-4 造词功能。

也正因为如此,它更值得警惕。

AI 在这里不是唯一的侵权来源,而是降低了再包装成本。换图、做交互、生成新词、搭一个看起来更现代的网站,都变得便宜。复制者不需要重建十几年的创作积累,只要把人类作品放进一个更会被搜索抓取的壳里。

对独立创作者来说,最危险的是“控制权”被拆开。

文字还在你的书里,名字还在封面上,但搜索入口可能在别人手里。读者看到的视觉风格可能不是你定的。AI 生成的新词可能被误以为是你的延展。购书点击也可能先流经别人设置的页面。

对出版和内容平台从业者来说,接下来最该观察的不是模型又会不会画图、造词。

更具体的变量有两个:

变量该看什么为什么重要
搜索平台处理投诉后是否降权、移除、标注原始来源决定仿站还能不能继续吃入口流量
AI 问答纠错ChatGPT、Gemini 等是否更正来源归属决定错误署名会不会被答案系统继续放大

普通读者也有一个很小但有效的动作:买书、引用、转载、做资料卡之前,先看域名、出版社页面和作者长期运营的原始页面。

这不是洁癖。

在 AI 可以把一个仿站做得很像官方站的时候,核对来源就是对创作者最基本的保护。