有人把 8.4 万个 Firefox 扩展几乎装了个遍,然后发现了浏览器世界最荒诞的一面

安全 2026年4月11日
有人把 8.4 万个 Firefox 扩展几乎装了个遍,然后发现了浏览器世界最荒诞的一面
一位开发者试着抓取并分析 Firefox 插件商店里几乎全部扩展,最终整理出约 8.4 万个样本、总体积约 49.3GB 的数据集。这个看似极客式的“整活”,最后却意外照出了浏览器扩展生态的真实切面:从臃肿、低质、AI 批量生成,到钓鱼、SEO 垃圾和灰色流量生意,Firefox 商店像一个缩小版的互联网。

一次“全量安装”实验,撕开了扩展商店的外壳

互联网上总有一些实验,起初看着像是程序员无聊时的自娱自乐,做着做着却突然变成了严肃的行业观察。最近,开发者 Jack Cab 干的就是这么一件事:他试图抓取并分析 Firefox 插件商店里几乎所有扩展。

这件事的起点非常朴素,甚至有点天真——既然 Firefox 扩展总数“只有”8.4 万左右,听起来似乎还没大到不可思议,那不如都下载下来看看。最终,他拼出了一个包含 84235 个唯一扩展的数据集,估算总大小约 49.3GB,平均每个扩展 584.9kB。严格来说,不是 100%,因为有极少数扩展在抓取过程中消失,或者没被索引到,但 99.94% 这个覆盖率,已经足够让人对整个生态做一次近乎“人口普查”式的扫描。

最有趣的地方在于,这不是 Mozilla 官方发布的年度透明度报告,也不是什么安全公司高价订阅的行业数据库,而是一个人靠公开 API、脚本和一点耐心,硬生生把插件市场摸了个底朝天。它再次提醒我们:很多互联网平台表面上看起来秩序井然,真正把数据摊开,才知道里面住着多少奇怪的居民。

API 很开放,但“看见全部”并不容易

这次实验有个很微妙的背景。Firefox 扩展商店 AMO(addons.mozilla.org)提供了公开 API,不需要认证,表面上也几乎没有显性的限流。按理说,这应当是一个很适合做研究和第三方审计的开放接口。但现实很快证明,“开放”不等于“透明”。

Jack 一开始从搜索接口下手,试图按分页把所有扩展拉下来,结果发现默认只能拿到 600 页,也就是 3 万条记录,连一半都不到。之后他不断更换排序方式,比如按创建时间、评分、热度、更新时间抓取,再通过 slug 去重,数量一点点往上爬,但始终抓不全。后来他意识到可以利用 exclude_addons 参数,把已拿到的扩展排除掉,继续往后翻页。再后来,他又发现按分类并行抓取 600 页,才是更接近“正确”的办法。

这个过程听上去像在解一道 API 谜题,实际上反映了今天很多平台的共同问题:你可以访问数据,但很难完整理解数据。接口文档往往只告诉你“怎么调用”,却不告诉你“怎样才能真正看全”。对普通用户来说,这没什么关系;但对研究者、媒体、安全团队来说,这意味着平台的真实面貌常常被分页、排序、推荐逻辑和各种产品设计折叠了。你看到的不是全貌,而是平台允许你优先看到的那部分世界。

这也是为什么我觉得这件事比“有人闲着没事下载了很多插件”更重要。它触及了一个更大的问题:当数字平台越来越像基础设施,我们究竟有没有办法系统性地审视它们?如果连“商店里到底有多少商品、都是什么货色”都很难说清,治理就很容易沦为事后灭火。

你以为扩展都很轻巧,结果最大的快 200MB

把 8.4 万个扩展摊开以后,最先冒出来的是一种近乎喜剧的荒诞感。我们很多人对浏览器扩展的印象,还是“小工具”:改改页面样式、拦截广告、管理标签页,应该都很轻很小。但数据给了完全不同的答案。

最大的 Firefox 扩展是 dmitlichess,体积达到 196.3MB,原因非常朴实——它塞进去了 2000 多个音频文件。后面的“重量级选手”也很有戏剧性:有的直接打包了一整个 Unity 应用,有的内置了 Tesseract.js 这种 OCR 引擎,有的塞入了深度伪造检测模型和 ONNX 运行时,还有的只是因为装进了几百张、上千张图片,把自己做成了“浏览器扩展形态的素材包”。

这背后其实反映了浏览器扩展功能边界的变化。过去扩展更像浏览器上的小补丁,现在它越来越像一种轻量应用容器。AI 模型、本地 OCR、音视频资源库,甚至接近独立 App 的功能,都开始往扩展里塞。这当然带来更强的能力,但也意味着更复杂的审核压力、更高的资源占用,以及更难被普通用户理解的风险边界。

反过来看,最小的扩展只有 7518 字节,几乎没有代码。这种反差很像今天的软件世界本身:一边是越来越臃肿的“万物皆可塞进去”,另一边是大量功能空心、靠包装上线的壳。扩展商店不是例外,它只是把这种两极分化表现得更直白。

真正令人不安的,不是臃肿,而是劣质与恶意

如果说大体积还只是让人哭笑不得,那接下来的发现就没那么轻松了。Jack 在全量样本里翻出了大量明显的问题扩展:同形异义字符伪装的钱包插件、诱导用户交出助记词的钓鱼页面、批量生成的低质 AI 扩展、试图利用作者主页做 SEO 垃圾外链的投机者,还有一大串名字高度相似、瞄准“自定义搜索”和“新标签页流量”的 PUA/灰色软件产品。

这部分内容特别值得关注,因为它和我们这些年熟悉的移动应用商店乱象,几乎是同一套剧本。只不过浏览器扩展长期没有像手机 App 那样被公众高频讨论,于是很多人低估了它的攻击面。可现实是,浏览器扩展能看到的东西非常多:网页内容、Cookie、剪贴板、标签页、跳转行为,权限一旦给出去,某种意义上它比一个普通 App 更贴近你的数字生活核心区。

Jack 甚至提到,某些钓鱼扩展的实现方式其实很“偷懒”——装上后弹一个表单,让你自己交出助记词。这种低水平诈骗竟然也能混进商店,本身就说明审核机制并不总能在前端拦住问题。更讽刺的是,其中一个伪装钱包扩展会在安装三秒后从一个 NocoDB 表格里拉取钓鱼地址,再打开页面;而它的商店说明居然还写着“不涉及账户或远程代码”。这种心虚又敷衍的声明,几乎到了黑色幽默的程度。

好消息是,Jack 向 Mozilla 举报后,一批问题扩展很快被下架。坏消息同样明显:如果不是有人这样大规模地扫一遍,很多东西可能会在角落里待上很久。平台审核从来不是一次性动作,而是和垃圾内容、自动化生产、灰产套利之间的长期拉锯。AI 进一步降低了“做一堆差不多的东西然后撒网碰运气”的成本,这个问题只会越来越严重。

Firefox 扩展商店,像一面缩小版互联网的镜子

我读完这次实验,最大的感受不是“Firefox 怎么这么乱”,而是“整个互联网原来都浓缩在这里”。有认真做产品的人,有把浏览器当应用平台的人,有热衷整活的个人开发者,也有低质重复、流量套利、钓鱼欺诈和自动生成内容的产业链。它们同时存在,而且共享同一个分发平台。

这也是浏览器扩展生态最尴尬、也最迷人的地方。它门槛没有移动应用那么高,开放性比 iOS 强得多,创作者文化又比传统桌面软件更活跃,所以你总能看到一些稀奇古怪但非常有生命力的作品。可开放性的另一面,恰恰是治理成本高、质量参差不齐,甚至容易成为安全薄弱环节。

放在 2025 年这个时间点看,这件事还有一层额外意义。浏览器正在重新变成 AI 时代的关键入口。越来越多服务在网页里完成,越来越多助手通过扩展接入用户工作流,浏览器权限也因此变得更有价值。谁控制了浏览器层,谁就更接近用户真实的操作链路。在这种背景下,扩展商店不再只是个“小众插件集市”,而是潜在的高风险分发节点。

和 Chrome Web Store 相比,Firefox 的体量小得多,但小不意味着简单。恰恰因为规模没有大到完全工业化治理,很多边缘问题更容易暴露出来。对于 Mozilla 来说,这次民间普查其实是个提醒:开放 API 很好,社区研究也很好,但平台不能总靠热心网友顺手做基础治理。更透明的索引、更主动的异常发现、更清晰的权限提示和开发者信誉体系,都会是下一步必须补上的功课。

从媒体角度说,我很喜欢这种带点“极客考古”气质的项目。它没有宏大的商业发布,也没有资本市场的喧嚣,却比很多新闻更接近互联网的真实土壤。你会看到一个产品生态是怎么在日积月累中长出皱纹、赘肉、寄生虫和惊喜的。技术世界最迷人的时刻,往往不是发布会上喊出一句改变世界,而是有人真的弯下腰,把系统底层的灰尘翻给你看。

比起“全装一遍”,更重要的是谁来长期盯着它

这次实验最后产出了一份公开数据集,放在 Hugging Face 上,某种程度上给研究者、安全团队和好奇的开发者都留了一份样本库。这样的工作价值很实际:它让外部世界第一次更接近完整地看到 Firefox 扩展商店,也让一些原本零散的问题有了被系统分析的可能。

但它也留下一个不太轻松的问题:今天的主流数字平台,究竟有多少仍然依赖平台外部的志愿式审查?当一个研究者可以靠脚本发现钓鱼扩展、SEO 垃圾和批量 AI 生成物时,平台自身是否也该提供更成熟的风险可视化工具?用户选择安装一个扩展时,除了看评分和简介,还能不能看到更有意义的信号,比如权限异常、代码相似度、批量开发者关联、外链可疑度?

说到底,扩展商店从来不只是“插件下载页”,它本质上是一套信任分发系统。谁能上架、谁更容易被看见、谁在出事前被拦下来,都会直接影响到用户日常上网的安全感。Firefox 这 8.4 万个扩展,像一个小型社会;而任何一个社会,一旦规模够大,就不可能只靠善意和运气维持秩序。

Summary: 在我看来,这次“几乎装遍所有 Firefox 扩展”的实验,真正重要的不是猎奇数据,而是它暴露了平台治理的现实:开放生态依然有活力,但也越来越容易被低质内容、自动化生产和恶意行为侵蚀。未来浏览器会因为 AI 和网页应用再度成为核心入口,扩展商店的安全与透明度只会比今天更关键。谁能把开放和治理同时做好,谁才配继续扮演下一代网络入口的守门人。
Firefox扩展商店浏览器扩展生态MozillaFirefox恶意扩展钓鱼SEO垃圾公开API抓取AI批量生成Jack Cab