GitHub 星标本来只是开发者顺手点的一次收藏,如今却被做成了一门明码标价的生意。来自卡内基梅隆大学、北卡州立大学和 Socket 的研究团队在 ICSE 2026 发表论文称,2019 到 2024 年间,GitHub 上约有 600 万个疑似假星,分布在 18,617 个仓库,背后是大约 30.1 万个账号。更刺眼的是,AI 和 LLM 项目已经成了最大的非恶意刷星类别之一。
这条新闻真正重要,不在“GitHub 也有水军”——任何平台只要有公开指标,就会有人刷。问题在于,GitHub 星标早已不是单纯的社区反馈,它已经进入融资、媒体报道、排行榜和平台推荐算法,开始承担“增长证明”的角色。当一颗星最低只要 0.03 美元,而一轮种子融资可能是 100 万到 1000 万美元,诱惑就不再是面子,而是现金流。
星标失真,失去的不只是排行榜公平
这项研究最有分量的地方,是它把“感觉不对劲”变成了可检验的数据。研究者用 StarScout 分析了 20TB 的 GitHub 元数据、67 亿条事件和 3.26 亿次星标,发现到 2024 年 7 月,所有拥有至少 50 星的仓库里,16.66% 已经卷入假星活动。更直接的旁证是:被标记的仓库中,到了 2025 年 1 月已有 90.42% 被删除;被标记账号里,也有 57.07% 消失。这说明 GitHub 自己后续也认定其中相当一部分有问题。
原文还做了 20 个项目的抽样分析,方法很朴素:随机看 stargazer 的账号年龄、公开仓库数、粉丝数、是否有 bio,再把 fork/star、watcher/star 这些更难伪造的比值一起看。这个思路比盯着“账号是不是新注册”更有效,因为现在很多卖家提供的已不是一次性小号,而是养过几年、看起来正常的老号。
这里有个很容易被忽略的背景:GitHub 星标本来就不是“活跃用户数”,它更像低成本兴趣表达。也就是说,星标天然偏虚,不刷也未必代表真实使用。所以当一个指标原本就宽松,又被资本和榜单过度使用,它就会更快失真。对比一下 Product Hunt 的 upvote、App Store 的评分,路径几乎一样:一旦平台外部把单一指标当成筛选器,围绕这个指标的灰产就会成熟。
真正被操纵的,是融资线索而不是社区情绪
这件事最现实的后果,在 VC 圈。Redpoint 合伙人 Jordan Segall 公开写过,开发者工具公司在种子轮融资时的 GitHub 星标中位数是 2850,A 轮是 4980,而且很多 VC 会自己写爬虫,专门找“星标增长快”的项目。行业里还有 Runa Capital 的 ROSS Index,按 GitHub 星标增速给开源创业公司排位。原文点名的 Union Labs,就曾在 2025 年 Q2 登上该榜单第一,但研究与抽样都显示其星标结构存在明显异常。
问题到这里就变了:刷星不是社区作弊那么简单,而是在影响谁能更早被投资人看见、谁能拿到会议、谁能在媒体稿件里被写成“热门开源项目”。对早期创业团队来说,这一步常常比收入本身更关键。
这也是我不太认同“星标只是虚荣指标,不必当真”的地方。对成熟项目,星标失真可能只是公关噪音;对还没活下来的小团队,它会改变融资机会分配。老老实实做产品的团队,可能在榜单、社媒和投资人搜寻结果里被挤到后面。最吃亏的不是大公司,而是没有预算买流量、也没有人脉讲故事的开源团队。
更麻烦的是,执法和平台治理都不容易。美国 FTC 在 2024 年已明确禁止伪造社交影响力指标,单次违规最高罚到 53,088 美元;SEC 也处理过创业者在融资中夸大增长数据的案件。但 GitHub 星标介于“社区互动”和“商业披露”之间,平台删号容易,定责不易。只要投资人、加速器、媒体和榜单继续把星标当成快速信号,需求端就还在。
开发者以后该怎么看一个项目靠不靠谱
如果你是开发者,今后看开源项目,星标还可以看,但最多只能当封面,不该当正文。更有参考价值的,其实是几组组合信号:
- fork/star 比值是否过低;十几万星却几乎没人 fork,通常不正常
- watcher 数是否接近“真空”;有人收藏却没人追更新,说明使用意愿弱
- issue、PR、release 是否持续更新,而不是只有营销期冲高
- 贡献者结构是否真实;有没有稳定维护者,而不是靠机器人堆提交记录
原文给了一个具体锚点:FreeDomain 有 15.7 万星,但只有 168 个 watcher、2676 个 fork,抽样 stargazer 中 81.3% 零粉丝。这样的仓库在榜单上会很好看,在采购、集成和技术选型里却未必安全。
所以,这场“假星经济”最不重要的部分,是谁的门面难看了;最重要的部分,是开源世界里一个本来用于发现好项目的信号,正在被公开售卖并传导到融资判断。平台可以删账号,投资人可以改模型,媒体也该少拿星数当 headline。否则,刷出来的不是热度,而是错误配置资本的通道。
