Cloudflare Radar 的全球流量页,最近被拿来解释一个很刺激的说法:机器人流量首次超过人类。
但按当前页面数据,这句话站不住。Cloudflare Radar Traffic Worldwide 的 bot-vs-human 模块显示,近 7 天被分类的 HTML 页面 HTTP 请求里,Human 占 65.9%,Bot 占 34.1%。
34.1% 已经不低。问题是,它还没有超过 65.9%。
这事有意思的地方不在标题,而在口径。一个数字如果不先问“统计了什么”,很容易从安全信号变成传播误差。
当前数据只说明网页请求里 bot 很多,不说明它超过人类
Cloudflare 这个模块统计的是“被分类为 bot 或 human 的 HTML 内容 HTTP 请求”。更直白地说,它看的是网页页面请求的一部分。
它不是全部互联网流量。也不是总字节、视频传输、API 调用、静态资源下载或所有网络连接。
所以,目前能得出的判断很窄,也很清楚:在 Cloudflare Radar 当前可见口径下,近 7 天 HTML 页面请求里,人类请求仍多于机器人请求。
| 项目 | 当前页面显示 | 能说明什么 | 不能说明什么 |
|---|---|---|---|
| 数据源 | Cloudflare Radar Traffic Worldwide,bot-vs-human 模块 | 来源明确,可做近实时观察 | 不能代表所有网络流量 |
| 时间范围 | Last 7 days | 说明近 7 天状态 | 不能自动推出长期趋势 |
| 统计对象 | 被分类为 bot 或 human 的 HTML 内容 HTTP 请求 | 更接近网页访问 | 不能代表 API、视频、总字节 |
| 全球占比 | Human 65.9%,Bot 34.1% | bot 占比已经很高 | 不能写成 bot 超过 human |
如果要写“首次超过人类”,至少要有明确时间点、历史曲线,或另一个可复核的数据源。没有这些支撑,就不能把一个当前不成立的标题当新闻事实。
我不太买账的地方也在这里。科技新闻可以有判断,但判断不能越过数据口径。
bot 不是全都恶意,但它已经足够影响网站判断
bot 不是一个坏词。
搜索引擎爬虫、监测工具、RSS 抓取、可用性探测,都可能属于自动化请求。恶意扫描、撞库、垃圾注册、内容批量抓取,也会混在 bot 里。
这就是网站团队最难受的地方:不能全放,也不能全封。
全放,带宽、缓存、日志、风控成本会上升。全封,搜索收录、监测报警、正常集成又可能被误伤。
Cloudflare 页面还列出了一些 bot 占比较高的地区,包括 Gibraltar、Iran、Singapore、Ireland、Netherlands。其中 Gibraltar 近 7 天 bot HTTP 请求占比为 92.0%,Singapore 为 76.4%,Ireland 为 72.9%。
这些数字不能简单理解成“当地真人用户少”。更稳妥的看法是:这些地区可能涉及数据中心出口、托管服务、代理网络或自动化访问集中出现。具体原因还需要结合网站自己的日志看。
对网站运营团队来说,动作应该很具体:
- 把 Human、Bot 分开看,不要只盯总 PV;
- 广告曝光、转化率、热门文章排行,要排查 bot 稀释;
- 对高频抓取设置限速,而不是一刀切封锁;
- 登录、支付、评论、注册入口,要比普通页面更严;
- HTML 页面请求、API 请求、静态资源、总字节,要拆成不同仪表盘。
对关注 AI 抓取的内容团队,重点也不是喊“机器人来了”。重点是算账:哪些页面被频繁抓取,是否带来带宽和缓存压力,是否影响版权策略,是否需要给不同爬虫设访问规则。
这比争一个耸动标题更有用。
接下来要看三件事,而不是重复“首次超过”
Akamai、Imperva 等安全厂商也长期发布自动化流量和恶意 bot 报告。行业里真正稳定的判断是:网页流量早已人机混杂。
但“人机混杂”和“机器人首次超过人类”不是一回事。前者是现状描述,后者需要证据证明拐点。
接下来最该看的不是单日截图,而是三类变量:
| 观察变量 | 为什么重要 | 判断条件 |
|---|---|---|
| 长期曲线 | 看 bot 占比是短期波动还是持续上升 | 需要可复核的历史数据 |
| 请求类型 | HTML、API、静态资源、总字节差别很大 | 不能混成一个“全网流量” |
| 内容类型 | 媒体、文档、电商详情页承压不同 | 要看具体站点日志和成本 |
如果 Cloudflare 或其他厂商给出明确时间点和历史序列,那“是否首次超过”才有讨论基础。在此之前,当前页面最多说明:bot 已经是网页访问里的大块头,但还不是超过人类的那一个。
回到开头那个问题:机器人流量是不是已经超过人类?
按 Cloudflare Radar 当前这个页面,不是。
但如果你运营网站,答案也不能只停在“不是”。三分之一左右的 HTML 页面请求来自 bot,已经足够改变报表、成本和安全策略。数往实处看,题往轻处下,才不至于把口径错当拐点。
