人工智能资讯
聚合当前分类下的最新内容,按时间顺序查看第 1 页精选文章。

AI 账单压到预算线:大模型高价还能撑多久
Uber 被提到在 4 个月内用完全年 AI 预算,Microsoft、Salesforce、GitHub 也开始控制员工 AI 支出。企业不会停用 AI,但会从“默认用最强模型”转向“按任务算账”。 前沿大模型的高价来自研发、训练和商业成本摊销;开源权重模型、AI gateway、专用芯片和本地推理,会持续削弱这部分定价能力。

AI童书已经混进畅销货架,问题不只是画错了
一位作者购买并翻看亚马逊儿童百科分类中的AI生成畅销书,发现大量动物肢体、场景结构和画面逻辑畸变。真正值得警惕的不是某几张图翻车,而是低成本出版、平台分发和礼品型消费一起,把未经可靠审校的内容送进儿童认知入口。

据报白宫要求 OpenAI 放慢 GPT 5.6:前沿模型发布开始被按住节奏
据 The Information 报道,OpenAI 计划按特朗普政府要求,把 GPT 5.6 先开放给少数合作伙伴,而不是直接公开发布。关键变化不在模型名字,而在政府据称要在预览期逐个批准客户访问权限。对 AI 团队和安全团队来说,接下来要判断的是:模型发布会不会从公司排期,变成公司、客户和监管方共同决定的排期。

德国裁决把 AI 摘要算作 Google 自己的话,平台不能再用“模型出错”挡责任
德国一项裁决认定,Google 需为 AI Overviews 引入的错误信息承担责任,焦点不是 AI 会不会犯错,而是部署 AI 的公司能否把错误外包给模型。Bruce Schneier 借此提出更尖锐的判断:AI agents 应被视为部署者的代理,法律责任不能因执行者从人变成软件而消失。这对搜索平台、AI 产品负责人和企业合规团队都是现实压力:上线 AI 代理,不能只算节省的人力成本,还要算错误后的法律账。

GPT-5.6 还没全面发布,先进入逐案审批时代
据 The Information,OpenAI 计划把 GPT-5.6 先做成 limited preview,只给少量企业客户用,客户访问还要逐案过特朗普政府审批。和 Anthropic 的待遇一对比,这条消息最重要的不是延期本身,而是前沿模型的分发权开始被政府按公司、按客户切开管理。 这不是普通的产品节奏变化,更像 AI 发布从研发逻辑滑向许可逻辑。

Un-0 不是赢了扩散模型,而是把物理计算推上了台面
Unconventional AI 发布了 Un-0:一个用耦合振荡器生成图像的模型,在 ImageNet 64×64 上做到 FID 6.74,并把权重、训练和消融代码一并开放。它真正有意思的地方,不是已经打穿了图像生成,而是第一次把“物理做计算”这条路线较认真地推到可比较的基准上。只是别急着把它写成能源革命,训练和评估仍然高度依赖 GPU 和传统特征栈。

AI 智能体要上场,先得过 Patronus 的沙盒
Patronus AI 完成 5000 万美元 B 轮融资,累计融资达到 7000 万美元。资本押注的不是又一个模型,而是一套给 AI Agent 做压力测试的模拟环境。随着 Agent 从答题走向执行任务,传统 benchmark 只能说明分数,已经不够证明它能把事做完。

Anthropic指控阿里用2.5万个账号蒸馏Claude,这已不只是条款纠纷
Anthropic称,阿里巴巴及其 Qwen 团队在 4 月 22 日到 6 月 5 日间,用近 2.5 万个欺诈账号对 Claude 进行了 2880 万次交互,试图蒸馏其推理、编程和长任务能力。真正重要的不是这起指控能否坐实,而是它已经被 Anthropic 推进到美国参议院和出口管制的框架里,开始按中美 AI 竞争处理。

Notion 9月22日关闭 Mail 收件箱:Gmail 客户端让位给 AI 代理
Notion 将在 9 月 22 日关闭 Notion Mail 的网页版、桌面端和 iOS 收件箱,邮件历史仍保留在 Gmail。公司称,超过一半 Notion Mail 用户已经不打开收件箱,而是通过 agents 管理邮件。我的判断是,这次关停的重点不是邮箱客户端本身,而是 Notion 在 Skiff 隐私邮箱遗产和 AI 代理办公路线之间作出了取舍。

Notion Mail 将于 9 月 22 日关闭:邮箱客户端退场,AI 代理接手收件箱
Notion 不是简单停掉一款邮箱产品,而是在把邮件处理重心转向 AI agents。它给出的信号很明确:超过一半 Notion Mail 用户已经不再手动打开收件箱。对用户而言,Gmail 里的邮件不会消失,但草稿、定时邮件和自动化规则要尽快导出。

OpenKnowledge 想抢的,不是笔记软件,是知识库控制权
Inkeep 在 GitHub 公开了 OpenKnowledge,一个 AI-native Markdown 编辑器和 LLM Wiki,姿态很直接:要做 Obsidian/Notion 的开源 AI-first 替代品。现在最该看的不是界面像不像,而是它把知识库的重心往数据控制、索引、权限和可验证性上推了。仓库已有 566 commits、168 tags,但 21 stars、0 fork 说明外部采用还在很早期。请注意,这更像一个公开工程镜像,而不是已经跑出来的社区产品。

前 Databricks AI 负责人押注振荡器架构:Un-0 先证明能跑,没证明能省电
Naveen Rao 创办的 Unconventional AI 发布了首个图像模型 Un-0,试图用软件模拟的振荡器架构追上主流扩散模型。它现在证明的是新路线“可以工作”,不是 1000 倍省电已经成立;真正的考题还在真芯片和推理栈。第三方读者最该盯紧的,不是模型图像效果,而是这条路线能否跨过硬件落地这一关。

General Intuition 真正押注的,不是游戏,是玩家按键数据
General Intuition 以 23 亿美元估值完成 3.2 亿美元融资,继续押注 Medal 积累的游戏视频和玩家动作数据。它卖的不是“游戏 AI”,而是能把动作标签、world model 和 agent 串起来的底层数据能力。demo 很亮眼,但虚拟到现实能不能稳定迁移,才是这笔钱值不值的分界线。

Claude 在美国付费用户中加速,但还没追上 ChatGPT
信用卡交易样本和在线教育平台数据都显示,Claude 在美国付费 AI 消费者中增长加快。这个信号说明 Anthropic 正把开发者口碑外溢到消费端,但不能推导为官方营收、总用户数或市场反超。ChatGPT 仍是规模基准,Claude 现在抢的是更愿意付费比较模型质量的人群。

两千年打不开的赫库兰尼姆卷轴,终于被读出了一卷
Vesuvius Challenge 团队首次在不物理展开的情况下,完整虚拟展开并读出了 PHerc. 1667。更重要的是,他们把数据和代码一起公开了,说明这不只是一次读卷奇迹,而是一条可以复核、可以扩展的方法链。 这次真正的分水岭,不在“AI 会认字”,而在同步辐射成像、几何重建、机器学习和纸草学校勘终于接上了。对做 AI、科学成像、数字人文的人来说,接下来要看的不是热闹,是这套流程能不能在别的卷轴上继续跑通。

Hybrid 模型赢在哪些 token 上?这次答案比榜单有用
Ai2 把 Olmo 3 7B Transformer 和 Olmo Hybrid 做了逐 token 对比,发现 Hybrid 的优势集中在语义词、指代跟踪等需要维护上下文状态的地方,而不是所有场景。真正有意思的是,架构竞争正在从“总分谁高”转向“能力怎么拆账”:理解、复制、长上下文成本,可能要分开算。

General Intuition 融 3.2 亿美元,赌游戏动作数据能喂出机器人直觉
General Intuition 以 23 亿美元估值融资 3.2 亿美元,累计披露融资约 4.54 亿美元。它押的是 Medal 的海量游戏录像和动作标签:先在 Fortnite 这类游戏里学“动作直觉”,再把同一套模型迁到模拟和真实机器人。真正没被验证的,不是 demo 好不好看,而是这种 sim-to-real 迁移能不能规模化。

AI没补上的质量课,福特又请回了“老师傅”
福特过去三年重新聘用约350名资深工程师和质量检查员,填补AI工具在经验保留和新人培训上的缺口。真正重要的不是“AI替代人失败”,而是汽车制造的质量治理仍依赖大量隐性经验,AI更适合作为被资深人员校准的工具。

美国拟取消无人车刹车踏板要求,Cybercab和Zoox先松一口气
美国交通部提议:对“仅由自动驾驶系统驾驶”的车辆,不再强制要求刹车踏板。提案还在30天公众评论期,没生效,但它会直接降低无方向盘、无踏板车型的合规门槛。 真正受影响的不是普通汽车,而是特斯拉 Cybercab、Zoox 这类专用无人车路线。它更像是在给少数产品清障,不是给无人车全国部署发通行证。

Codex 的真正变化:AI 开始接管一段完整工作
OpenAI 研究显示,截至 2026 年 5 月,Codex 这类智能体正在从短问短答,转向可委派的长周期任务。更关键的不是“AI 又提效了”,而是知识工作的边界被压薄:会拆任务、调工具、验结果的人,正在拿到新的组织权力。对企业管理者和知识工作者来说,接下来要看的不是买不买 AI,而是流程能不能跟着改。

Meta重启Facebook Creator Studio:AI助手,还是旧后台换新皮?
Meta把2023年关闭的Facebook Creator Studio带回来了,但新版本是一款独立AI创作者助手应用,不是旧后台原样恢复。核心卖点是AI Creator Assistant:看数据、给增长建议、筛重要评论、按创作者语气拟回复。目前它只向部分创作者测试,可排队申请早期访问,真正价值要看能否比Business Suite更贴近日常运营。