人工智能资讯 第5页
聚合当前分类下的最新内容,按时间顺序查看第 5 页精选文章。

Claude 的“做梦”不是玄学,Agent 的记忆权才是硬门槛
Anthropic 在 Code with Claude 开发者大会上,为 Claude Platform 的 Managed Agents 推出 research preview 版 dreaming:它不是意识或类人梦境,而是定期整理过去 session 和 memory store,把高价值模式写入未来任务上下文。对开发者和企业团队来说,重点不在名字,而在 Agent 正从临场聊天工具变成带组织记忆的工作系统。下一步最该看三件事:谁能审阅记忆、记忆能不能迁移、算力额度能不能跟上长任务需求。

OpenAI 庭审越打越难看:安全流程背后,是 AGI 控制权之争
Murati 证词把 OpenAI 的安全流程重新推上审判席,Zilis 出庭和相关文件又把问题往前推了一步:这不只是 Altman 是否说真话,也不只是 OpenAI 是否背离初心,而是谁想控制 AGI。新材料削弱了马斯克一方“拯救使命”的干净叙事,也让 OpenAI 自己的治理黑箱更难被轻轻放过。

DeepSeek估值传到450亿美元:低成本模型,正在被重新标价
FT和Bloomberg报道称,DeepSeek正洽谈首轮风险融资,潜在估值从数周前约200亿美元升至450亿美元,投资方传闻包括中国大基金、腾讯和阿里。重点不是450亿美元准不准,而是低成本、开放权重、国产算力适配这套故事,正在被人才战和产业资本重新定价。对开发者和产业观察者来说,接下来要看的不是单次模型跑分,而是股权激励、华为芯片适配效果和平台绑定程度。

Tilde.run 给 AI Agent 上事务沙箱:能回滚,不等于无风险
Tilde.run 现在处于 private preview,官网给出“Free to start”和一行安装命令,主打把每次 Agent 运行做成可提交、可回滚的事务。 它的看点不是普通容器隔离,而是把 GitHub、S3、Google Drive 和本地输出挂成统一的版本化 POSIX 文件系统,再叠加网络审计和 Agent 级权限控制。 我更在意的是:它能否真正降低 Agent 接生产数据的风险,而不是给已有沙箱、审计和 RBAC 换一层 AI 包装。

Code w/ Claude 2026 开场前:现在还不能把它写成 Anthropic 发布会
Simon Willison 于 2026 年 5 月 6 日在 Anthropic 的 Code w/ Claude 2026 现场开启实时博客,计划记录 keynote 和当天观察。现有正文只显示他已在 8:56 入座,等待 9 点 keynote 开始,尚不足以判断 Anthropic 发布了新产品、模型或价格策略。

Genesis AI 造了一只机器人手,真正的赌注是工人数据
Genesis AI 发布首个机器人基础模型 GENE-26.5,并展示自研仿人机械手完成做饭、弹琴、魔方和实验室操作。比 demo 更重要的是,它把仿人手、数据手套、第一视角视频和仿真评估绑成一套数据系统。我的判断是:全栈路线可能更接近机器人基础模型的真实难题,但工人补偿、数据归属和现场可靠性会先来讨债。

AI 编程代理越快,维护债越该算清楚
Simon Willison 摘引 James Shore 的观点,把 AI 编码争议从“谁为代码负责”推进到更硬的一笔账:如果 AI 让代码产出翻倍,维护成本就必须按反方向下降,否则团队只是把今天的速度换成明天的债。真正受影响的不是喜欢尝鲜的个人开发者,而是已经把 coding agents 放进交付流程的软件团队和技术负责人。

Aurora拿下McLane德州货运线:无人卡车从试点转进商业运营
Aurora与配送巨头McLane达成商业协议,将在达拉斯—休斯敦线路用无安全司机的自动驾驶卡车运货,车内仍有不操控车辆的human observer。 关键变化是:双方从2023年试点,走到每周7天商业运行,Aurora负责高速干线,McLane司机接手本地配送。 这说明Aurora已跨过试点门槛,但距离可持续规模化,还要看观察员退出、合同转化和责任成本。

a16z 投给 Ethos 2275 万美元:语音 AI 能把专家网络从头衔匹配拉到能力匹配吗?
Ethos 获得 2275 万美元 A 轮融资,a16z 领投,主打用语音 AI 访谈专家、生成更细的能力画像。它声称每周 onboarding 3.5 万名专家,这是增长亮点,也是质量疑点。真正要看的不是专家库变大,而是语音采集能否经得起验证、合规和客户复购。

Google 把 Reddit 塞进 AI 搜索:真人经验上桌,可信问题没下桌
Google 正在让 AI Search 和 AI Overviews 预览 Reddit、论坛、社交媒体等公开讨论,还会显示创作者、账号或社区名,并突出用户订阅的新闻来源。这个调整承认了一件事:很多搜索要的不是标准答案,而是别人踩坑后的经验;但真人经验不等于可信答案,AI 一旦把论坛语气压平成“建议”,风险会更隐蔽。

微软重排 Office、Teams 与 Copilot:AI 办公的难点不在按钮,在汇报线
Rajesh Jha 将在 6 月 30 日退休,微软 Experiences and Devices 体系随之重组。Ryan Roslansky 已负责 LinkedIn 和 Office,现在新增 Teams,并领导新的 Work Experiences Group。更关键的变化是:Copilot、Agents、M365 基础能力被划给 Charles Lamanna,微软正在把 AI 办公从单点功能推进到跨应用工作流。

AI 原生保险公司招增长工程师:写 AI 工具,也去 Craigslist 找地推
Coverage Cat 在 YC Work-at-a-Startup 发布合同制 Fractional Growth Engineer 招聘,时薪 15-25 美元,职责横跨 AI 增长工具、增长实验和 Craigslist 线下地推招募。最值得看的不是岗位名新,而是 AI-native 公司到了获客端,仍要面对信任、渠道和执行成本。对 AI 创业团队和保险科技从业者,这是一张很小但很硬的现实清单。

AI 编织播客被批“胡话工厂”:手工艺不是低价值内容
Kate Davies 批评 Inception Point AI 的自动化编织播客:高产、少审核、内容空泛,还会虚构所谓专家。争议焦点不是 AI 能不能聊编织,而是平台把编织、园艺、烹饪归入“可以出错”的低风险内容后,谁来承担错误成本。最直接受影响的是编织设计师、手工艺知识生产者,以及依赖社区经验学习的普通编织者。

Hugging Face 给 ASR 榜单加私有测试集:防刷榜,但默认排名不变
Hugging Face 为 Open ASR Leaderboard 加入 Appen 和 DataoceanAI 提供的英文私有测试集,用来降低 benchmaxxing 和测试集污染风险。 默认 Average WER 仍只基于公开数据,私有集不会立即改写总榜排名。 对 ASR 开发者和企业选型团队来说,这更像一层暗场复核:不能替代真实业务测试,但能暴露公开榜单看不出的口音和对话场景差异。

QuTwo 3.8 亿美元估值:欧洲 AI 不缺口号,缺能签单的主权技术
芬兰 AI 实验室 QuTwo 完成 2500 万欧元天使轮,估值 3.25 亿欧元,约 3.8 亿美元。它不是纯量子公司,也没有宣称通用量子计算商业化,核心产品 QuTwo OS 更像经典、量子和混合计算的编排层。更关键的是,QuTwo 暂不接受 VC 或战略投资,这轮融资押的是控制节奏、企业入口和欧洲主权技术的可交付能力。

Telus 用 AI 给客服改口音:效率工具可以上,告知规则不能缺席
据 iPhone in Canada 和 The Globe and Mail 报道,Telus 通过 Telus Digital 在部分呼叫中心使用 Tomato.ai 的实时 speech-to-speech 工具,为离岸客服坐席转换口音。 这件事的关键不是 AI 能不能让通话更顺,而是客户是否被告知、员工是否同意、语音数据如何被处理。 对采购这类工具的企业来说,最该先做的不是测试自然度,而是补齐披露、劳动政策和隐私评估。

SAP买Prior Labs:企业AI入口战,开始收门票了
SAP拟收购成立仅18个月的德国AI创业公司Prior Labs,并计划四年投入约10亿欧元;这笔钱是后续投入,不是官方收购价。Prior Labs押注表格、数据库等结构化数据模型,正好贴近SAP的ERP腹地。更关键的是,SAP同时限制未经认可的AI代理接入API,企业AI的争夺点正在从模型能力转向数据入口和执行权限。

Nuro拿到加州新许可,但Uber无人出租车离上路运营还差几道门
Nuro获得加州DMV修改后的无人驾驶测试许可,未来可在公共道路无安全员测试搭载其系统的Lucid Gravity SUV,但公司尚未开始这类测试。这个许可更像Nuro、Uber、Lucid三方商业化路线中的早期监管节点,不等于Uber高端robotaxi已获准商业运营。

Altara获700万美元融资:AI进物理研发,先从整理烂账开始
旧金山初创公司 Altara 完成 700 万美元种子轮融资,Greylock 领投,目标是用 AI 打通电池、半导体、医疗设备企业分散的研发与故障数据。它的重要性不在于证明 AI 已能改造科学实验,而在于选择了一条更务实的入口:先做现有研发体系上的数据层和排障工具。真正要观察的是,Altara 能否在复杂、敏感、格式混乱的工业数据里拿出可复用的效果,而不是只停留在融资故事里。

AI 代理进咖啡馆:好笑的采购事故背后,是谁在替实验买单
Andon Labs 在斯德哥尔摩咖啡馆测试 AI 代理 Mona 参与运营,结果出现荒唐采购、错误许可申请和频繁联系供应商等问题。真正关键的不是 AI 会不会“闹笑话”,而是代理系统一旦对外行动,是否必须先经过人类审核。

Character.AI在宾州被诉:免责声明能挡住“假医生”吗
宾夕法尼亚州国务院和州医学委员会起诉 Character.AI,称平台角色 Emilie 自称持有宾州医生执照,还可评估抑郁用药,涉嫌违反州 Medical Practice Act。案件目前只是州方指控,关键不在 AI 能不能聊健康,而在角色平台能不能用“虚构娱乐”免责声明覆盖冒充持证专业人士的风险。对 AI 伴侣和角色平台来说,医疗、法律、金融这类身份设定,已经不能只靠聊天弹窗兜底。