人工智能资讯 第7页
聚合当前分类下的最新内容,按时间顺序查看第 7 页精选文章。

2000 美元 AI 长片进翠贝卡:电影门槛降了,责任门槛升了
《Dreams of Violets》将于 6 月 10 日在翠贝卡电影节首映,片长 75 分钟,制作成本约 2000 美元。 制作方称它是首部进入主要电影节的全长真人 AI 生成电影,但“第一部”仍要加限定。 这件事真正值得看的是:AI 正把低成本长片送进主流电影节,也把版权、伦理和基层岗位压力一起带进场。

Claude Opus 4.8 没有吹成革命:Anthropic 这次押的是少犯错
Anthropic 发布 Claude Opus 4.8,官方少见地称它只是“小幅但可感知的进步”,价格和主要规格基本不变。真正值得看的是可靠性:它在不确定时更愿意拒答,代码场景里也更少放过自己写出的缺陷。大模型竞争正在从“谁更会炫技”转向“谁更少添乱”,这对开发者和企业用户比榜单多几分更要紧。

Sesame iOS 预览版上线:语音 AI 代理离“会办事”还差什么
Sesame 发布 iOS 公开预览版,Maya、Miles、Simone、Charlie 四个语音代理已在 39 个国家上线,完整体验暂时免费,注册可能排队。它的重点是把语音聊天做得更连续:边说边检索、可中途修正回答、带记忆和隐身模式。我的判断是,Sesame 已经更像个人 AI 代理的入口,但还不是成熟执行层。

企业 AI 试点之后,卡住交易的是部署风险
Databricks 联合创始人、现场工程高级副总裁 Arsalan Tavakoli-Shiraji 将在 TechCrunch Disrupt 2026 讨论企业 AI 试点为何难以转成大规模部署。企业并不是拒绝 AI,而是在重新评估上线后的稳定性、治理成本和组织信任。对 AI 创业公司来说,Demo 只能打开门,能降低不确定性才可能拿下长期合同。

RSI成了AI圈新目标,但真正的自我改进还没跑通
AI圈正把递归自我改进(RSI)推到AGI之后的位置,但公开证据还停在自动研究、自动训练和局部优化。真正的分界线不是模型会不会写代码,而是它能否自己提出改进、完成实现、验证收益,并进入下一轮。对创业者和投资人来说,RSI可以看,但要把愿景、演示和可复现实验分开看。

AGI 时间线为什么又变了:FutureSearch 提醒,预测也会追着模型跑
FutureSearch 在 2026 年 4 月 12 日汇总多位 AI 预测者的历次更新,发现 AGI 时间线会随当期模型进展摆动。 这不是在确认 AGI 哪年到来,而是在提醒:ChatGPT 后预测普遍提前,xAI、Meta、Gemini 阶段转向推迟,Anthropic 快速进展后又被拉近。 对研究员、投资人和企业采购来说,单次年份不够用,更该盯更新理由、能力阈值和成本变化。

General Compute 押注 SambaNova:推理云开始绕开 GPU 了吗
General Compute 完成 1500 万美元种子轮融资,投后估值 6000 万美元,FUSE VC 领投。它更大的动作是订购 3 亿美元 SambaNova SN50 芯片,并称将成为首个部署该芯片的 neocloud。 这件事的看点不在融资金额,而在推理算力需求变大后,非 GPU 芯片还有没有机会借云客户重新上桌。 但这仍是一笔早期赌注:SN50 的性能说法、General Compute 的客户规模、订单交付和利用率,都还需要真实负载验证。

5 个前沿大模型做事实核查:67% 出现分歧,最不稳的是灰区判断
Lenz Research 用 1000 条真实用户事实核查请求测试 5 个前沿大模型,67% 的 claims 至少有一个模型与多数意见不一致,34% 出现跨两个以上标签的实质分歧。这个数字不是错误率,因为研究没有外部真值标签;它更像一个提醒:前沿模型还不能被当成可互换的事实裁判。最该谨慎的是内容审核、搜索问答和合规初筛团队,尤其不要把多数投票包装成真值。

YouTube 的 AI 自定义视频流:你能点菜,但厨房没换
YouTube 正在向美国、英文、已登录用户推出 AI 自定义视频流,用户可用提示词生成专属 feed,并置顶到首页。它把推荐从“被动刷”推进到“主动点菜”,但结果仍依赖搜索历史、观看历史和平台排序。对用户来说,这是更好用的控制入口;对创作者来说,内容发现可能更受“场景提示词”影响。

IISc 的“Eureka machine”:别急着喊 AI 输了,真正的问题是搜索太穷
IISc 官方文章介绍的“Eureka machine”更像科研原型或研究方向,不是成熟商用品。它要补的不是聊天式 AI 的短板,而是材料、药物、工程优化里更难的事:在未知解空间里找新路。现在最该看的不是口号,而是它能否在有限预算下稳定找到更好的候选解。

120万条聊天记录交给LLM后,关系真的比记忆更清楚吗
一名作者导出VK、Twitter、Facebook、Instagram、Telegram等平台近20年聊天档案,用LLM和确定性脚本整理出可追溯的关系、事件和情绪记录。这个实验的看点不是AI能不能读懂亲密关系,而是私人聊天数据在多大程度上能校正记忆,又会在哪些地方误伤关系判断。对量化自我用户和产品工程团队来说,真正门槛在身份合并、溯源回滚、隐私同意和本地处理,而不只是接入一个模型。

AI都说能让白领10倍提效,周五能不能还给员工?
一篇个人博客用一个简单反问刺中了AI生产力叙事:如果AI真能把一周工作压到周一中午,员工能不能周五休息?问题不在AI工具本身,而在提效后的收益归谁。对科技白领和知识工作者来说,接下来要看的不是口号里的“10倍效率”,而是公司是否把节省下来的时间变成休息、远程弹性,还是更高KPI。

Cisco 把 Codex 接进工程流水线,AI 编程代理开始被制度考验
Cisco 称已把 OpenAI Codex 深度嵌入企业工程流程,用在 AI Defense 开发、跨仓库构建优化、缺陷修复和 React 迁移上,部分周期从数季度压到数周或数天。更关键的变化不是“AI 会写代码”,而是 Codex 正被放进真实生产链路,接受审查、测试、权限和责任设计的约束。效率数字目前来自 Cisco/OpenAI 叙述,不能当独立审计结论看,但足够说明企业级编程代理的门槛正在抬高。

Triomics 融资 2200 万美元:肿瘤 AI 的机会不在治癌,而在理清病历
Triomics 完成 2200 万美元 B 轮融资,Battery Ventures 领投,老股东 Nexus Venture Partners、Lightspeed、Y Combinator 等参投。它押注的不是 AI 直接治疗癌症,而是把肿瘤病历、临床试验匹配和登记上报这些重流程做深。真正要看的,是它能否在通用医疗 AI 和 AI 病历书记员之外,证明专科工作流值得医院单独付费。

Warp押注GPT-5.5:终端开源只是入口,开发流程的方向盘才是生意
Warp把开源终端客户端、Oz智能体编排平台和GPT-5.5绑在一起,押注可监督的编码智能体处理本地、云端和开源开发流程。关键数字来自Warp或OpenAI材料:Warp称内部约90%的PR由智能体共同创建,GPT-5.5在其内部基准中比GPT-5.4每个agentic coding任务少用30% tokens。真正的变化不是AI又会写代码,而是开发权力正在转向编排、权限、评估和人类验收。

Reachy Mini 接入远程 MCP:机器人少上云之后,又把工具放回云端
Reachy Mini 对话应用新增远程 MCP 工具支持,用户可用一条命令把公开 Hugging Face Gradio Space 上的天气、搜索等能力接到机器人上。它补上了此前“对话后端本地化”没有覆盖的一半问题:本地保住可信核心,云端承接可变工具。真正值得看的是边界设计,而不是机器人是不是突然变聪明。

ITBench-AA 给企业 AI 运维泼了盆冷水:最强模型也没到 50%
Artificial Analysis 与 IBM Software Innovation Lab 推出 ITBench-AA,首批用 59 个 Kubernetes SRE 事故诊断任务评测企业 IT 智能体。结果不适合只看排行榜:Claude Opus 4.7 最高 47%,GPT-5.5 46%,Qwen3.7 Max 42%,所有前沿模型都低于 50%。这说明在这个基准和评分规则下,AI Agent 已经能辅助排障,但离无人值守的企业级运维还差一段可靠性。

OpenAI给2026年选举上“安全栓”:透明度进步了,但别指望它包办真相
OpenAI发布2026年全球选举保障方案,把可靠信息、网络防御、内容溯源、滥用治理和政治中立评估纳入同一套安排。它的价值不在于“消灭选举误导”,而在于把生成式AI的主要风险拆成可执行的产品和政策动作;但验证工具、计票信息和平台执法都有清晰边界。

Cognition 融资超 10 亿美元:AI 编程独立玩家还没被巨头关门
Cognition 宣布完成超过 10 亿美元融资,投前估值 250 亿美元;公司称年化收入运行率达到 4.92 亿美元,但这不是全年确认收入,也不是利润。真正反常的是,OpenAI、Anthropic、Google 都在亲自做 AI 编程,VC 仍然重押独立工具层。接下来要看的不是 Devin 会不会写代码,而是 Cognition 能不能嵌进企业研发流程,变成可续约、可审计、可交付的软件系统。

PostHog 要用客户数据训练 AI:真正该盯的是默认加入
PostHog 宣布将用客户在其产品中的既有数据训练自研 AI 模型,训练不会早于 6 月 29 日开始。EU 云和受 BAA/MSA 等限制协议约束的客户默认退出,美国云多数普通客户默认加入。争议不在它有没有说明,而在 SaaS 公司能否把客户行为数据默认变成模型燃料。

Codex 和 Claude Code 变贵:AI 编码代理开始找到真买单的人
OpenAI Codex 和 Anthropic Claude Code/Cowork 正在把企业客户从席位订阅推向 API 级按量计费,重度使用团队的账单会更接近真实 token 成本。新的关键线索是:这不只是涨价,而是编码代理可能比聊天机器人更早摸到企业级产品市场匹配,AI 实验室终于开始向真正高频、高价值的工作流收费。