人工智能资讯 第55页
聚合当前分类下的最新内容,按时间顺序查看第 55 页精选文章。

Apple Silicon 验证 Wasm 直连 Metal 零拷贝,本地 AI 的一笔隐性成本开始松动
开发者在 Apple Silicon 上验证,WebAssembly 的线性内存可以被 Metal 直接作为 GPU buffer 使用,Wasm 与 GPU 读写的是同一块物理内存。关键不在一组小矩阵乘法跑通,而在于沙箱运行时做本地推理时,最伤内存、最拖状态迁移的那一步有机会被拿掉。现在能得出的判断很明确:这对 Mac 端本地 AI 是实际进展,但它依赖苹果统一内存架构,离通用推理方案还很远。

这台“会写诗”的 AI 相机很讨喜,但更像 AI 硬件热的一次样品测试
把照片和即时生成诗句绑在一起,这台 AI 相机确实容易让人产生购买冲动:按下快门,几秒后拿到一张带机器旁白的纸条,体验轻巧,也很适合分享。但如果把它放回消费电子的标准里看,它更像一件情绪商品,而不是稳定成立的新设备品类;它能否留下来,不取决于“AI”两个字,而取决于用户会不会在新鲜感过去后继续把它带出门。

当你在点暴风雪时,接话的可能已不是店员:Dairy Queen把AI塞进了得来速
Dairy Queen 正在把 AI 语音点单带进得来速,这不是一句“用技术提效”就能概括的小事。它真正说明的是,快餐业的自动化已经从后厨和收银台,推进到最容易出错、也最考验人情味的顾客沟通环节;短期看,它更像辅助型自动化,成败不在炫技,而在识别准确率、人工兜底和顾客是否愿意配合。

把青春里的演唱会找回来:Gigs 想把零散票根变成你的“现场音乐回忆录”
Gigs 试图解决的不是“怎么买下一张票”,而是“怎么把过去看过的每一场演出重新找回来”。这类产品抓住了流媒体和票务平台都没认真处理过的一块空白:乐迷真正愿意长期保存的,往往不是播放记录,而是亲自到场的现场经历;但它能不能成立,最终取决于导入能力、数据覆盖和后续回访场景,而不是情怀本身。

7个月、三轮融资、还没产品:Upscale AI 凭什么冲到 20 亿美元估值?
AI 基础设施初创公司 Upscale AI 据称正洽谈新一轮融资,目标估值约 20 亿美元,而它成立至今不过 7 个月,甚至还没有正式推出产品。这不是一则普通的融资新闻,而是 AI 狂热正在从模型层一路烧到芯片和互连基础设施的一个鲜明样本:资本押注的,已经不只是“谁会做模型”,而是“谁能把算力真正接上、跑起来、扩出去”。

Luma不只想卖AI工具,它开始自己下场拍片了
AI视频公司Luma与宗教流媒体厂牌Wonder Project联手成立制作公司“Innovative Dreams”,第一部作品直接瞄准《摩西》故事,还请来了本·金斯利出演。这不是一次普通的产品发布,而是AI影视公司从“卖铲子”走向“自己淘金”的信号:当生成式AI开始深度介入拍摄流程,影视工业的成本结构、创作权力和审美标准都可能被改写。

AI 客服的下一站,不是更会聊天,而是更懂客户:YC 新兵 Akkari 想重做“客户上下文”
YC 新项目 Akkari 正在押注一个比“更强模型”更现实的方向:把电话、邮件、聊天记录和 CRM 里四分五裂的客户信息重新拼起来,让 AI 代理真正知道自己在服务谁。这件事听上去像数据清洗,但它很可能是大模型落地企业服务时最难、也最值钱的基础设施之一。

Runway不只想把1亿美元拍成50部电影,它想赌视频才是AI的正门
Runway CEO那句“把1亿美元预算拆成50部电影”,听起来像在挑衅好莱坞,其实只是表层。更关键的新变量是:Runway正在把自己从AI视频工具公司,推向“世界模型”路线,想用视频和现实观测数据挑战以语言模型为中心的AI主航道。它有创作者市场和商业收入的底盘,但要和Google、Luma、World Labs抢下一阶段,真正的门槛会从“生成好看视频”变成“稳定模拟世界”。

Thunderbolt想把企业AI“拽回机房”:当越来越多公司不愿把数据交给别人
Thunderbolt发布的信息不算铺天盖地,却精准踩中了当下企业AI最焦虑的一根神经:能力可以向云端借,数据主权却越来越不想外包。它主打开源、自托管、跨平台和可扩展,本质上是在告诉企业——你不必在“用上AI”和“守住数据”之间二选一。

Canva 把 AI 做成聊天入口,争的不是作图功能,而是整条内容工作流
Canva 发布 AI 2.0,新增的重点不只是“能用提示词做图”,而是把设计、文案、修改、协作和部分发布动作收进一个对话式入口。相比旧有“AI 帮你生成素材”的叙事,这次更值得注意的增量在于:Canva 开始补齐局部编辑、品牌记忆、外部连接器和轻量代码能力,目标更像内容生产中枢,而不再只是模板工具。

1.5万份古人DNA拼出一部“进化实录”:过去一万年,西欧亚人类一直在被环境推着改写自己
哈佛医学院与多家机构的研究团队利用1.58万名西欧亚古人与现代人的基因数据,发现过去一万年里,人类基因组并非只是被迁徙和混血改写,许多变异位点还在持续受到强烈定向选择。真正让人震撼的,不只是“找到了几处进化痕迹”,而是研究者几乎在整片基因组上看到了自然选择长期、广泛、细密地工作——这让古DNA研究从“讲祖先从哪来”迈向了“解释我们为何变成今天这样”。

当“本地大模型神器”开始变味:Ollama 为何陷入信任危机
曾经靠“让本地跑大模型变简单”走红的 Ollama,如今正因为开源归属、性能退步、模型命名误导和云端化转向而遭遇越来越多质疑。它的问题不只是一个工具做得好不好,而是一个本该代表“本地优先”的项目,是否还配得上社区曾经给它的信任。

当AI圣像遇上政治流量:特朗普又发“耶稣版自己”,这次更像一场算法时代的信仰试探
特朗普再次在社交平台发布AI生成的“特朗普-耶稣”形象,表面看是又一张政治迷因,实则暴露了AI图像、粉丝文化与政治传播正在深度缠绕。比起图片本身,更值得警惕的是:当生成式AI成为政治人物的情绪放大器,公共讨论正在被一种更廉价、也更煽动的视觉修辞重写。

让 AI 给新闻打分?这家硅谷创业公司想当“媒体陪审团”,但真正发冷的可能是举报人
一家获得彼得·蒂尔支持的创业公司,想用大模型和一套“荣誉指数”为新闻报道判定真伪与可信度,任何人花 2000 美元就能公开挑战一篇报道。听上去像是给媒体建立问责机制,但它最先可能吓退的,不是造假的记者,而是那些本就冒着风险发声的匿名举报人。

1MHz 的 C64 都能跑 Transformer:这项目没颠覆 AI,却把“大模型神话”拆得很干净
开发者把一个约 2.5 万参数、两层的 decoder-only Transformer 真跑在 1982 年的 Commodore 64 上了:1MHz 处理器,未改装原机,模型和程序还能塞进一张软盘。它当然不是“古董机版 ChatGPT”——60 秒才出 1 个 token、上下文只有 20 token、词表只有 128 个——但也正因为限制写得这么明白,这件事反而更有价值:架构没有神秘到不可触碰,真正贵的是把它做大、做快、做成平台控制力。

Snap大裁员背后:当AI开始“提效”,社交媒体员工先感到了寒意
Snap宣布裁掉约1000名员工,占全球员工总数的16%,理由之一是AI正在帮助团队减少重复劳动、提高效率。这不只是又一家科技公司缩编,而是一个更刺眼的信号:在AI被包装成增长引擎的同时,它也越来越直接地改写科技行业的用工逻辑。

OpenAI给 Responses API 接上 WebSocket:模型更快之后,真正拖后腿的成了接口层
OpenAI 这次更新 Responses API,重点不是新模型,而是给 agent 工作流加了 WebSocket 持久连接和连接级缓存。官方给出的结果很务实:在 Codex 一类多轮工具调用场景里,端到端速度最高可快约 40%。这件事真正说明的,不是“协议升级”四个字,而是 AI 产品的瓶颈已经从模型本身,挪到了 API 编排、状态复用和系统空转上。

扩散模型终于学会“回头看自己”:I-DLM 想把大模型生成速度和质量一起拉上去
长期以来,扩散语言模型总在“更快生成”这件事上吊人胃口,却始终过不了“质量不如自回归模型”这一关。I-DLM 的新意,不只是把扩散模型做快了,而是试图补上它最缺的一块能力:像人写作时那样,边往前写,边检查自己前一句有没有跑偏。

让 Claude 开塞斯纳:一场没飞成的 AI 试航,反而暴露了智能体最真实的短板
有人把 Claude 接进飞行模拟器 X-Plane 12,让它自己查 API、写控制脚本、尝试驾驶一架塞斯纳从海口起飞。结果很戏剧化:它能顺利起飞、能稳定巡航、也能一边飞一边改代码,但最后还是两次坠地。这件事好玩的地方不只是“AI 会不会开飞机”,而是它把当下智能体系统最关键的问题——实时控制、闭环执行和延迟——几乎原封不动地摊在了跑道上。

当科切拉被“假人”占领:AI 网红正在改写社交媒体的真实感
今年科切拉音乐节上,最抢镜的未必是真人网红,而是大量以假乱真的 AI 生成“数字博主”。这不只是一次社交媒体上的审美游戏,更是在提醒我们:当“到场”都能被生成,互联网赖以生存的真实感正在变得越来越廉价。

Aphyr 再谈 AI 员工:真正会扩张的,可能是给模型兜底的岗位
程序员兼技术评论作者 Aphyr 继续批评“AI 员工”叙事:问题不只在模型失控,也在公司把不成熟的系统当成可直接替代人的劳动力。新文章补强了一个更现实的判断:AI 未必让工作消失,反而会制造一批围绕提示、质检、训练、追责和事故解释的新岗位,只是这些岗位很多是在替模型收拾残局。