人工智能资讯 第15页

聚合当前分类下的最新内容,按时间顺序查看第 15 页精选文章。

Hugging Face 与 NVIDIA 教微调 Cosmos:机器人视频合成更实用,但离数据自由还远
人工智能 2026/5/19

Hugging Face 与 NVIDIA 教微调 Cosmos:机器人视频合成更实用,但离数据自由还远

Hugging Face 与 NVIDIA 发布教程,演示用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 2B 世界模型,生成机器人操作视频轨迹。 它的实际价值是把大规模视频世界模型接入机器人数据合成流程,而不是证明合成视频可以替代真实采集。 对机器人学习团队和 diffusers/accelerate 工程师来说,这更像一套可复现的适配器训练流程,门槛仍是 80GB GPU 起步。

Hugging FaceNVIDIACosmos Predict 2.5 2B
OpenAI 携手戴尔把 Codex 推向本地企业环境,AI 代理落地难题仍在数据治理
人工智能 2026/5/19

OpenAI 携手戴尔把 Codex 推向本地企业环境,AI 代理落地难题仍在数据治理

OpenAI 与 Dell Technologies 合作,让 Codex 连接 Dell AI Data Platform,并探索与 Dell AI Factory 对接,目标是服务混合云和本地部署企业。关键不在于 Codex 多了一个渠道,而在于它能否在大企业严苛的数据治理、权限控制和内部上下文环境中真正可用。当前合作仍处于连接与探索阶段,不能等同于 Codex 已全面本地化部署。

OpenAICodexDell Technologies
Alexa+ 会生成播客了:亚马逊想抢的不是主播饭碗,是你的耳朵入口
人工智能 2026/5/19

Alexa+ 会生成播客了:亚马逊想抢的不是主播饭碗,是你的耳朵入口

Amazon 给 Alexa Plus 加上了 AI 生成播客功能,用户输入主题后,Alexa 会先给出讨论概要,再由两名 AI 主持人生成一段音频节目。更关键的补充信息是:它会接入 Reuters、AP、Washington Post、Vox、Politico 等约 200 家出版物内容,并直接分发到 Echo Show 和 Alexa app,这让它不只是语音回答,而是在试探家庭音频入口。

Alexa+AmazonAI生成播客
Kin Health 融资 900 万美元:AI 医疗记事转向患者端,难点不只是听清医生说了什么
人工智能 2026/5/19

Kin Health 融资 900 万美元:AI 医疗记事转向患者端,难点不只是听清医生说了什么

Kin Health 完成 900 万美元种子轮融资,由 Maveron 领投,做的是面向患者的 AI 就诊记录工具,不是医生端病历系统。 它能录制问诊、转写、生成摘要和行动项,并分享给家人朋友,真正切中的是患者跨医院、跨专科管理病情的痛点。 但患者端 AI 医疗记事的门槛也更硬:隐私、录音同意、摘要准确性、口音识别和责任归属,都还没有被产品一句“AI 总结”解决。

AI医疗记事Kin Health患者端医疗记录
AI竞争的暗线:模型发布会之外,谁在控制实验和训练
人工智能 2026/5/27

AI竞争的暗线:模型发布会之外,谁在控制实验和训练

Import AI 457串起四个信号:Fast16污染高精度计算,Muon暴露优化器风险,positive alignment把安全问题推向价值治理,LLM开始自动优化训练流程。我的判断是,AI竞争的分水岭正在从单点模型能力,下沉到算力、优化器、安全审计和科研自动化这些底层控制权。

AI竞争模型训练算力控制
PaddleOCR 3.5 接入 Transformers:模型没换代,接入少绕路
人工智能 2026/5/18

PaddleOCR 3.5 接入 Transformers:模型没换代,接入少绕路

PaddleOCR 3.5 新增 Transformers 推理后端,开发者可用 engine="transformers" 在 Hugging Face / PyTorch 工作流里运行受支持的 OCR 与文档解析模型。它的价值不在宣称精度或速度提升,而在降低接入摩擦。对做 RAG、Document AI、搜索和 Agent 的团队,这更像一次工程入口改造;若追求高吞吐,默认 paddle_static 仍是更稳的选择。

PaddleOCRTransformersOCR
幼儿园摄像头训练 AI:真正越界的不是技术,是默认同意
人工智能 2026/5/20

幼儿园摄像头训练 AI:真正越界的不是技术,是默认同意

华盛顿大学 Gail Joseph 与 Cultivate Learning 团队曾计划让幼儿园教师佩戴第一视角摄像头,并在教室架设固定摄像机,拍摄儿童课堂互动,用于训练评估课堂质量的 AI 模型。项目在家长反弹后被校方称已终止,但争议没有结束:低龄儿童课堂一旦变成数据采集现场,默认退出、云端处理和未来共享都不能靠含糊文字带过。对家长和教育从业者来说,接下来最该盯住的不是 AI 口号,而是同意机制、数据去向和退出成本。

教育AI数据治理知情同意
Agent 评测开始算总账:Hugging Face 与 IBM 把成本和失败也放上榜
人工智能 2026/5/18

Agent 评测开始算总账:Hugging Face 与 IBM 把成本和失败也放上榜

Hugging Face 与 IBM Research 发布 Open Agent Leaderboard,评测对象是完整 AI Agent 系统,而不是单独模型。它同时报告平均成功率、平均单任务成本和分基准结果,把“能不能做成事”和“做成要花多少钱”放在同一张表里。更关键的信号是:Agent 评测正在从比模型分数,转向比系统泛化、成本控制和失败行为。

AI AgentOpen Agent LeaderboardHugging Face
AI 竞争到 2026:烧钱买算力容易,把算力变成利润很难
人工智能 2026/5/18

AI 竞争到 2026:烧钱买算力容易,把算力变成利润很难

Benedict Evans 在《AI eats the world》里把 2026 年 AI 竞争概括为一场平台迁移:资本开支、算力部署、用户使用和产业重组同时挤在一起发生。最关键的变量可能不再是模型多强,而是谁能把天量算力、浅层用户使用和真正付费的软件场景对齐。对创业者和企业买家来说,接下来要看的不是演示效果,而是推理成本、留存、部署周期和 ROI 能不能闭环。

AI 竞争资本开支算力
AI 写代码这么久,为什么还没有提示词版 Photoshop?
人工智能 2026/5/18

AI 写代码这么久,为什么还没有提示词版 Photoshop?

一篇独立开发者博客把 vibecoding 争议问到关键处:如果提示词已经抹平复杂软件门槛,为什么还没看到可验证的 Photoshop、Excel、Blender、数据库或 OS 级作品批量出现?作者的判断更克制:AI 主要压低写代码的体力成本,验证、架构和产品判断仍是硬门槛。把作品粗暴扣成“vibecoded”,很多时候不是技术批评,而是身份焦虑。

AI 编程vibecoding提示词
GenCAD 的看点不是生成 3D 外形,而是生成可编辑 CAD 历史
人工智能 2026/5/18

GenCAD 的看点不是生成 3D 外形,而是生成可编辑 CAD 历史

GenCAD 提出从图像生成参数化 CAD 命令序列,再转换为 3D 实体模型。它的价值不在于多做一个 3D 外形生成器,而在于尝试绕开 mesh、voxel、point cloud,直接生成可编辑的 CAD program。工程团队可以把它当作设计自动化方向的研究信号,但不宜据此延后采购或迁移现有 CAD 流程,关键还要看精度、鲁棒性和复杂 B-rep 适配。

GenCADAI 3D生成CAD
Siri 要靠“自动删聊天”翻身?苹果这张隐私牌还不够
人工智能 2026/5/18

Siri 要靠“自动删聊天”翻身?苹果这张隐私牌还不够

据 Bloomberg 记者 Mark Gurman 报道,苹果可能在 6 月 WWDC 发布新版 Siri,并把隐私作为核心卖点,包括聊天记录自动删除、独立 Siri 应用,以及部分能力可能由 Google Gemini 支撑。这个线索比单纯的“自动删记录”更关键:新版 Siri 不只是改一个隐私设置,而是苹果试图把 Siri 从系统命令入口改造成 AI 聊天入口。隐私能帮苹果重新建立信任,但如果能力补课不够,Siri 还是很难从 ChatGPT、Gemini、Claude 手里抢回用户习惯。

Siri苹果隐私
Eric Schmidt毕业演讲被嘘:AI机会叙事为什么不再好用
人工智能 2026/5/18

Eric Schmidt毕业演讲被嘘:AI机会叙事为什么不再好用

谷歌前 CEO Eric Schmidt 周五在亚利桑那大学毕业典礼谈 AI 时,多次被现场学生嘘声打断。关键不只是学生反感 AI,而是硅谷的“抓住机会”话术,撞上了毕业生对就业、信任和技术收益分配的焦虑。对年轻求职者和高校来说,接下来要看的不是 AI 口号有多热,而是入门岗位、课程训练和企业招聘标准怎么变。

人工智能Eric Schmidt就业焦虑
AI在毕业典礼上挨嘘:学生反感的不是技术,是账单
人工智能 2026/5/22

AI在毕业典礼上挨嘘:学生反感的不是技术,是账单

美国多所大学毕业典礼上,企业高管和校方在谈到AI时遭到学生嘘声,前Google CEO埃里克·施密特在亚利桑那大学的演讲只是最出圈的一幕。新一轮视频把这件事从单点尴尬推成了多校现象:毕业生不是不会用AI,而是不愿被那些不承担代价的人训话。

AI毕业典礼学生反感
AI得来速降温:麦当劳停下合作,Taco Bell重新算账
人工智能 2026/5/17

AI得来速降温:麦当劳停下合作,Taco Bell重新算账

美国快餐连锁仍在试AI语音点单,但麦当劳在2024年结束与IBM的合作,Taco Bell也因用户吐槽和恶搞订单重新评估推广节奏。问题不只是识别准确率,而是AI能不能扛住高峰、错单、缺货、口音和顾客不耐烦。对AI商业化和餐饮零售从业者来说,真正该看的不是演示效果,而是人工接管率、补救成本和顾客是否愿意继续用。

AI语音点单得来速麦当劳
ElliQ 试用一周:陪伴机器人补上的不是医疗能力,而是日常推动力
人工智能 2026/5/17

ElliQ 试用一周:陪伴机器人补上的不是医疗能力,而是日常推动力

The Verge 作者试用 ElliQ 一周后发现,它促使患帕金森病的母亲重新开始太极、游戏和日常对话。这个个案不能证明临床疗效,但说明陪伴机器人在居家照护里可能有一块现实位置:持续、主动、低压力地推动老人动起来。真正要警惕的是边界,ElliQ 不能替代医生、药物和护理员,也不该被当成医疗监测设备。

ElliQ陪伴机器人Intuition Robotics
M5 Max 本地跑大模型未必省钱:真正贵的是折旧和等待
人工智能 2026/5/17

M5 Max 本地跑大模型未必省钱:真正贵的是折旧和等待

一位开发者按电费、硬件折旧和推理速度估算后认为,用 M5 Max MacBook Pro 本地跑 Gemma 4 31B,每百万 token 成本通常高于 OpenRouter。电费只占很小一部分,4299 美元设备折旧和 10-40 tokens/s 的本地速度才是关键。这个结论不等于本地 AI 没价值,但会改变开发者买高配 Mac、团队选 API 还是本地部署的预算判断。

本地大模型推理成本M5 Max MacBook Pro
SDFT 值得看:它不是微调花活,而是在碰持续学习的硬骨头
人工智能 2026/5/17

SDFT 值得看:它不是微调花活,而是在碰持续学习的硬骨头

arXiv:2601.19897 论文《Self-Distillation Enables Continual Learning》提出 Self-Distillation Fine-Tuning,用 demonstration-conditioned model 给自己生成更接近 on-policy 的训练信号。它的重点不是“自蒸馏”这个名字,而是试图缓解大模型持续学习里的老冲突:学新任务,同时少忘旧能力。现在还不能把它当成产业突破,但做后训练、agent 技能积累和企业模型更新的人,应该认真读。

Self-Distillation Fine-Tuning持续学习大模型
MCP 的 401 页面:协议没错,用户被挡在门外
人工智能 2026/5/17

MCP 的 401 页面:协议没错,用户被挡在门外

HybridLogic 给自家工具上线 MCP Server 后,用户把 MCP URL 当普通网页打开,只看到 401 Unauthorized 和原始 JSON,于是误以为服务坏了。 他们用 Accept Header 判断浏览器访问,给 GET /mcp 返回一页 HTML 引导页,支持工单大幅减少,客户配置也更快。 这不是 401 的 bug,而是 AI 工具链的产品债:规范如果不处理第一眼体验,复杂性就会转嫁给开发者和客服。

MCPMCP ServerAI 工具
OpenClaw 两个月换六个名字:AI Agent 工具难在边界,不在命名
人工智能 2026/5/17

OpenClaw 两个月换六个名字:AI Agent 工具难在边界,不在命名

Simon Willison 为 PyCon US 闪电演讲追溯 OpenClaw README 的 Git 历史,发现项目在 2025-11-24 到 2026-01-30 间从 Warelay 改到 OpenClaw。README 第一行的变化,比名字本身更有信息量:它从 WhatsApp Relay CLI,滑向 AI Agent 网关,再进入 Personal AI Assistant。对开发者和工具选型者来说,这提醒他们别只看 AI 助理叙事,要先看产品边界是否稳定。

OpenClawAI Agent开源项目
AI淘金热的落差:少数人暴富,更多工程师在重算职业安全感
人工智能 2026/5/17

AI淘金热的落差:少数人暴富,更多工程师在重算职业安全感

Menlo Ventures 合伙人 Deedy Das 在 X 上称,旧金山 AI 热潮正在制造强烈分化:少数头部公司员工可能拿到退休级财富,更多高薪科技从业者却感到职业后路变窄。 他的约 1 万人、超过 2000 万美元财富估算不是正式统计,但它点中了一个更现实的问题:AI 红利集中在股权和算力链条上,而软件工程师的技能溢价正在被重新定价。 这件事对从业者和投资人都不是情绪话题,而是路线选择:押注哪类公司、补哪类能力、承担多大股权风险。

AI热潮职业安全感OpenAI