最新科技资讯 第21页
聚合 AI、科技、商业、硬件与开发工具的最新内容,按时间顺序查看第 21 页精选文章。

Hugging Face 与 NVIDIA 教微调 Cosmos:机器人视频合成更实用,但离数据自由还远
Hugging Face 与 NVIDIA 发布教程,演示用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 2B 世界模型,生成机器人操作视频轨迹。 它的实际价值是把大规模视频世界模型接入机器人数据合成流程,而不是证明合成视频可以替代真实采集。 对机器人学习团队和 diffusers/accelerate 工程师来说,这更像一套可复现的适配器训练流程,门槛仍是 80GB GPU 起步。

OpenAI 携手戴尔把 Codex 推向本地企业环境,AI 代理落地难题仍在数据治理
OpenAI 与 Dell Technologies 合作,让 Codex 连接 Dell AI Data Platform,并探索与 Dell AI Factory 对接,目标是服务混合云和本地部署企业。关键不在于 Codex 多了一个渠道,而在于它能否在大企业严苛的数据治理、权限控制和内部上下文环境中真正可用。当前合作仍处于连接与探索阶段,不能等同于 Codex 已全面本地化部署。

Simon Willison 的一条观鸟记录,比很多科技热文更像开放网络
Simon Willison 在 2026 年 5 月 18 日 PyCon US 返程当天清晨,于洛杉矶河记录了灰翅鸥、褐鹈鹕、雪鹭和加拿大雁等观察。重点不是鸟类新闻,而是技术作者如何把一次散步变成可链接、可归档、可再发现的记录。对写博客、做工具和关心开放数据的人来说,这条小记录比一条即时动态更有后劲。

PlayStation Plus 短期订阅涨价:最先被重新定价的是短包月玩家
索尼将从 5 月 20 日起,在部分地区上调 PlayStation Plus 1 个月和 3 个月订阅起售价。美国 Essential 档最清楚:1 个月涨 1 美元,3 个月涨 3 美元。 现有订阅用户价格暂不变,但土耳其和印度除外;换档、断订后再订,可能按新价格算。更值得看的是,这次服务涨价是否会和此前两次 PS5 相关价格上调连成一条线。

Google Workspace 新图标开始推送:渐变、圆角,以及更难认的风险
Google 正在向更多用户推送新版 Workspace 应用图标,此前泄露的设计已经开始出现在界面里,但不是所有用户都已收到。 这次变化集中在渐变色、圆角和部分图标形态重做,不是 Workspace 功能更新。 我更在意的是:Google 想统一视觉秩序,但 Chat、Meet、Calendar 等应用从彩虹色转向单色后,识别度可能提升,也可能让老用户短期混淆。

Alexa+ 会生成播客了:亚马逊想抢的不是主播饭碗,是你的耳朵入口
Amazon 给 Alexa Plus 加上了 AI 生成播客功能,用户输入主题后,Alexa 会先给出讨论概要,再由两名 AI 主持人生成一段音频节目。更关键的补充信息是:它会接入 Reuters、AP、Washington Post、Vox、Politico 等约 200 家出版物内容,并直接分发到 Echo Show 和 Alexa app,这让它不只是语音回答,而是在试探家庭音频入口。

Kin Health 融资 900 万美元:AI 医疗记事转向患者端,难点不只是听清医生说了什么
Kin Health 完成 900 万美元种子轮融资,由 Maveron 领投,做的是面向患者的 AI 就诊记录工具,不是医生端病历系统。 它能录制问诊、转写、生成摘要和行动项,并分享给家人朋友,真正切中的是患者跨医院、跨专科管理病情的痛点。 但患者端 AI 医疗记事的门槛也更硬:隐私、录音同意、摘要准确性、口音识别和责任归属,都还没有被产品一句“AI 总结”解决。

纽约公立医疗系统泄露至少180万人数据:麻烦不只在病历,还在指纹
纽约公立医疗服务提供方 NYC Health and Hospitals 披露,一起持续数月的数据泄露影响至少180万人,黑客窃取了个人数据、医疗记录,以及包括指纹在内的生物识别扫描数据。这里的关键不是“又一家医院被黑”,而是医疗记录和指纹都很难善后:前者会跟着人很久,后者不能像密码一样重置。攻击者身份、入侵路径和完整影响范围仍未确认,现阶段最该做的是分清已知事实、个人风险和后续官方通知。

AudioHijack 刺中的不是语音 AI,而是工具权限太松
IEEE Spectrum 报道称,浙江大学等研究者提出 AudioHijack:把人耳难以察觉的恶意扰动嵌入音频,诱导大型音频语言模型执行搜索、下载、发邮件等动作。研究测试了 13 个领先开源模型,也涉及 Microsoft、Mistral 等商业语音 AI 服务,平均攻击成功率约 79% 到 96%,但这个数字不能外推到所有语音 AI 和所有真实环境。真正要紧的是:多模态 AI 一旦接上外部工具,输入边界、权限边界和用户意图边界会一起变薄。

Cloudflare 测试 Mythos Preview:AI 漏洞研究的关键不在聊天,而在验证流水线
Cloudflare 在 Project Glasswing 中用 Anthropic 的 Mythos Preview 扫描 50 多个自有代码仓库,覆盖运行时、边缘数据路径、协议栈、控制平面和依赖的开源项目。真正重要的不是模型“更会写代码”,而是它把漏洞发现推进到可验证攻击链和 PoC 迭代;真正受考验的,也从模型能力转向企业能否搭出受控 harness。

24TB 的 2b2t 世界下载:玩家把无政府服务器做成了档案库
2b2t.place 团队在 GitHub 发布一个号称 Minecraft/2b2t 史上最大规模的世界下载项目,总量约 24TB,最大单项是 1,024,000² 主世界区域,下载耗时 109 天。Torrent 尚未立即放出,目前主要通过地图网站、2b2t Wayback Machine、渲染图和数据表访问。真正的变化不是文件变大了,而是玩家社区开始掌握存档、检索和数据挖掘能力;基地隐藏者、历史研究者和服务器治理者都会被卷进去。

AI竞争的暗线:模型发布会之外,谁在控制实验和训练
Import AI 457串起四个信号:Fast16污染高精度计算,Muon暴露优化器风险,positive alignment把安全问题推向价值治理,LLM开始自动优化训练流程。我的判断是,AI竞争的分水岭正在从单点模型能力,下沉到算力、优化器、安全审计和科研自动化这些底层控制权。

PaddleOCR 3.5 接入 Transformers:模型没换代,接入少绕路
PaddleOCR 3.5 新增 Transformers 推理后端,开发者可用 engine="transformers" 在 Hugging Face / PyTorch 工作流里运行受支持的 OCR 与文档解析模型。它的价值不在宣称精度或速度提升,而在降低接入摩擦。对做 RAG、Document AI、搜索和 Agent 的团队,这更像一次工程入口改造;若追求高吞吐,默认 paddle_static 仍是更稳的选择。

AI 把漏洞赏金的提交成本打穿了,审核成本开始爆表
AI 生成的低质量漏洞报告正在淹没部分 bug bounty 项目:Bugcrowd 三周内报告量翻四倍,Curl 和 Nextcloud 已暂停相关项目。问题不是 AI 报告全无价值,HackerOne 的有效比例仍约 25%,高质量 AI 辅助报告也在增加。真正变了的是账本:提交成本被打穿,审核成本被推给平台、安全团队和开源维护者。

宝马 M3 CS 手动后驱版:燃油 M3 最后一脚离合,标价 107100 美元
宝马为第六代 G80 M3 推出 2027 M3 CS Handschalter:北美限定,六速手动、后驱、减重约 75 磅,起价 107100 美元。它不是更快的 M3,动力仍是普通手动 M3 的 473 hp S58 直六,也没有 xDrive。宝马这次做对的地方,是承认驾驶参与感还有价值;尴尬之处在于,它已经被做成昂贵小众商品。

BuzzFeed卖出52%控制权:社交流量旧梦醒了,AI还没给出新路
BuzzFeed同意让Allen Family Digital以1.2亿美元取得52%控制权,交割时先拿2000万美元,余款未来支付;公司仍是上市公司,但创始人Jonah Peretti将卸任CEO,转任BuzzFeed AI总裁。我的判断是:这不是普通媒体并购,而是BuzzFeed承认旧的社交流量模型撑不住了,开始押注AI实验和直接用户关系。真正要看的不是“AI追YouTube”的口号,而是它能不能让用户回来、留下、付费。

一把椅子长近 10 年:Full Grown 的树木家具,离量产还很远
英国德比郡 Full Grown 用近 20 年试验“种家具”:椅子、凳子、长椅和灯具在树木生长期被塑形,单件通常要 6-9 年生长,再干燥约 1 年。它的价值不在马上替代家具工厂,而在把材料生长和造型加工合到一起。对设计师、园艺和手工艺从业者来说,更现实的动作是把它当作小规模工艺与教学样本,而不是采购排期里的稳定货源。

Files.md:一个更小的 Obsidian,和一场反第二大脑幻觉
Files.md 以开源 Obsidian 替代品亮相,但它目前更像一个 Beta 阶段的本地 Markdown 工作台:笔记、日记、任务、清单都回到 plain .md 文件。它的价值不在功能追赶,而在把 PKM 用户从插件、模板、图谱的掌控感里拽出来。适合想少折腾工具的开发者和重度写作者;不适合已经依赖 Obsidian 插件生态的人立刻迁移。

幼儿园摄像头训练 AI:真正越界的不是技术,是默认同意
华盛顿大学 Gail Joseph 与 Cultivate Learning 团队曾计划让幼儿园教师佩戴第一视角摄像头,并在教室架设固定摄像机,拍摄儿童课堂互动,用于训练评估课堂质量的 AI 模型。项目在家长反弹后被校方称已终止,但争议没有结束:低龄儿童课堂一旦变成数据采集现场,默认退出、云端处理和未来共享都不能靠含糊文字带过。对家长和教育从业者来说,接下来最该盯住的不是 AI 口号,而是同意机制、数据去向和退出成本。

互联网权力不只在算法里,也埋在电缆、土地和接入权里
404 Media 采访 Rutgers 学者 Britt Paris,围绕其新书《Radical Infrastructure》讨论互联网的物理基础设施。重点不是又一本平台批判,而是把问题往下挖:谁拥有接入网络、线路和治理权,谁就更接近互联网的真实权力。社区电信合作社和 NEMR 这样的案例,提供的不是万能解法,而是一种反垄断想象。

Agent 评测开始算总账:Hugging Face 与 IBM 把成本和失败也放上榜
Hugging Face 与 IBM Research 发布 Open Agent Leaderboard,评测对象是完整 AI Agent 系统,而不是单独模型。它同时报告平均成功率、平均单任务成本和分基准结果,把“能不能做成事”和“做成要花多少钱”放在同一张表里。更关键的信号是:Agent 评测正在从比模型分数,转向比系统泛化、成本控制和失败行为。