最新科技资讯
聚合 AI、科技、商业、硬件与开发工具的最新内容,按时间顺序查看第 1 页精选文章。

GLM-5.2 能进工具箱,但还没到替代 Opus
TechStackups 用同一条 one-shot 提示,让 GLM-5.2 和 Claude Opus 4.8 从零写 raw WebGL 3D 平台游戏;Opus 用 33m30s 完成,GLM-5.2 用 1h10m40s。GLM-5.2 成本只有 5.39 美元,约为 Opus 估算成本 21.92 美元的四分之一,但成品缺陷更基础。我的判断:GLM-5.2 已经能进工具箱,尤其适合成本敏感和重视开放权重的团队;但在视觉自检、完成度和代理执行稳定性上,还没到替代 Opus 的位置。

Deno Desktop 要把 Web 项目打成桌面应用,别急着把它当 Electron 终结者
Deno 文档披露,Deno 2.9 将引入 `deno desktop`,把 Deno、TypeScript 乃至 Next.js 等 Web 项目打包成跨平台桌面应用;目前只在 canary 版可试用,命令、配置和 API 都可能变。它真正押注的不是一句“替代 Electron”,而是降低 Web 项目迁移到桌面的成本。对 Deno/TypeScript 开发者可以试验,对生产团队更适合观望到稳定版。

Mach同时造6种武器:18亿美元估值背后,真正考题是量产
Mach Industries 以18亿美元估值完成3亿美元C轮融资,累计融资约4.85亿美元,却没有走单品突破路线,而是同时推进6个武器项目和底层供应链。它押注美国防务创新不能继续慢吞吞排队,但目前尚无项目进入全速量产,约13个政府合同多数仍在测试或采购中段。我的判断是:Mach抓住了军工供应链的真问题,但它最大的敌人不是同行,而是复杂度、合同转化和规模制造。

丹麦隐私活动人士称遭武装破门:个人信息泄露案里,警察能不能先关掉镜头
丹麦隐私活动人士、前警察 Lars Andersen 称,自己因隐晦发布首相社保号和电话号码,并在 WhatsApp 上追问加密与监控政策,被蒙面武装警察破门逮捕。现有信息主要来自 Andersen 在 X 上的单方陈述,不能直接认定警方违法。真正该看的,是个人信息泄露调查中,警方取证、断网和扣押摄像头是否仍能被外部验证。

Claude 要验身份,开放权重模型的账重新算了
Andrew Marble 因 Claude 身份验证机制,重新评估是否放弃 Claude/GPT 等闭源顶级模型,转向开放权重模型。重点不是开放模型已经全面追平,而是专业用户开始把平台控制、合规解释和迁移成本放进同一张账单。对开发者和技术团队来说,问题正在从“哪个模型最强”变成“我能不能承受工具被平台继续加码控制”。

Sakana AI 的 Fugu:不是新大模型,而是把大模型变成可调度供应链
Sakana AI 发布 Fugu,把多个顶级模型动态编排成一个 OpenAI 兼容 API,而不是推出单一基础模型。更关键的变化是:企业可以按任务调度、排除特定模型或供应商,降低单一厂商绑定。官方跑分很强,但部分基线来自 provider-reported scores,真实生产里的成本、稳定性和合规责任还要另算。

Commodore 那部加拿大转盘电话,稀有在入口被卡住
1983年前后,Commodore 为了让加拿大用户使用 VICModem,被迫和 Bell Canada 体系下的 Northern Electric/Northern Telecom 合作,推出一部只随调制解调器捆绑销售的 Commodore 品牌转盘电话。它稀有,不是因为造型复古,而是因为地域限定、捆绑销售和 VIC-1605 适配开关缺一不可。更要紧的是,这件小硬件说明:早期家用计算机想联网,先撞上的不是算力瓶颈,而是电话网络的接口控制权。

AI 末日论,正在替估值打工
George Hotz 在博客里批评伯克利和旧金山 AI 圈的末日叙事,尤其不满 Anthropic 式的政策恐慌、指数增长和递归自我改进话术。 他的核心判断很刺耳:当前技术成果不足以支撑估值,于是公司需要用未来灾难和未来价值制造心理压力。 这篇文章要看的不是 AI 会不会毁灭世界,而是末日论是否正在变成融资、游说和注意力机器的一部分。

医生改口后,低价全身超声真正要算的账变了
Matthew Zirwas 修正了自己对 Midjourney 低价全身超声筛查的判断:如果设备真能高分辨率、低成本、无害且方便复查,传统筛查的收益/伤害比需要重算。关键不是“早发现一定救命”,而是发现异常后,能不能用连续观察替代一部分活检和切除。普通用户现在不该把它当救命神器,更该盯住后续数据、随访规则和总成本。

Meta 员工请愿反对用电脑使用数据训练 AI:MCI 争议卡在有效同意
Meta 员工请愿要求 Mark Zuckerberg 和公司领导层承诺,不收集员工 computer-use data 用于 AI/ML 模型训练,矛头指向内部项目 MCI。 这件事目前不能写成 Meta 已确认全面监控员工电脑;真正的争议是,雇主能否把键盘、鼠标、屏幕交互这类工作过程数据拿去训练模型。 对准备训练 AI agent 的企业来说,最现实的动作是先停下采集方案,补齐隐私审查、员工数据审查和可拒绝机制。

Claude 多个模型错误率升高:先别猜原因,开发者该检查重试和降级
Anthropic 状态页显示,Claude 的 Opus 4.8、Opus 4.7、Opus 4.6 和 Sonnet 4.6 出现错误率升高,事件自 2026 年 6 月 22 日 00:37 UTC 起仍处于调查中。它不是已确认的全面宕机,也没有披露原因、错误率数值或恢复时间。对 API 开发者和企业用户来说,眼下更该做的是检查失败重试、临时降级和告警,而不是推断 Anthropic 的长期稳定性。

sqlite-utils 4.0rc1 发布:迁移和嵌套事务进来了,但先别当正式版用
Simon Willison 于 2026 年 6 月 21 日发布 sqlite-utils 4.0rc1,这是 4.0 的 release candidate,不是稳定正式版。真正值得看的是 migrations 和 nested transactions:它们补的是 Python/SQLite 脚本长期运行后的可维护性问题。已经把 sqlite-utils 放进 CI、定时任务或数据发布链路的人,可以测试,但不该无验证替换生产依赖。

sqlite-utils 4.0rc1 发布:迁移功能入库,稳定版前该重点试什么
Simon Willison 发布 sqlite-utils 4.0rc1,这是 v4 首个候选版本,还不是稳定版。新增重点是内置 migrations,以及用 db.atomic() 封装 SQLite savepoints 的嵌套事务。开发者可以开始在测试库里试跑,但升级前要核对 upsert、Python 版本、view 访问和 CSV/TSV 类型检测等不兼容变化。

三星电子部署ChatGPT Enterprise和Codex:企业AI开始进制造业主流程
三星电子将在韩国全员及全球Device eXperience部门员工中部署ChatGPT Enterprise和Codex,OpenAI称这是其迄今规模最大的企业部署之一。重点不是三星多了一个AI工具,而是生成式AI正在被放进研发、制造、营销和公司职能流程。合同金额、覆盖人数和内部效率指标尚未披露,真正的检验点是数据、权限和流程能否被管住。

GenieDB 旧员工追问:那份改变人生的创业工作,是否被 VC 收费机制污染
一名前 GenieDB 工程师多年后查阅 SEC 起诉材料和仲裁记录,怀疑这家英国初创进入美国 VC 体系后,曾被卷入 Frost VP 的孵化器收费安排。公开材料没有认定 GenieDB 本身是欺诈工具,也不能把它说成技术骗局;更稳妥的判断是,技术尝试真实存在,但公司存续逻辑可能被基金管理人的自利收费污染。对早期员工和 LP 来说,风险不只在产品失败,还在看不见的基金、孵化器和被投公司之间的利益安排。

Cloudflare 临时账号:AI 是包装,一行命令部署才是重点
Cloudflare 现在允许开发者不注册账号,直接用 `npx wrangler deploy --temporary` 部署临时 Workers 项目,默认存活 60 分钟。想长期保留,再通过 claim 页面认领账号和资源。官方挂的是“for AI agents”,但更大的变化是:云服务把注册动作后置,把第一次成功体验前置。

PowerFox 给旧 Mac 补浏览器短板,但别把它当系统安全更新
PowerFox Browser 宣称支持 Mac OS X Tiger、Leopard、Snow Leopard,卖点包括 TLS 1.3、现代加密套件、WebGL、较新的 JavaScript 引擎、彩色 emoji、NPAPI 插件和多语言包。它对仍在使用 PowerPC、早期 Intel Mac 的人有实际价值,但更像浏览器层面的补位方案。真正要警惕的是:浏览器安全补丁不等于旧版 OS X 重新获得系统级维护。

把对数的底拿掉:一篇博客怎样逼你重看数学记号
Alex Kritchevsky 在《Everything Is Logarithms》中提出“无底对数”:logN 是坐标无关的抽象对象,普通 log_b(N) 是 logN/logb。它不是新定理,也不是教材标准记法,更像一次记号实验:把换底公式、向量坐标、p-adic 赋值和零点阶数放到同一张直觉图上。真正值得看的是边界:类比能帮人理解,但不能替证明交卷。

Claude Code 的痛点不是不会写,是每次都要重新认识项目
GitHub 上的 Recall 是一个第三方 Claude Code 插件:MIT 许可、Python 实现、约 13 stars,用本地日志生成可续接的 context.md。它不联网、不用 API key、不调用外部模型,摘要靠 TF-IDF + TextRank,不是 LLM 记忆。真正值得看的不是这个小工具本身,而是 AI 编程工具正在从模型能力竞争,转向上下文治理竞争。

Apertus 把开源大模型的问题挑明了:只开权重不够
Swiss AI Initiative 推出 Apertus,参与方包括 EPFL、ETH Zurich 和 CSCS,提供 8B、70B 两档模型,并强调训练数据、代码、权重、方法和对齐原则全开放。它真正有价值的地方,不是又多了一个开放模型,而是把合规、可复现、可审计摆到大模型竞争的桌面上。性能、生态和长期投入仍是硬门槛,项目方的竞争力说法目前还不能当成第三方结论。

AI Agent 改写软件团队:被挤压的不是职位,是翻译层
AI Agent 目前最确定的冲击,不是直接消灭工程师或管理者,而是压缩需求到代码、票据到 PR、状态到汇报这类转译任务。软件组织的关键问题会从“要多少执行人”转向“谁定义问题、谁验证结果、谁为上线负责”。对创始人、技术管理者、资深工程师和产品负责人来说,招聘、管理和工程护栏都要重新设计。