Base44自研Base1：vibe coding不只拼体验，开始拼成本账本

核心摘要 Summary

Wix旗下vibe coding平台Base44开始推出自研模型Base1，目标是用平台上的真实用户交互数据，改善延迟、推理成本和应用生成效果。
它不等于Base44已经追上Claude、OpenAI或xAI，但说明AI应用公司只做模型调用层，长期议价权会很薄。
接下来最该看三件事：Base1的实际效果、单位推理成本下降幅度，以及用户是否愿意为更便宜但可能不总是最强的模型买单。

Base44这次做了一件反常的事：一个vibe coding应用平台，开始推出自己的AI模型Base1。

它不是OpenAI，也不是Anthropic。更有意思的是，Base44去年才被Wix以8000万美元收购；当时公司只有约6个月历史，团队8个人。现在Base44称自己的ARR已超过1亿美元，并把模型层也往自己手里收。

这事最该看的，不是“Base1能不能打赢Claude或GPT”。目前没人能这么下结论。真正的问题是：AI应用公司的护城河，到底在模型本身，还是在分发、数据、基础设施和成本控制绑成的闭环里。

Base44做了什么：把模型层往回收

Base44推出Base1，用在自然语言创建应用的场景里。按照Base44的说法，Base1基于平台上数千万次真实用户交互训练，目标是提升延迟、成本、效率和结果贴合度。

这几个词听起来像产品话术，但背后很具体：生成一次应用要多少钱，修改一次页面要等多久，模型是不是懂“我要一个能收集线索的落地页”这种任务，而不是只会泛泛写代码。

问题	目前能确认的事实	我会怎么读
Base44做了什么	推出自研模型Base1	从单纯调用外部模型，走向控制部分模型能力
Base1依赖什么	据称使用平台数千万次真实用户交互	垂直数据是它最像护城河的部分
想解决什么	延迟、推理成本、效率、结果贴合度	性能只是表面，毛利才是底层压力
不能怎么说	不能断言Base1已超过Claude、OpenAI、xAI	Base44讲的是目标和预期，不是已经赢了

Base44创始人Maor Shlomo的说法很直白：拥有模型，才能在延迟、成本和效率上做更多优化。他也希望Base1最终能在自己的场景里超过通用前沿模型。

这里要把边界划清。关键词是“自己的场景”。Base1如果在app creation任务里更快、更便宜、更顺手，那已经有价值。但这和全面强过Claude、OpenAI或xAI，不是一回事。

对企业采购者和产品团队来说，短期动作也会变得更现实：不必急着迁移工具，但该开始问供应商两件事——底层模型怎么路由，成本下降会不会反映到套餐或用量限制上。以前只问“效果好不好”，现在还要问“账单扛不扛得住”。

vibe coding的竞争，已经从界面打到账本

Lovable是最好的对照。它增长很猛，称ARR已达5亿美元，但目前仍主要依赖外部LLM。Base44规模小一些，称ARR超过1亿美元，却选择把模型往内收。

两条路没有绝对高下。它们是在赌不同的控制点。

路线	好处	代价	更适合谁
依赖外部前沿模型	快速吃到最强通用能力，研发负担轻	成本、节奏、议价权受制于外部模型厂商	追求速度、产品还在验证期的团队
自研垂直模型	可优化成本、延迟和场景贴合度	研发重，评测难，不一定追得上前沿模型	已有数据、分发和高频使用场景的平台

VC Jonathan Userovici提到一个更清醒的框架：AI创业公司的防御性来自数据、分发、技术栈三件事，不只是模型。

这比“所有应用公司都要自研模型”靠谱。法律AI公司Harvey曾放弃自研模型计划，就是反例。训练一个垂直模型，不是给公司贴上“自研”标签就能降本。后面是工程、算力、评测、迭代和现金流。

更现实的限制还在另一边：前沿模型厂商也在下场。Claude Code已经进入开发者工作流，Cursor、xAI等玩家也在靠近app creation和vibe coding场景。它们同样能拿到反馈数据，也会优化从提示词到代码生成的链路。

Base44的筹码是垂直场景和Wix体系内的分发。前沿模型厂商的筹码是通用能力、研发速度和算力肌肉。两边都不是陪跑。

这像早期云计算和SaaS的关系。不完全一样，但结构相似：应用公司先借基础设施跑起来，等规模变大，才发现最贵的那层不能永远交给别人定价。天下熙熙，皆为利来。技术叙事再热，最后都要回到毛利表。

接下来要看什么：效果、成本、用户选择

我更在意的是推理成本。

过去一年，AI应用公司喜欢讲增长：用户数、项目数、ARR、留存。但规模一上来，模型账单也上来。企业客户开始算ROI，普通用户也开始在意AI功能为什么这么贵、为什么次数受限。

用最强模型处理所有请求，演示时很漂亮，财务上未必体面。很多应用生成任务不需要每一步都调用最强前沿模型。更合理的做法，是模型路由、任务拆分、缓存、垂直模型一起上。

Base44自研Base1，合理性就在这里。如果它能把常见应用创建任务交给更便宜、更快的垂直模型，再把复杂任务交给前沿模型，产品体验未必下降，毛利可能更好。

但这件事不能只听愿景。接下来最该盯三个变量：

Base1在真实任务里的通过率和返工率：生成快没用，用户改三遍就把省下的成本吃回去了。
单位推理成本到底降多少.没有成本改善幅度，自研模型很容易变成资本开支换口号。
模型路由是否足够聪明.简单任务走Base1，复杂任务走前沿模型，才可能兼顾效果和利润。

这也会影响开发者和企业采购的选择。

开发者不会因为“自研模型”四个字换工具。他们会看生成质量、调试成本、迁移成本。企业采购更直接：如果Base44能证明同等任务下更便宜、更稳定，采购会更愿意放量；如果只是换了模型名，团队会继续观望，甚至延后迁移。

对Wix来说，更好的利润率当然是好消息。尤其在Wix宣布裁员20%的背景下，一个高速增长的AI业务如果能解释清楚成本结构，会更容易被母公司接受。但不能反过来说Base44拖累Wix，原始信息没有这个因果。

所以Base1的意义，不是Base44要变成基础模型公司。它更像一次补课：当你已经有分发、有真实用户、有高频交互，还把核心成本和关键体验完全交给外部模型，长期很难硬气。

前沿模型负责抬天花板，垂直模型负责守利润表。

Base44未必能赢。但它至少看清了战场。vibe coding下一阶段，比的不是谁的演示视频更丝滑，而是谁能把数据、模型、分发和算力账本缝成一个闭环。缝不上，就只能在别人涨价和降价之间摇摆。

Base44自研Base1：vibe coding不只拼体验，开始拼成本账本

Base1自研

动作核心

垂直数据

场景优化

竞争转向

外部调用

自研模型

护城河

非通用胜出

前沿压力

后续变量

真实效果

成本改善

Base44做了什么：把模型层往回收

vibe coding的竞争，已经从界面打到账本

接下来要看什么：效果、成本、用户选择