Base44这次做了一件反常的事:一个vibe coding应用平台,开始推出自己的AI模型Base1。
它不是OpenAI,也不是Anthropic。更有意思的是,Base44去年才被Wix以8000万美元收购;当时公司只有约6个月历史,团队8个人。现在Base44称自己的ARR已超过1亿美元,并把模型层也往自己手里收。
这事最该看的,不是“Base1能不能打赢Claude或GPT”。目前没人能这么下结论。真正的问题是:AI应用公司的护城河,到底在模型本身,还是在分发、数据、基础设施和成本控制绑成的闭环里。
Base44做了什么:把模型层往回收
Base44推出Base1,用在自然语言创建应用的场景里。按照Base44的说法,Base1基于平台上数千万次真实用户交互训练,目标是提升延迟、成本、效率和结果贴合度。
这几个词听起来像产品话术,但背后很具体:生成一次应用要多少钱,修改一次页面要等多久,模型是不是懂“我要一个能收集线索的落地页”这种任务,而不是只会泛泛写代码。
| 问题 | 目前能确认的事实 | 我会怎么读 |
|---|---|---|
| Base44做了什么 | 推出自研模型Base1 | 从单纯调用外部模型,走向控制部分模型能力 |
| Base1依赖什么 | 据称使用平台数千万次真实用户交互 | 垂直数据是它最像护城河的部分 |
| 想解决什么 | 延迟、推理成本、效率、结果贴合度 | 性能只是表面,毛利才是底层压力 |
| 不能怎么说 | 不能断言Base1已超过Claude、OpenAI、xAI | Base44讲的是目标和预期,不是已经赢了 |
Base44创始人Maor Shlomo的说法很直白:拥有模型,才能在延迟、成本和效率上做更多优化。他也希望Base1最终能在自己的场景里超过通用前沿模型。
这里要把边界划清。关键词是“自己的场景”。Base1如果在app creation任务里更快、更便宜、更顺手,那已经有价值。但这和全面强过Claude、OpenAI或xAI,不是一回事。
对企业采购者和产品团队来说,短期动作也会变得更现实:不必急着迁移工具,但该开始问供应商两件事——底层模型怎么路由,成本下降会不会反映到套餐或用量限制上。以前只问“效果好不好”,现在还要问“账单扛不扛得住”。
vibe coding的竞争,已经从界面打到账本
Lovable是最好的对照。它增长很猛,称ARR已达5亿美元,但目前仍主要依赖外部LLM。Base44规模小一些,称ARR超过1亿美元,却选择把模型往内收。
两条路没有绝对高下。它们是在赌不同的控制点。
| 路线 | 好处 | 代价 | 更适合谁 |
|---|---|---|---|
| 依赖外部前沿模型 | 快速吃到最强通用能力,研发负担轻 | 成本、节奏、议价权受制于外部模型厂商 | 追求速度、产品还在验证期的团队 |
| 自研垂直模型 | 可优化成本、延迟和场景贴合度 | 研发重,评测难,不一定追得上前沿模型 | 已有数据、分发和高频使用场景的平台 |
VC Jonathan Userovici提到一个更清醒的框架:AI创业公司的防御性来自数据、分发、技术栈三件事,不只是模型。
这比“所有应用公司都要自研模型”靠谱。法律AI公司Harvey曾放弃自研模型计划,就是反例。训练一个垂直模型,不是给公司贴上“自研”标签就能降本。后面是工程、算力、评测、迭代和现金流。
更现实的限制还在另一边:前沿模型厂商也在下场。Claude Code已经进入开发者工作流,Cursor、xAI等玩家也在靠近app creation和vibe coding场景。它们同样能拿到反馈数据,也会优化从提示词到代码生成的链路。
Base44的筹码是垂直场景和Wix体系内的分发。前沿模型厂商的筹码是通用能力、研发速度和算力肌肉。两边都不是陪跑。
这像早期云计算和SaaS的关系。不完全一样,但结构相似:应用公司先借基础设施跑起来,等规模变大,才发现最贵的那层不能永远交给别人定价。天下熙熙,皆为利来。技术叙事再热,最后都要回到毛利表。
接下来要看什么:效果、成本、用户选择
我更在意的是推理成本。
过去一年,AI应用公司喜欢讲增长:用户数、项目数、ARR、留存。但规模一上来,模型账单也上来。企业客户开始算ROI,普通用户也开始在意AI功能为什么这么贵、为什么次数受限。
用最强模型处理所有请求,演示时很漂亮,财务上未必体面。很多应用生成任务不需要每一步都调用最强前沿模型。更合理的做法,是模型路由、任务拆分、缓存、垂直模型一起上。
Base44自研Base1,合理性就在这里。如果它能把常见应用创建任务交给更便宜、更快的垂直模型,再把复杂任务交给前沿模型,产品体验未必下降,毛利可能更好。
但这件事不能只听愿景。接下来最该盯三个变量:
- Base1在真实任务里的通过率和返工率:生成快没用,用户改三遍就把省下的成本吃回去了。
- 单位推理成本到底降多少.没有成本改善幅度,自研模型很容易变成资本开支换口号。
- 模型路由是否足够聪明.简单任务走Base1,复杂任务走前沿模型,才可能兼顾效果和利润。
这也会影响开发者和企业采购的选择。
开发者不会因为“自研模型”四个字换工具。他们会看生成质量、调试成本、迁移成本。企业采购更直接:如果Base44能证明同等任务下更便宜、更稳定,采购会更愿意放量;如果只是换了模型名,团队会继续观望,甚至延后迁移。
对Wix来说,更好的利润率当然是好消息。尤其在Wix宣布裁员20%的背景下,一个高速增长的AI业务如果能解释清楚成本结构,会更容易被母公司接受。但不能反过来说Base44拖累Wix,原始信息没有这个因果。
所以Base1的意义,不是Base44要变成基础模型公司。它更像一次补课:当你已经有分发、有真实用户、有高频交互,还把核心成本和关键体验完全交给外部模型,长期很难硬气。
前沿模型负责抬天花板,垂直模型负责守利润表。
Base44未必能赢。但它至少看清了战场。vibe coding下一阶段,比的不是谁的演示视频更丝滑,而是谁能把数据、模型、分发和算力账本缝成一个闭环。缝不上,就只能在别人涨价和降价之间摇摆。
