不能承受的“平庸”之重：字节跳动的AI反击战

文|智谷趋势王延鹤

字节跳动，已无法再低调。

外媒报道，字节跳动2023年营收1100亿美元，可能超过腾讯、逼近Meta；

TikTok在美国渡劫，作为增长引擎的海外业务遭遇不确定性；

字节跳动在AI竞赛上显得“迟钝”，公司内部“到2023年才开始讨论GPT”；

作为估值超千亿美金的独角兽，字节跳动对外信息披露一贯低调，但行动上其疾如风。身处复杂局势正中心，字节跳动能主动作为、取得战果的突破口，落到了AI。

国内像百度、阿里、华为、科大讯飞等企业布局AI大模型，从去年3月陆续推出测试产品。字节跳动主推的AI智能助手“豆包”，直到8月份才上线。

然而，据QuestMobile数据，2024年3月，豆包App月活用户2328.2万，在AIGC类应用已排名第一；到4月，豆包在苹果中国区的AIGC类应用排名最高，在安卓市场累计下载量破1.3亿。

“大力出奇迹”的流量法则，在字节跳动的AI产品上再次生效。

5月，则是AI超级大月。OpenAI更新GPT-4o，谷歌I/O大会全线更新，微软将公布自家AI和Copilot，阿里发布通义千问2.5……预计“王炸”、“颠覆”等词语会持续刷屏热搜。

5月15日，在火山引擎Forece原动力大会上，字节跳动正式发布自研的豆包大模型。

火山引擎总裁谭待表示，经过一年时间的迭代和市场验证，豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理1200亿Tokens文本，生成3000万张图片。

不仅如此，字节跳动更推出“杀手级”定价：豆包主力模型推理输入定价仅0.0008元/千Tokens，比行业价格便宜99.3%。

在AI竞赛的光谱中，OpenAI是典型的高举高打，占据注意力的中心。而中国大厂普遍信奉“慢就是快、大器慢成”的古典哲学，以及应用创新、产品落地的实用主义。

无法低调的字节跳动，正以自己的节奏冲入AI战局。

01 危机感来自哪里？

“最大的危机感，是担心字节跳动作为一个组织，正在变得平庸，无法取得新的突破。”

1月30日，字节跳动CEO梁汝波在年度全员会上进行了批评。

中国互联网大厂今年集体反思。字节跳动，往往是大厂语境里要防备的对手，一个掌握超级流量、攻入业务腹地的破局者。

而梁汝波认为，字节跳动在AI上更显得“迟钝”：字节跳动对技术的敏感度不如创业公司，直到2023年才开始讨论GPT。业内做得好的大模型创业公司，都是在2018年至2021年创立的。

2018-2021年，中国互联网大厂经历了一波AI人才流失。吴恩达、张潼、贾佳亚、金榕等AI Lab负责人和科学家大量出走，回归学界或是参与创业。

同期，OpenAI已迭代到GPT-3，展示的对话、下棋、文字等能力，在业内掀起讨论。谷歌也发布BERT模型和Transformer架构，为Scaling law奠定基础。

字节跳动内部也训练了一个几十亿参数的模型，国内也有百度ERNIE模型、阿里M6和Plug、华为盘古模型等跟进，但据业内人士复盘，彼时大厂对AI的投入更偏重特定任务，而不是大语言模型，因为看不到商业化前景。

直到2022年11月30日，ChatGPT正式发布。改变历史的一夜后，大模型成了“不能错过的革命”。

OpenAI觉得，成功是意料之外；对其他大厂，不存在侥幸一说。

字节跳动在2023年初开始讨论GPT。但随后一年，字节跳动调集了所有力量追赶，并快速取得战果。

公开资料显示：

2023年2月，字节跳动组建“Seed”团队，从国内外、多部门调集人手攻坚AI，并从新加坡调回TikTok产品技术负责人朱文佳带队。

6月，字节跳动旗下云服务平台火山引擎推出“火山方舟”平台，提供模型训练、推理、精调等服务。如月之暗面、智谱AI、MiniMax等明星公司，早期都在火山引擎训练模型。

8月，国家首批通过备案的AI大模型名单出炉，字节跳动云雀大模型，与百度、商汤、中科院、MiniMax、智谱AI、百川智能、上海人工智能实验室等8家入选，可正式向公众开放服务。

8月，字节跳动内测项目Grace改名“豆包”，作为AI智能助手产品正式上线。

11月，字节跳动组建Flow部门，负责AI大模型应用的研发。字节跳动产品与战略副总裁朱骏、技术副总裁洪定坤，分别担任Flow部门的产品、工程负责人。

2024年2月，字节跳动上线AI智能体应用开发平台“扣子”，对标OpenAI的GPTs，成为豆包后重要的AI阵地。

5月，字节跳动发布自研“豆包大模型”。同时，也意味着火山引擎和微软Azure、阿里云、百度智能云类似，将自研大模型与云服务结合，正式对外提供服务。

02

字节跳动的核心是算法技术，所以他们骨子里自认为是一家AI公司。

在移动互联网时代，字节跳动善于打造爆款应用，被称为“App工厂”。

在字节跳动内部，爆款公式叫作“大力出奇迹”，即：超级流量+超级算法，通过重资本、强运营做热启动，快速获取用户基础。

冲入AI战场后，字节跳动的产品基因依然在发烫，是靠做应用产品在驱动。

一年时间，字节跳动已经推出了AI对话助手“豆包”，AI智能体开发平台“扣子”，互动娱乐应用“猫箱”，AI教育“河马爱学”，AI创作工具“星绘”、“即梦”等11款AI应用产品。

字节跳动推出的AI产品，在市面上基本都能找到对标品，而依靠“大力出奇迹”的方式，字节跳动在用户积累上迅速取得战果。

去年8月上线的豆包，目前月活用户已经超过2600万，豆包App的累计下载量超1亿，支持创建的智能体总量超过800万。

豆包图片

今年2月上线的扣子，被称为“字节跳动的GPTs”。作为AI应用开发平台，起到了连接大模型和用户场景，组成完整生态的关键作用。用户不需编程技巧，就能在扣子平台上快速搭建基于AI模型的各类bot，据传日活用户目前已经超过百万。

扣子图片

一年的狂飙，字节跳动搭建了公司的AI组织队伍，在针对性的业务防御后，通过“大力出奇迹”拿到了初步战果。

应用层多点开花，打造新AI产品工厂，字节跳动在寻找下一个爆款产品，制造AI时代的“抖音”。

此次发布自研“豆包大模型”后，字节跳动也完成了通用大模型和基础设施的关键补位，并将大模型品牌收束到“豆包”名下（原名“云雀大模型”）。

豆包大模型，事实上是一个具备多模态能力的“模型家族”，包括：通用模型pro/lite、角色扮演模型、语音合成模型、语音识别模型、声音复刻模型、Function call模型、文生图模型、向量化模型等9款模型。

不同的模型，针对不同的场景。最受关注的是2个豆包通用模型：

pro版本提供窗口尺寸128k、全系列可精调的满血性能。

lite版本则是快速响应，追求更低延迟和更低单位成本。

过去一年，豆包大模型已经引入了字节跳动内部的抖音、巨量引擎、飞书、大力教育、番茄小说等50多个业务，在营销、电商、办公、创作、编程等多场景进行优化效率和产品体验。

崇尚算法的字节跳动，也在让AI成为业务增长新的“放大器”。

例如，抖音集团前CEO张楠调往剪映之后，也在5月推出了类Sora的视频生成AI“即梦”，为最瞩目的视频领域开辟想象空间。

字节跳动在用自己最熟悉的打法，攻占C端的AI市场。

03

如果大模型是一场马拉松，我们还在起步的100米。

to C的AI应用，制造一个“抖音级”爆款，是马拉松的长远目标；

而字节跳动展露的当下野心，是让加持自研大模型的火山引擎云服务，攻入to B企业服务市场的腹地。

字节跳动对豆包大模型，推出了“杀手级”定价。

以豆包通用模型pro-32k为例，其模型推理输入价仅为0.0008元/千Tokens，远远低于行业价格。市面上同规格模型定价，约0.12元/千Tokens，价格为豆包的150倍。

满血性能的豆包通用模型pro-128k看，价格也是0.005元/千Tokens，而GPT 4-Turbo 128k是0.07元/千Tokens，价格是豆包的14倍。

现场用一张图片，比较了目前大模型的定价，成为大会最高潮出圈的环节。

根据火山引擎计算，1元钱就能买到豆包主力模型的125万Tokens，大约是200万个汉字，相当于3本《三国演义》。

火山引擎总裁谭待表示，降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。

大模型从以分计价到以厘计价，将助力企业以更低成本加速业务创新。

大模型这个赛道，字节跳动不是第一个打价格战降价的，但把战况打到了新的烈度。

百度、阿里、腾讯都已通过云服务对外提供自研大模型，并通过降价、用户免费等方式开展竞争。今年4月，百度宣布文心大模型的推理性能将提升105倍，而成本降到1%；阿里云全线下调产品价格，发布通义千问2.5后，对个人用户开放了免费使用。

价格只是表象，AI大模型赛道想要做大蛋糕，关键还是企业应用场景太少。

大模型的推理成本，随着规模的扩大，之后可能仍会以每年10倍甚至几十倍的速率下降。到了100块钱就能买1亿Tokens的时候，企业有什么想法都可以尝试，不必再受缚于成本预算，这样才有AI应用爆发的可能。

OpenAI的CEO山姆·奥特曼在最近采访中表示，他相信高质量AI智能的成本将变得非常低廉，最终趋近于零。

OpenAI开放GPT-4o后，金沙江创投合伙人朱啸虎进行点评：

1.大模型的技术迭代曲线明显放缓。

2.开始卷免费，说明GPT的用户和收入增长都已经碰到瓶颈，不是深度绑定大厂的模型公司基本已经出局。

3.应用会迅速爆发，推理成本再降一个数量级就会普及出现AI时代的国民应用。

这也代表了国内在大模型领域，普遍信奉的实用主义：大幅度降低大模型的推理成本，让产品落地和企业使用，在实践中推动AI发展。

火山引擎的总结，更直接：先用起来。只有最大的使用量，才能打磨出最好的模型。

国内AIGC用户渗透率目前只有6%。不管发布会上的AI，有多么“像魔术一样”，AI大模型高昂的成本，最终仍要B端企业来买单。

企业是最为严格的“价格敏感”客户，不会付费购买一个精美的玩具或艺术品，而是需要实打实的工具、效率和规模化。

具体到AI大模型，企业的直观痛点：价格太贵、落地太难、效果有限，还存在安全上合规与信任的问题。

谭待表示，今年行业不再比拼参数规模，因为大家都“悟”了：

大模型降价，不能只提供低价的轻量化版本，主力模型和最先进的模型也要够便宜，才能真正满足企业的复杂业务场景需求，充分验证大模型的应用价值，从而催化出超越现有产品和组织模式的创新。

字节宣布降价之后，业内纷纷跟进，又掀起了新一轮热潮。

5月21日，阿里云发布降价公告，对通义千问的9款模型进行大幅降价，其中Qwen-Long降价97%，输入价格0.0005元/千tokens，比豆包通用模型-pro 还要便宜0.3厘，仅比豆包通用模型lite 贵0.2厘；

21日下午，百度智能云公布，将两款轻量化模型ENIRE Speed、ENIRE Lite全面免费，即刻生效。

从全球来看，企业在加码对云服务投入的趋势明显。微软Azure作为OpenAI的独家云服务商，已经吃到了AI需求的红利，过去一年的营收和利润增速极为惊人。

从2021年，火山引擎进军IaaS，代表了字节跳动进军云服务市场，直接与阿里、华为、腾讯竞争的雄心。

在C端的AI应用大力出奇迹后，火山引擎将承载B端的攻坚任务，成为字节跳动的增长引擎。

火山引擎去年6月就发布了大模型服务平台“火山方舟”，此次大会推出了升级版的“火山方舟2.0”，系统性让企业先把大模型用起来。要让企业老板们对AI的热情，像抓抖音流量那样炽烈。

除了价格便宜之外，火山方舟对模型训练、系统稳定、核心插件、安全服务等都做了优化。

在算力层面，字节跳动是目前国内算力储存最为充足的企业之一，火山引擎的海量GPU资源，能够进行潮汐调度，分钟级完成千张GPU扩容的弹性，与秒级响应的精调模型，能有效承载企业的调用需求。

火山方舟此次重点更新了插件生态，为广大企业调用字节跳动在内容、算法、生态上的核心资源。

联网插件，提供头条抖音的搜索能力，能实时联网学习，并通过多模态交互。

内容插件，提供头条抖音的海量内容，支持对视频内容的理解、检索、多模态交互和内容生成。

RAG知识库插件，提供毫秒级百亿规模的高性能检索，秒级流式知识库索引更新，内置豆包向量化模型，提升搜索能力。

针对开发者，火山引擎同步推出了“扣子专业版”，作为企业级的AI引用开发平台，帮助企业打造自己的智能体，并通过飞书、微信等平台发布，或者直接用API搭载到终端硬件设备。

目前，火山引擎已经在智能终端、汽车、金融、消费等行业展开合作，打开了B端市场的突破口。如OPPO、小米、三星、广汽、蒙牛、招商银行等企业，已经与火山引擎进行了人工智能相关的业务合作。

用低价开路，技术、算力和服务跟进，火山引擎在形成自己“大力出奇迹”的策略，并通过更大的B端企业群，更大的使用场景，不断打造更聪明的AI，更高的效率提升。

字节跳动想要“逃逸平庸的重力”。

这家最懂打造爆款产品的公司，想制造AI时代的下一个“抖音”，更想要开动火山引擎，让AI成为水电一样的底座、企业增长的引擎。他们调动组织资源、召回技术大将，在大力出奇迹中赶上竞速的第一梯队，并带头击穿了行业的地板价。

字节跳动，终于又找到一个值得All in、放手去冒险的无边界战场。