听说百度要放弃基础通用大模型的研发了，真的假的？

发布时间：

2024-09-23 02:25

阅读量：

整个国内模型底座第一次泡沫破裂就要来了。

说个理想情况吧：

一，阶跃和智谱作为南北国家队，有政府投入兜底，保留革命火种。

其他五小龙里除了DeepSeek，应该都赶紧放弃通用模型开发。转型专注做APP孵化或者B端客户实施（类似SAP，oracle，用友，金蝶）。拿着现在的算力GPU当做下轮融资入股，是最高收益解，能最大程度保护好已经入场投资人利益。而阶跃和智谱，即使获得其他四小龙算力支持，想要和LLaMA4这种赛亚人降临地球那样压迫感的，肉眼可见的开源怪物，依然压力满满。是有空间商量出一个彼此能接受的报价的。

智谱——OpenAI GPT，阶跃-Anthropic Claude

二，DeepSeek自我输血，做同等参数下最强性能模型架构探索和开源。

DeepSeek-META LLaMA；

三，大厂那边同样不好受，20亿美元现金流有几个能拿得出来。豆包也许还能继续。

其他文心，千问，混元也应该考虑一下是否要转型了。

也不是就说字节就有那个钱和实力，而是现在火山和豆包全都依赖着通用模型了，放弃沉没成本太大。

和很多人想象的完全不一样的是，大厂的的底座能力、架构性能是不如前面提到的值得留下来的三家创业公司中两家的。（无论哪家大厂），譬如豆包大模型前身，Seed下面三个基座，LLM云雀，多模态Bubo，Code&Math的负责人去年年底绩效都不好，其中一位更是被迫出走。

字节豆包——Google Gemini（花了比GPT4两倍多的训练成本，勉强追上了GP4）

四、Apple Intelligence在国内完全没法对标

端侧模型最强的是面壁智能，但面壁智能没有手机业务，推广会有难度。

华为作为手机终端制造商能对标苹果，但华为大模型有关人才本身不多，还出走严重。领军人田奇教授甚至还调换了岗位。

后续面壁智能也许会有投资人牵线下的并购，可能对象包括：同实验室师兄（按导师关系算也许算师叔？）的深言科技，又或者被华为整体收购？

华为和THUNLP在智源时候有过大模型共事先例。

当然这完全是理想主义，实际上有2家愿意快速转型就不错了。

像几个地方政府投资的AI基金，8月META季度会都发布后，居然选择投某家公司几十亿。妥妥堪比成都当年6亿投资锤子。政府投资尽职调查做的是真的没有，大家也习惯了。但那家公司创始人这半年主要在哪里忙活。是在海淀科技园，还是在硅谷科技媛？这些行业里大部分人都知道的八卦，也不打听下么？

亡羊补牢：听说这笔几十亿的融资消息是该公司单向宣布的，至少有一家地方AI基金不满这个抢发公关稿的动作。

上一篇： 24 岁王楚钦考编成功上岸，专项成绩 85.4 分，运动员为什么也要考编上岸？

下一篇：如何评价《一人之下》中的丁嶋安？

END