听说百度要放弃基础通用大模型的研发了,真的假的?

发布时间:
2024-09-23 02:25
阅读量:
8

整个国内模型底座第一次泡沫破裂就要来了。

说个理想情况吧:

一,阶跃和智谱作为南北国家队,有政府投入兜底,保留革命火种。

其他五小龙里除了DeepSeek,应该都赶紧放弃通用模型开发。转型专注做APP孵化或者B端客户实施(类似SAP,oracle,用友,金蝶)。拿着现在的算力GPU当做下轮融资入股,是最高收益解,能最大程度保护好已经入场投资人利益。而阶跃和智谱,即使获得其他四小龙算力支持,想要和LLaMA4这种赛亚人降临地球那样压迫感的,肉眼可见的开源怪物,依然压力满满。是有空间商量出一个彼此能接受的报价的。

智谱——OpenAI GPT,阶跃-Anthropic Claude

二,DeepSeek自我输血,做同等参数下最强性能模型架构探索和开源。

DeepSeek-META LLaMA;

三,大厂那边同样不好受,20亿美元现金流有几个能拿得出来。豆包也许还能继续。

其他文心,千问,混元也应该考虑一下是否要转型了。

也不是就说字节就有那个钱和实力,而是现在火山和豆包全都依赖着通用模型了,放弃沉没成本太大。

和很多人想象的完全不一样的是,大厂的的底座能力、架构性能是不如前面提到的值得留下来的三家创业公司中两家的。(无论哪家大厂),譬如豆包大模型前身,Seed下面三个基座,LLM云雀,多模态Bubo,Code&Math的负责人去年年底绩效都不好,其中一位更是被迫出走。

字节豆包——Google Gemini(花了比GPT4两倍多的训练成本,勉强追上了GP4)

四、Apple Intelligence在国内完全没法对标

端侧模型最强的是面壁智能,但面壁智能没有手机业务,推广会有难度。

华为作为手机终端制造商能对标苹果,但华为大模型有关人才本身不多,还出走严重。领军人田奇教授甚至还调换了岗位。

后续面壁智能也许会有投资人牵线下的并购,可能对象包括:同实验室师兄(按导师关系算也许算师叔?)的深言科技,又或者被华为整体收购?

华为和THUNLP在智源时候有过大模型共事先例。


当然这完全是理想主义,实际上有2家愿意快速转型就不错了。

像几个地方政府投资的AI基金,8月META季度会都发布后,居然选择投某家公司几十亿。妥妥堪比成都当年6亿投资锤子。政府投资尽职调查做的是真的没有,大家也习惯了。但那家公司创始人这半年主要在哪里忙活。是在海淀科技园,还是在硅谷科技媛?这些行业里大部分人都知道的八卦,也不打听下么?

亡羊补牢:听说这笔几十亿的融资消息是该公司单向宣布的,至少有一家地方AI基金不满这个抢发公关稿的动作。

END