媒体报道称小米正斥巨资搭建 GPU 万卡集群,这会不会引领 AI 大模型发展新浪潮?

发布时间:
2024-12-27 22:50
阅读量:
6

雷军万卡集群跟DeepSeek规模差不多,不过,DeepSeek用的似乎是十三幺散件万卡集群。而且军子最近又招募了天才少女罗福莉(DeepSeek)。

雷军这个人,眼光毒辣,又一肚子坏水,小米挖极氪团队,相当于把007据为己有(由于业务关系,我跟极氪的人比较熟,他们的技术和正在研发的车型,我比你们都多知道一点,极氪在烧钱上一点都不含糊。雷军把经验烧满的团队,直接就拉走了。)军子现在又挖DeepSeek的墙角,中国哪两个团队最强,我想大家都知道——D、Q。 雷军不会傻到去挖百度的团队。

大家可以猜猜,小米需要多久复刻DeepSeek V3 / R1。

这几天,小米大模型的新闻很多。

看样子,小米要玩真的了。应该已经看得比较透,想得比较透了。小米一开始,只是做了一个1.3B的多模态小模型。这也符合军子的谨慎规划,大胆前行的性格。

但做大模型是一桩极度烧钱,人才稀缺,又属于反复造轮子,且可能赢家通吃的“烂生意”。

我来猜猜雷军想法:

①手机是AI Agents落地的理想场景,如果一个智能助手可以记住私人语境,能随机应变,可从错误中学习,那么小爱同学就能变成萨曼莎了,从小米13之后,手机已经没有实质的可玩性了(或者更早,我觉得早在骁龙865尾声,imx766 sensor出来后就没可玩性了),未来特色Agents会是一个重要卖点,我记得红魔黑鲨曾经推出过二次元助理,社区就红了一阵子,那家伙可是一点智力都没有的。Agents对手机和汽车都是猛药。(模型最后必定要和手机,汽车的场景进行深度绑定和微调的,而不是挂个API,整个ChatGPT快捷方式,毫无意义。)

②苹果被百度坑了,成了一个行业教训。大模型既然是未来的重点,又能赋能全生态,即使不做云计算,只要你的生态足够大,自家就能消化下来。万一大模型做起来了,云计算也不是不能做,还能多开个副本。

③DeepSeek技术的确好,成本低(Ds V3只用了600万美元,2个月,2000张卡进行训练,推理成本据DS的人说,也非常低),性能好,抓住关键人物,也许小米大模型就能出场即炸场,这是雷军要的效果。军子就是喜欢放二踢脚,不服就干,响就完事了。以后,中国大模型的宣传工作就靠小米了。 如果小米大模型炸场了,对小米的品牌价值提升也很大,小米汽车对小米手机的品牌价值提升有目共睹。

END