媒体报道称小米正斥巨资搭建 GPU 万卡集群，这会不会引领 AI 大模型发展新浪潮？

发布时间：

2024-12-27 22:50

阅读量：

雷军万卡集群跟DeepSeek规模差不多，不过，DeepSeek用的似乎是十三幺散件万卡集群。而且军子最近又招募了天才少女罗福莉(DeepSeek)。

雷军这个人，眼光毒辣，又一肚子坏水，小米挖极氪团队，相当于把007据为己有(由于业务关系，我跟极氪的人比较熟，他们的技术和正在研发的车型，我比你们都多知道一点，极氪在烧钱上一点都不含糊。雷军把经验烧满的团队，直接就拉走了。)军子现在又挖DeepSeek的墙角，中国哪两个团队最强，我想大家都知道——D、Q。雷军不会傻到去挖百度的团队。

大家可以猜猜，小米需要多久复刻DeepSeek V3 / R1。

这几天，小米大模型的新闻很多。

看样子，小米要玩真的了。应该已经看得比较透，想得比较透了。小米一开始，只是做了一个1.3B的多模态小模型。这也符合军子的谨慎规划，大胆前行的性格。

但做大模型是一桩极度烧钱，人才稀缺，又属于反复造轮子，且可能赢家通吃的“烂生意”。

我来猜猜雷军想法：

①手机是AI Agents落地的理想场景，如果一个智能助手可以记住私人语境，能随机应变，可从错误中学习，那么小爱同学就能变成萨曼莎了，从小米13之后，手机已经没有实质的可玩性了(或者更早，我觉得早在骁龙865尾声，imx766 sensor出来后就没可玩性了)，未来特色Agents会是一个重要卖点，我记得红魔黑鲨曾经推出过二次元助理，社区就红了一阵子，那家伙可是一点智力都没有的。Agents对手机和汽车都是猛药。(模型最后必定要和手机，汽车的场景进行深度绑定和微调的，而不是挂个API，整个ChatGPT快捷方式，毫无意义。)

②苹果被百度坑了，成了一个行业教训。大模型既然是未来的重点，又能赋能全生态，即使不做云计算，只要你的生态足够大，自家就能消化下来。万一大模型做起来了，云计算也不是不能做，还能多开个副本。

③DeepSeek技术的确好，成本低(Ds V3只用了600万美元，2个月，2000张卡进行训练，推理成本据DS的人说，也非常低)，性能好，抓住关键人物，也许小米大模型就能出场即炸场，这是雷军要的效果。军子就是喜欢放二踢脚，不服就干，响就完事了。以后，中国大模型的宣传工作就靠小米了。如果小米大模型炸场了，对小米的品牌价值提升也很大，小米汽车对小米手机的品牌价值提升有目共睹。

上一篇：如何评价“暗黑系”游戏《流放之路2》？

下一篇：日本面向中国公民新设 10 年旅游签，预计于 2025 年春季开始实施，将对两国旅游经济产生哪些影响？

END