DeepSeek啥时候能恢复正常?

发布时间:
2025-02-07 21:17
阅读量:
9

短时间内很难恢复正常了。

DeepSeek 的推理需求不比当初 OpenAI 的 ChatGPT 的推理需求小(APP下载增速太阳系历史上第一,比第二名 ChatGPT 还要快好几倍),而 OpenAI 为了应对这种爆发式的推理需求做了这些事情:

1、限流。ChatGPT 免费版在近半年的时间里速度非常慢,和今天的 DeepSeek 差不多,并且对每个账号的用量有着非常严格的限制。(每天仅允许聊 xx 条)

2、抱大腿,也就是微软 Azure。并且 OpenAI 在推理上会与云服务厂商协同优化。

3、收费。ChatGPT 的 Plus 订阅费用很贵,尤其是对于第三世界国家的用户而言。

4、封号。ChatGPT 至今严格禁止某些人口大国使用,有效降低了流量需求。

5、降智。从各种模型的 Turbo 版本,到给 Plus 用户用的模型货不对板,都在尝试用小模型替代大模型。

那么反观 DeepSeek:

1、限流是平均的,而不是基于账号在给定时间段内请求数目的。

2、国内的云服务商也普遍受到芯片禁运的影响,虽然仍有芯片,但是难以大规模增加。

此外, DeepSeek 很难做到与云服务商协同优化推理,特别是国外的云服务商。DeepSeek 官网能做到这个价格是基于一些极致的推理优化的,而其他厂商(至少在初期)贸然部署上去提供服务,很难做到这个性价比,要么必须亏本要么涨价。例如,Amazon 的云服务价格就比 DeepSeek 官网贵很多,那自然大家还是会去用 DeepSeek 官网的服务或者和官网差不多价格的服务,从而无法减缓服务压力。

对于使用国产芯片的国内云服务厂商来说同样如此。目前据我所知昇腾 MindIE 目前不支持原生 FP8 推理的,要么用 BF16 推理导致算力需求翻倍,要么用量化 INT8 或者 INT4 降低回复质量。

3、收费。目前 DeepSeek APP 没有听说有收费计划。

4、封号。目前 DeepSeek APP 没有听说进行过大规模封号,也没听说不在某些人口大国提供服务。

5、降智。DeepSeek 能火的最主要因素就是其强大的生成质量。如果梁老板仍对向公众提供服务感兴趣,那么它应该不会自己砸掉自己的招牌。

所以最后咋办呢?

1、这两个是开源模型。有 API 调用需求的、中型以上规模的企业或组织,应该考虑自行购买服务器、自行部署。

特别地,有一些大显存的推理卡可能比较适合中小型企业部署这种模型,提供低并发量的服务(特别是对内的服务或批量服务)。例如 Nvidia L20 集群、4090 集群以及 Atlas 300I Duo 集群等。不过需要注意,前两者目前可能不存在开箱即用的高效推理框架(从而部署是个技术活),而第三个目前可能还没有完成适配(从而目前还不能部署)。

2、云计算厂商得以充分优化推理,从而将推理定价降低到和 DeepSeek 官网一样的水平。特别是国外的云服务厂商。

高效训练和推理的 Infra 是 DeepSeek 的核心技术,而且可能和具体的集群配置高度相关,即使开源了也不一定能帮到云计算厂商。

3、DeepSeek 推出付费模式,保障刚需人群的调用需求。

4、学 OpenAI 和 Anthropic,宣布 APP 不在美国和印度提供服务,然后把这两个地方的 IP 都给封了……

5、嗯,我个人还是不希望它降智的。模型的智力水平是第一生产力,降智模型除了浪费时间和算力以外没什么用处。

END