DeepSeek创始人梁文锋是个什么样的人?
回答都很碎片化,我仔细搜集了一些资料,来试着整理一下。
1、出生背景和早期经历
梁文峰1985年出生于湛江市吴川市覃巴镇米历岭村,家境确实很普通,父母都是小学语文老师,基本没啥背景,梁文峰主要靠读书读出来的。
梁文峰小学时就读于家乡附近的吴川梅岭小学,初中和高中都在吴川一中。他在数学上有些天赋,初中的时候就自己学完了高中数学,还开始看大学的数学课本。2002年高考,梁文峰考了806分,是吴川一中的第一名,在湛江市排在14名,在当年广东省约100名左右。
第一志愿报了浙江大学的电子信息工程专业,2006年本科毕业。毕业次年2007年考上本校通信工程研究生,2010年硕士毕业(如果本硕连续应该是2009年毕业,是因为考了两年,还是什么目前不得而知)。
2、梁文峰的炒股人生
上面提到,梁文峰在数学上有些天赋,本科专业又是电子工程,这两个东西一结合,发现最好的应用场景,那肯定是股市的交易。所以上大学期间,他对金融交易产生了浓厚的兴趣。2008年,梁文峰23岁,应该是硕士二年级,开始以8万块本金在A股市场上尝试自动化交易炒股。
2010年他毕业那一年,股市行情很低糜,但据说梁文峰通过部分自动化交易策略,赚到了100万,在学校名声大噪,被称为校园股神。
毕业后,梁文峰没有就业,也没有创业。就一直以散户状态,在大A里面折腾,不断尝试用量化、自动的方式编写策略,去市场实践,看能不能有收益。据说他曾经离开杭州,在成都租了个房租,就这样关着门炒了三年股。
如果这把炒股没有成功,梁文峰将会是一个被很多人喷的典型反面教材。你看他名校出身,却不务正业,炒股更是容易被批评为染上了赌瘾。
一直到2013年,应该是从股市里赚到了不少钱,他才开始结束无业游民的散户状态,开始将自己机构化。
这年他和同学徐进一起成立了杭州雅克比投资管理有限公司。一般来讲,这种资管公司是发私募产品,备案,然后去拉钱来投资。不过我猜测大概率在雅克比阶段,梁文峰和徐进,和之前的散户状态差不多,并没有能够去发产品的资质和募资能力,和以前的区别只是有了一个公司身份,主要的工作内容还是在不断研究、打磨、验证和完善他们的量化交易策略。
搞了两年,杭州雅克比这个公司可能出了些问题,或者是要去做阳光私募,公司不符合一些要求被放弃了。2015年,他和徐进一起重新成立了家新公司幻方科技,开始奔私。
2015年幻方在清华大学水木社区招聘的说明上写到梁文峰个人从2008年的8万本金,用7年赚到了1亿的收益,这个不知道真假。如果是真的,那就是7年1250倍,基本和北京炒家并列,是A股赚钱最快的散户了,应该也是国内股市的收益率冠军。如果是雅克比阶段还是募集到了很多外部资金,通过盈利分成累积的1亿,那就属于加了很大的外部杠杆。
2015-2017年,应该是梁文峰炒股最为关键的一个阶段,在这个阶段内,早期积累的所有量化交易探索终于开花结果,并成功进行了私募机构转型,资产管理也上了一定的规模。
2016年,幻方上线了首个完整的AI策略,2017年将投资策略全面AI化。应该是他们高频交易的AI策略非常符合A股市场的特点,业绩表现非常好,2017年幻方量化管理资产规模突破了30亿,2018年拿到了私募金牛奖。
然后就一发不可收拾了,2019年他们管理的资金突破100亿了,2021年突破了1000亿。但到2021年底,可能是规模太大了的原因,幻方量化旗下100余款产品业绩下跌逾10%,造成投资者资产损失,随后幻方量化逐渐降低其资金管理规模。
到2024年底,幻方量化管理规模450亿,旗下有63只基金产品,不过业绩分化较为明显,29只股票量化多头产品基本保持小幅盈利,而36只量化对冲型产品全部亏损。当然这和2024年的行情和政策也有关系,2024年,证监会官方对量化进行了不小的限制,可能造成他们这种高频产品无法正常发挥了。
所以,这里还要劝一下我大A股民,一定要多努力,每天要勤奋地研判市场,分析公司,聚焦操作。只有这样,才能更好地在大A和梁文峰同台竞技,并且打败他。
3、梁文峰AI的狂飙突进
2016年10月21日,幻方第一个由深度学习算法模型生成的股票仓位上线实盘交易,就开始使用GPU进行计算,在此之前算法主要依靠线性模型和传统机器学习算法,模型计算主要依赖于CPU。
自此后就开始了他在AI上的狂飙突进之路。2019年,梁文峰开始大规模采购GPU,自研幻方「萤火一号」AI集群,搭载了500块显卡,使用200Gbps高速网络互联。2020年,「萤火一号」总投资近二亿元,搭载1100加速卡,于当年正式投用,为幻方的AI研究提供算力支持。2021年,应该是真的挣到钱了,幻方投入十亿建设「萤火二号」,搭载约1万张英伟达A100显卡,突破了一期的物理限制,算力扩容翻倍。
幻方的硬件和资金量扩容后,量化交易应该是碰到了一些困难,一则是体量太大后,赚钱没那么容易了,二则是2023-2024年大A行情出现了缅北走势,股民怨言如潮,监管层也开始对量化开始进行监管。幻方从2021年开始缩减资金管理规模,几乎砍了一半。那这些为了量化交易准备的硬件,算力也都闲置下来了,得为他们找个新方向。
2023年,梁文峰捕捉到通用人工智能领域的前景,便于7月正式创办杭州深度求索人工智能基础技术研究有限公司(DeepSeek),专注于AI大模型的研究与开发。不到一年时间,2024年5月,DeepSeek发布混合专家语言模型DeepSeek - V2,12月26日,上线并开源DeepSeek - V3模型,就是我们大多数人在春节期间用的这个版本。整个训练过程仅用不到280万个GPU小时,成本约4000万元人民币。
2025年1月20日晚,发布DeepSeek - R1,在数学、代码、自然语言推理等任务上性能与OpenAI o1正式版不相上下,且同步开源模型权重和训练技术,在全世界掀起滔天巨浪。
DeepSeek直接让美国垄断AI前沿技术和算力资源的图谋彻底破了产,因为它既免费,还开源。反正我随手做的,谁想用都拿去用吧,我也不靠这个挣钱,就为一个探索和乐趣。
OpenAI:我头麻了,我这150刀/月,1800刀/一年,你直接免费,我可咋个办。你也不收费,你图个啥?
梁文峰:我挣不挣钱无所谓,你不能挣钱,对我很重要!