【导读】
在中国科技行业,“弯道超车”曾是许多创业者的口号,但DeepSeek创始人梁文峰却选择了一条更艰难的路——他不想超车,而是想重新定义赛道。
一、幻方量化:在数字丛林中预演技术革命
2008年,当多数人还在用Excel分析股票时,梁文峰创立的幻方量化已开始用机器学习预测市场。这家后来管理超600亿资金的量化巨头,本质上是一场技术思维的预演。“我们在金融战场验证了算法的力量,但也看清了技术依赖的隐患。”梁文峰回忆道。
幻方时期,团队每年投入数亿元自建超算中心,却在2016年遭遇算力瓶颈:全球AI芯片供给被少数巨头垄断,采购周期动辄半年。“就像赛车手被卡在加油站。”这段经历让梁文峰意识到,真正的技术创新必须穿透应用层,直抵基础设施。
二、芯片豪赌:给创新装上“中国引擎”
2019年,当行业还在争论AI泡沫时,梁文峰做出一项震惊业界的决策:斥资20亿囤积英伟达A100芯片,当时达到这个储备量的公司,中国不超过五家。“这不是投机,而是战略储备。”在内部信中他写道,“就像15世纪航海家必须储备帆船,我们要探索技术深水区,就不能被算力卡住喉咙。”
这场豪赌在2022年显现价值。ChatGPT引爆全球算力争夺战时,DeepSeek已建成亚洲最大私有AI算力集群。“当时很多同行被迫暂停训练,而我们能持续迭代模型。”一位早期团队成员透露。这为后续开源战略争取了关键时间窗口。
三、打破创新诅咒:从“闭门造车”到“开门造浪”
手握重兵却选择开源,梁文峰的决策曾让投资人捏把汗。“幻方时期我们靠算法保密赚百亿,但AI革命需要另一种逻辑。”他在技术发布会上说,“闭源就像在游泳池比赛,开源才是驶向星辰大海。”
这种转变源自深刻反思:“过去三十年IT浪潮里,我们习惯躺在摩尔定律的顺风车上搭便车。但Scaling Law(规模定律)不是天上掉下来的,是西方技术社区用三十年试错积累的。”2023年,DeepSeek将多模态训练框架开源后,意外发现德国团队用其优化了工业质检算法。“这才是我们期待的创新生态——就像幻方当年用算法发现市场定价错误,现在我们要用开源纠正技术创新的失衡。”
我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。
我们认为随着经济的发展,中国也要逐步成为贡献者,而不是一直搭便车。
四、护城河新解:人才比代码更“耐撕”
在杭州DeepSeek总部,芯片仓库与开源社区仅一墙之隔。这种空间布局隐喻着梁文峰的创新哲学:“硬件是今天的船票,人才是明天的船坞。”
曾有工程师担心开源会削弱竞争力,梁文峰用幻方的例子回应:“当年我们公开部分因子模型,反而吸引更多数学家加入。真正的护城河不在保险柜里,而在每天走进办公室的人身上。”这种理念正在显效:DeepSeek的开源社区已吸引37个国家开发者,其芯片调度算法被斯坦福团队引用,而公司人才密度较三年前提升300%。
在颠覆性的技术面前,闭源形成的护城河是短暂。即使OpenAI闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how(技术诀窍),形成可以创新的组织和文化,就是我们的护城河。
开源,发论文,其实并没有失去什么。对于技术人员来说,被follow(跟随)是很有成就感的事。其实,开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉,一个公司这么做也会有文化的吸引力。
写在最后:中国创新的“破壁者样本”
从幻方量化到DeepSeek,梁文峰完成了一次惊险的跨学科跳跃。当被问及成功秘诀,他展示了两张图:一张是2018年全球AI芯片供应链地图,另一张是2024年DeepSeek开源生态网络。“真正的创新者既要懂囤积火药,更要敢点燃火种。”
这或许解释了那个看似矛盾的现象:当年囤积万张显卡的“军火商”,如今成了最激进的开源布道者。正如梁文峰在最新技术白皮书中写的:“我们经历过算力饥荒,所以更理解共享的价值;我们曾靠封闭系统成功,因此更确信开放的力量——这不是商业策略,而是对技术文明的基本敬畏。”
在这个算力与算法交织的新大陆,DeepSeek的故事揭示了中国创新的另一种可能:当有人选择用囤积的芯片训练开源的火种,技术的桥梁,终将变成连接世界的桥梁。