|
今天在网络上刷到一篇题为《圈内人长文解秘,毫不意外的梁文锋》的文章,作者是梁文峰的同行,一位量化模型总设计师,算是同行圈内人。我细读了两遍,感到是目前网上写DeepSeek和梁文峰最深入的文章。因为是同道中人,所以他更懂梁文峰,也理更了解DeepSeek。
他在回答“为什么是一家AI量化公司引爆了AI大模型?为什么创造这个奇迹的不是美国的或中国的其他互联网大厂?”这个问题时,给出的答案是:一是金融量化和AI大模型, 其背后的技术和经验是相通的。而且金融量化模型比社交网络或电商的智能推荐系统、语言大模型和多模态模型、汽车自动驾驶都要难上很多的模型。而梁文锋本人16年来一直冲在量化模型开发的第一线,积累了丰富的痛苦、历练、经验和直觉。二是梁文峰本身“每天看论文,写代码,参与小组讨论”、“兼具强大的infra工程构架能力和模型研究能力、既可从高处做精准判断,又可在细节上强过一线研究员、拥有令人恐怖的学习能力、能调动资源、完全不像一般意义上的老板”。三是梁文峰丰富的阅历、经验和技术能力,使得其能够及时对创新路径做出快速准确的判断,对研究中团队提出的新方法能及时拍板,身先士卒、All In投入、一线作战。事实上,也正是梁文峰身上的这种特质,让他有信心、有能力组织那些高密度人才―――中国顶级名校的硕博生进行了有效创新。四是中国文化、中国文字的独特之处,使得DeepSeek在学习时能用三重解构,在生成中文文本时进行三重重构的智能算法,真正让AI理解了我们意蕴深邃的文字、精妙绝伦的语言,使其输出既具逻辑严密性,又蕴含诗意张力,让AI拥有了东方智慧。 |
|