关于DeepSeek梁文锋的100个细节

线手老赵 2025-02-19 05:09:35

梁文锋资料图。

关于DeepSeek梁文锋的100个细节

作者:王微微

1、1985年,梁文锋出生在广东湛江的一个普通的农村家庭,父亲是一名小学老师。

2、梁文锋从小成绩优异,小学六年级通过考试被吴川一中录取。

3、在吴川一中一直是学校里的尖子生,初中就喜欢拆装电脑。

4、梁文锋数学方面天赋极大,初中学完高中数学后开始学大学数学到微积分部分。

5、2002年梁文锋17岁。以吴川一中高考状元的成绩考上浙江大学本科电子信息工程专业。

6、2007年,考上浙江大学信息与通信工程专业研究生。

7、梁文锋是家族中第一个进入顶尖高校的孩子。

8、在大学期间,梁文锋与同学一起开始积累市场行情数据和探索全自动量化交易。

9、2008年在浙大读研究生的梁文锋察觉到,用技术和数据或许能在市场中找到突破口。

10、2008年,梁文锋用8万元本金开始了量化交易之路。

11、2009年读研期间便应邀加入以实习生身份加入艾麒,担任新技术部经理,月薪16000元,算高薪特别聘请。

12、2010年6月,25岁的梁文锋从浙江大学信息与通信工程专业硕士毕业,其毕业论文题目为《一种鲁棒的PTZ摄像机目标跟踪算法》。

13、2015年,以每年超过100%的复合收益率迈入了亿元富豪队伍。

14、「幻方」取自于中国古代洛书《九宫图》,是一种特殊的矩阵,是科学的结晶与吉祥的象征。

15、梁文锋的理想是:有朝一日能够与世界级的量化交易泰斗——西蒙斯的文艺复兴公司相媲美。

16、梁文锋曾为西蒙斯的著作中文版写过序,其中有一句:「每当工作中遇到困难,我总会想起西蒙斯的话:『一定有办法为价格建模』。」西蒙斯是一位数学家,也是量化金融领域的先驱,他创立了长岛对冲基金文艺复兴科技公司,并于20世纪80年代开始使用机器学习技术。

17、2023年,梁文锋创立“杭州深度求索人工智能基础技术研究有限公司”,DeepSeek是该公司的深度求索品牌。

18、DeepSeek团队规模不大,不到140人,成员多来自清华、北大、北航等应届博士毕业生、在读生以及硕士生,工作经验不超过5年,大多是数学竞赛一等奖、拿过国际金牌的算法人才。

19、团队没有海归,完全本土人才。成员们普遍具有强大的学术背景和科研能力。

20、梁文锋常常一整天都待在办公室里,半天都不出来一次。

21、梁文锋为人沉着冷静,低调内敛、性格简单直接、不善言辞,内心富有激情。

22、梁文锋的一位商业伙伴向《金融时报》描述他为一个留着可怕发型的书呆子。

23、虽然沉默但在技术交流中梁文锋能够清晰地表达自己的观点,逻辑思维能力非常强大。

24、对产品和技术有极高追求,是典型的技术男风格。

25、曾管理过多位算法工程师,采用扁平化管理方式,给予团队成员充分的自由和信任,带领团队攻克了多项技术难关,发挥每个人的特长。

26、研究怎么把机器学习用在量化交易领域。尝试用各种算法模型来预测股市走势,没日没夜地写代码、调参数,常熬夜到凌晨。

27、难题是数据。四处搜集、托关系从金融机构获取数据后开始建模,不断优化模型参数,提高预测准确率。

28、利用模型预测股指期货的涨跌,进行高频交易,交易很快就获得了丰厚的回报。

29、2025年1月20日,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,梁文锋在会上发言。

30、梁文锋用人标准是热爱和好奇心,而非经验,因为他认为「创新需要摆脱惯性,经验有时会成为包袱。」

31、梁文锋对新人招聘薪资高、愿意给实习生很大机会。

32、创业后梁文锋开放了万卡免费提供给各大学用于科研,为推动学术研究贡献了一份力量。

33、幻方量化向慈善捐款超过2.21亿。其中个人捐款1.38亿元,署名是「一只平凡的小猪」,无人知他是谁,员工猜测是梁。

34、在艾麒信息时,他就利用业余时间默默为量化投资做准备,提前布局。

35、梁文锋实习公司老板给他建议:要做毛利高的业务。

36、2023年5月梁文锋又回到实习公司艾麒信息做调研。

37、DeepSeek自己开发了更高效的算法和万卡架构。减少了对高性能硬件如GPU的依赖,大幅降低硬件成本、充分提高了GPU的利用率。

38、一个注册地是吉隆坡,注册于1993年有效期至2031年的简短域名ai.com,定位至DeepSeek,此前该域名曾长期定位至ChatGPT和马斯克的xAI官网。

39、DeepSeek-R1推理大模型以超低的成本实现了与OpenAI GPT-4相当的性能表现,被业内誉为大模型行业的最大黑马。

40、2025年1月27日,DeepSeek的应用程序成功登顶苹果中国和美国地区免费下载榜。

41、1月27日,DeepSeek美区超越ChatGPT,成为下载量最大的免费应用。

42、2015年30岁的梁文锋与徐进正式创办幻方量化(High-Flyer)。一年内成立了20只产品,迅速成为量化投资领域的佼佼者。

43、随后几年,梁文锋不断扩大AI算法研究团队,将人工智能技术深度融入量化策略。

44、2021年8月,幻方量化的资金管理规模一度突破千亿,与九坤投资、明汯投资、灵均投资一起,被业界称为量化私募领域的“四大天王”。

45、梁文锋在金牛奖颁奖典礼上,指出「量化投资的未来,是用技术让市场更有效率」。

46、梁文锋手握天量私募,亲自写代码。

47、梁文锋一直隐形在幕后很少公开露脸,朋友圈一年几乎只发一条信息。

48、DeepSeek的目标是用低成本、高性能的技术,打破国际巨头在人工智能领域的垄断。

49、2024年5月,DeepSeek发布其首款混合专家语言模型DeepSeek-V2。凭借出色的性能和性价比,引发了一场大模型价格战,国内外科技巨头纷纷跟进降价。

50、出现在2024年12月Deepseek公开了由梁文锋、罗福莉等人撰写的53页论文《DeepSeek-V3 Technical Report》,训练成本仅为557.6万美元(OpenAI的GPT-4o训练成本高达7800万美元)。

51、DeepSeek-V3以1/10的成本实现了对GPT-4o的全面对标,被美国科技圈称为「来自东方的神秘力量」。

52、雷军挖走的90后天才少女罗福莉来自梁文锋的DeepSeek团队。

53、DeepSeek采取了开源的技术策略,主动向全球开发者社区分享核心技术成果。不仅赢得国际认可也推动行业技术生态的快速发展。

54、DeepSeek通过自主研发,放弃了英伟达芯片调度算法,自己开发了更高效的算法和万卡架构,在算法和架构上进行了深度优化,减少了对高性能硬件如GPU的依赖,大幅降低硬件成本、充分提高了GPU的利用率。

55、梁文锋曾表示,「我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。」

56、梁文锋将自己进入人工智能模型领域,描述为一名对探索计算机学习极限充满好奇的工程师的自然发展。

57、开源更多是一种文化,而非商业行为,梁文锋认为为开源做贡献能赢得尊重。

58、梁文锋不太在意穿着和发型,喜欢基于公式和计算做决策。

59、梁日常着装低调,参加调研时捧着保温杯,穿深蓝色的工装绒棉衬衫,身形瘦削,略显拘谨,如同上世纪90年代工程师的模样。

60、买了新房却因醉心于开发策略而无心装修,梁文锋在房间里支帐篷睡觉。

61、同事说梁文锋除了编程,没有其他爱好。

62、梁文锋面对所有专业问题,对细节毫不回避,对监管政策熟稔于心。

63、梁文锋认为自己不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。

64、梁文锋说DeepSeek的考核标准和一般公司不太一样:「我们没有KPI,也没有所谓的任务」。

65、想做不收业绩报酬和管理费的公司。

66、2019年,公司投入近2亿自有资金研发深度学习训练平台「萤火一号」,萤火一号占地面积差不多有一个篮球场大。

67、2021年,「萤火二号」的投入高达10亿,萤火二号预期一个机房面积差不多是10个篮球场。

68、梁文锋说:「无论API,还是AI,都应该是普惠的、人人可以用得起的东西。」

69、2024年12月16日,梁文锋朋友圈转发了他为「量化之王」詹姆斯·西蒙斯传记《征服市场的人:西蒙斯传》所做的序言,并评论:「3年过去了,旧世界分崩离析,新时代正在光速到来。」

70、业内人士乐观估计,梁文锋持有的DeepSeek股份价值将达到1260亿美元,甚至可能超过身价1180亿美元的黄仁勋。

71、2021年,当幻方量化业绩出现回撤时,梁文锋就开始谋划新的布局。他在运营High-Flyer期间开始从Nvidia(英伟达)购买数千块GPU,一张A100显卡的价格就十几万。

72、2023年时国内拥有超过1万枚GPU的企业不超过5家,其中便包括幻方。幻方是大厂外唯一一家储备万张A100芯片的公司。

73、按照彭博亿万富翁指数的中间值进行估算,DeepSeek的估值大约在20亿至300亿美元;而持有公司84%股份的梁文锋,其身家可能处于16.8亿到252亿美元之间,这使他有望跻身亚洲最富有的科技大亨行列,甚至有问鼎中国首富的可能性。

74、梁文锋曾是币安的早期成员。

75、DeepSeekV2的开源模型价格:推理成本被降到每百万token仅1块钱,约等于Llama 3 70B的七分之一,GPT-4 Turbo的七十分之一。

76、2013年梁文锋与同学徐进共同创立了杭州雅克比投资管理有限公司。

77、2015年杭州幻方科技有限公司成立。

78、2016年是幻方科技的重要转折点,当年,公司推出首个基于深度学习交易模型,实现所有量化策略的AI化转型。

79、2018年,幻方科技正式确立了以AI为核心的发展战略。

80、梁文锋做DeepSeek的出发点不是趁机赚一笔,而是「走到技术的前沿,去推动整个生态发展」。

81、2025年1月DeepSeek用户增长达1.25亿,实现了7天完成1亿用户增长。ChatGPT用了2个月。

82、梁文锋于2025年1月28日(除夕)回到米历岭村过年,1月29日(大年初一)上午离开家乡。

83、梁文锋同乡说梁文锋比较内向,过年过节回家一般也不怎么出门,蛇年他的乡亲在村口拉横幅欢迎。

84、梁文锋认为创新就是昂贵且低效的,有时候伴随着浪费。

85、2025年1月28日,据央视新闻,DeepSeek突然遭受大量海外攻击。

86、除了工作,梁文锋还热爱足球。

87、梁文锋坚信「AI一定会改变世界」。

88、《山丘》杂志:「DeepSeek R1 就是 AI 的斯普特尼克时刻」。斯普特尼克是苏联发射的人造卫星,它开启了人类的太空时代。

89、梁文锋认为「一件激动人心的事,不能单纯用钱衡量」。

90、最近的一笔捐款发生在2025年1月10日,西藏日喀则地震后,幻方量化向灾区捐赠100万元救灾款。

91、抢用户并不是我们的主要目的。无论API还是AI,都应该是普惠的、人人可以用得起的东西。

92、OpenAI募集了143亿美元,花十年时间,而DeepSeek仅仅用了一年多时间。

93、一间位于DeepSeek楼上的风投公司称因幻方大模型业务没有拆分独立融资计划,所以无法成为其投资人。

94、技术没有秘密,但重制需要时间和成本。

95、梁文锋不做垂类和应用,而是做研究,做探索。

96、2月11日法国巴黎的人工智能峰会上,梁文锋借助量子全息投影技术进行智能会议演讲,画面清晰细致到毛发根根分明,画面延迟仅有1.2毫秒。

97、一位小红书用户发笔记称其夫在一场婚礼中遇见梁文锋,他还在桌前写代码,饭后搭其顺风车。

98、梁文锋研发团队在海淀区北京融科资讯中心C座5层,华为最近也租下了数千平办公区。物业方在楼下挂出了DeepSeek的铭牌,第二天便摘除了。早期梁文锋团队曾在中关村区域的互联网金融中心WeWork过渡,这里靠近清华北大中国科学院等顶级院校。

99、融科资讯中心的保安高峰期每天要拦阻超过30位企图登门的拜访者。

100、如果用deepseek搜索任何关于梁文锋的内容,得到的答复都是:「这个问题我暂时无法回答,让我们换个话题再聊聊吧。」■

0 阅读:1

线手老赵

简介:感谢大家的关注