DeepSeek在模型开发过程中并没有绕开英伟达的CUDA框架,只是采用更低层次的编程语言

北山读书 2025-03-10 09:03:02

Deepseek又一次让我有了顿悟。

我在看关于Deepseek的相关报道,看到这样一段描述:“DeepSeek在模型开发过程中并没有绕开英伟达的CUDA框架,只是采用更低层次的编程语言,对底层硬件实现更精细的控制。”我问Deepseek,这段话是什么意思?它给我做了一个比喻:

想象CUDA框架就像汽车的自动挡模式——它帮你自动处理换挡、离合等复杂操作,让驾驶变得简单但不够灵活。而DeepSeek选择的是手动挡模式:虽然同样使用汽车(CUDA框架),但通过自己控制换挡时机和油门深度(低层编程),实现了更精准的操控和更极致的性能。

我的理解是:因为用了更底层的方法,实现了更精准的控制,所以大幅了提高效率。这让我想到了学习这件事。我常说:现在的大班教学、集中授课的方式,太落后了,是不得已的办法。所以其实无论是上课,还是作业,甚至考试,很多教学行为都是很低效的。无法做到因人而异、因材施教,所以必然有很多动作都是冗余的。现在我更加能够理解,为什么学霸都在超前学?不是因为超前学能够提高考试分数,而是学校进度太慢了,不适合一些学生的求学需求。反过来说,为什么教学进度太快不是好事。因为如果大多数学生都没听懂,都是囫囵吞枣的过去了,就需要更多的时间返工、刷题、改错。

只有找到适合自己的学习节奏,才能让自己每一次努力都有收获。太快不行,太慢也不好,都是效率低、效果差。要想大幅提高学习效率,就不能只在一些动作表面做文章。比如,不能只盯住预习、复习、写作业、记笔记等上面,也不能纠结于买什么课?买什么资料?买什么练习题?你应该关注更多的底层能力,这些能力有可能大幅提高学习效率。比如,自学的能力,自学的方法。我为什么特别强调《学习高手100讲》和《最简版英语语法》课程要优先学习,因为这些是学习的方法,是学习的工具。工欲善其事,必先利其器。你只有掌握了更好的学习方法,才能大幅提高学习效率。再比如,成长型心态,又是所有方法的底层基石。

刻意练习、重做错题、提取练习、费曼学习法等,都是非常好的学习方法。但是,如果你没有成长型心态,怕输、怕错、怕难、怕繁,你任何一个方法都不可能学会,也根本用不好。我的《学习高手100讲》,第1讲是整体介绍,第2讲是《学习的本质》,第3讲是《成长型心态》,第4讲是《亲子关系》……这些都是学习的基石,但绝大多数家长和学生都会忽略。

越是触及本质的思考,越有力量,越能够影响和改变你的行为,进而大幅改变学习效果。打个比方:知道等差数列公式的学生,可以口算出1+2+3……+100的结果,而不知道的学生只会一个一个算,又费时又容易错。所以,在学校到底学什么?不是囤积知识,不是往你的记忆内存中复制文件,而是学习“学习的方法”,升级你的操作系统。当你拥有了更高维度的认知,更深的洞见,更广的视野,你以后再面对新问题新情况的时候,也能快速学习,自己找到解决办法。高维认知,底层能力,这才是受益终身的财富和本领。洞悉本质的人,和浅尝辄止的人,注定有不同的命运。

0 阅读:0