向DeepSeek学深度思考：用三步"思维链"打造组织护城河

在3月24日晚间，比亚迪交出历史最强成绩单，2024年营收7771亿，同比增长29%；归母净利润402.5亿，同比增长34%。向DeepSeek学深度思考：用三步"思维链"打造组织护城河

营收首次突破千亿美元，超越特斯拉，成为全球第一大新能源车企。

回想前几年，我站在比亚迪展厅的专利墙前，看着1250件专利名牌如同神经网络般密集排布。

这家曾被人嘲笑"土味造车"的企业，在2019年的至暗时刻，利润同比下降40%，扣非净利润仅2.3亿，汽车、光伏、储能等产业均陷入困境，月销量长期徘徊在3-4万辆，被戏称为“比三万”，但现在应该称呼为“迪王”了。

其实在上周发布会之后，我就通过deepseek用巴菲特“护城河理论”梳理了比亚迪和特斯拉，那哪个公司的护城河更深，更有投资价值呢？

deepseek按照我的护城河四个问题的框架回答的非常好，不亚于一个商业分析师。

但是，前提条件是你要理解巴菲特护城河理论。

那么，AI可以模仿人类思考，人类是不是也可以反向学习AI？

就像2016年阿尔法狗在围棋战胜人类之后，人类通过向AI学习，围棋水平提升了一个新的高度。

所以，今天和大家分享，我最近在和AI协作投资、研究的过程中，如何将投资研究的工作效率提升了4倍？如何向DeepSeek学习深度思考？

首先，什么是深度思考？

埃隆·马斯克说，深度思考对于解决问题和创造新事物非常重要，你需要深入研究一个问题，理解其本质和根源，然后提出创新的解决方案。

诺奖获得者、行为经济学之父丹尼尔·卡尼曼说：深度思考是一种对信息进行批判性分析的能力，它涉及对信息的综合、评估和推理。

这种思考方式可以帮助我们避免被表象所迷惑，做出更明智的决策。

在AI身上，就是体现在Deepseek让人惊叹的思维链，

它通过分步推理、动态修正、多模态整合模拟人类的思考过程，将复杂问题分解为多个中间步骤，并逐步推导得出结论，从而提升模型在逻辑推理、数学计算、代码生成等任务中的准确性与透明度。

也就是把Open AI等AI大模型的“黑箱决策”转化为可追溯、可验证的逻辑链条，也给了我们向AI学习的机会。

这样的训练和技术分为三个阶段，也可以迁移到企业和投资中。

第一、预训练（Pre-training）

构建知识的“底层操作系统”，也是构建思维链里面的底层逻辑基础。

它的核心逻辑是让AI像人类幼童般“博览群书”。

通过海量文本数据（书籍、网页、代码、对话记录等）来训练模型，使其掌握语言规律和基础知识。

这个过程如同给AI装了一套“底层操作系统”，决定了它的知识广度和基础能力。

预训练阶段特点是无监督学习，无需人工标注，模型通过预测“下一个词”来自我进化。

这个过程中要特别注意，数据库或者叫语料库的偏向性。

我在看到比亚迪的年报之后，让Deepseek帮我统计比亚迪和特斯拉两家公司从2020年到2024年的营收、研发费用/研发费用率、销售费用/销售费用率。

结果，出现了两个问题。

1、没有使用刚刚发布的比亚迪2024年年报的营收数据，只是用比亚迪2024年前三季度的数据来推算，特斯拉也是这样的情况，导致计算结果错误。然后，我就给它投喂了比亚迪和特斯拉最新的年报，数据才会修改。

2、在看到2024年数据错误后，我在想其他数据是不是也会出现错误？

我马上就用专业股票软件数据核对，结果营收数据对了，但是中间的研发费用、销售费用出现了错误。

由于数据更新速度和语料库的原因，会导致大模型出来的结果出现重大失误，行业简称：数据幻觉。

这里我给大家一个警示，再好的大模型，精华进去，精华出来，垃圾进去，就垃圾出来。

这也是为什么这么多中国企业宁肯自己耗资几十万，买英伟达50、90GPU，本地部署deepseek，用自己的公司和行业数据投喂，问答就更有正确性和专业性，同时能够保证数据的隐私安全。

像比亚迪电池实验室就是类似的思维，将2000份专利浓缩成“技术要素矩阵表”，形成研发人员理解和运用的结构化知识体系。

华为海思芯片团队要求工程师阅读全球3000+顶级论文建立知识图谱，美的集团在工业互联网平台预训练阶段，就投喂了亚马逊、西门子等50家企业数字化转型案例，构建出制造业知识库。

二、监督微调（SFT, Supervised Fine-tuning）

打造专业领域的“行为规范”，定向训练思维链生成规则。

核心逻辑：像培训新员工一样“手把手教学”，用高质量经过标注的数据（问答对、操作指南等）调整模型行为，使其输出符合人类需求。

这个过程如同给AI编写“岗位说明书”，规范专业技能。

像宁德时代质检系统用5万张电池缺陷图片做SFT（监督微调）训练，将误检率从12%降至0.7%。

大疆农业无人机监督学习3000种农田作业轨迹，实现果树环绕喷洒等高难度动作。

三、强化学习（RL, Reinforcement Learning）

在实战中修炼“顶级高手”，精细化调整思维链质量。

就像奥运会选手模拟的“以赛代练”，通过实时反馈机制（用户点击、评分、对比选择等），让AI自主优化决策路径。

这个过程如同给AI安装“进化引擎”，使它在复杂环境中持续突破极限。

强化学习阶段的精髓，就是设计奖励机制，定义清晰的评估标准，如：对话质量评分，类似我们给团队发奖励和奖状一样。

更高级的是采用多维度博弈：让多个AI智能体相互竞争、协作，像Alpha Go 1.0是投喂了人类历史的百万围棋棋谱，到了Alpha Go 2.0阶段，就是自我对弈模式，不需要棋谱。

那我们如何才能想要像AI一样深度思考和学习，记住三个要点。

第一，建立“行动-反馈-调整”的正循环，就像打游戏升级一样，每完成学习任务立刻检验效果，用他人评价修正自我认知；第二，深度拆解顶尖案例，看书的时候，边读边画知识图谱，把复杂信息提炼成可复用的思维模型。这也是我2024年做的最多的研究，将过去腾讯、美的、华为、小米等公司做了深度分析，梳理成成长模型，同时把过去二十年，五波牛市进行了深度复盘。

第三，用头脑风暴对抗思维惯性。遇到问题同时想出3种解决方案，就像下棋推演一样比较优劣，日常可以安排15%的陌生领域挑战，睡前花10分钟回顾当天所学，这样大脑会像AI训练神经网络一样，在不知不觉中提升举一反三的能力。

深度思考不是天才专利，而是可复制的系统方法。

当我们拆解AI和中国企业的进化密码，就会发现"预训练-监督学习-强化学习"的思维链三阶进化，正在塑造中国制造的思维基因。

假如每个岗位都能像AI模型那样持续学习、规范输出、快速进化，组织的思维链就会成为企业坚固的护城河。

毕竟，连机器都知道深耕胜过乱撞，人类又怎么总做思维上的"机会主义者"？

—

责任编辑 | 罗英凡

图片均来源于网络

本文不构成任何投资建议，股市有风险，投资需谨慎

■ 免责声明

本文涉及有关上市公司的内容，为作者依据上市公司根据其法定义务公开披露的信息（包括但不限于临时公告、定期报告和官方互动平台等）作出的个人分析与判断；文中的信息或意见不构成任何投资或其他商业建议，市值观察不对因采纳本文而产生的任何行动承担任何责任。

玩酷网

向DeepSeek学深度思考：用三步"思维链"打造组织护城河

科技不单仁行