向DeepSeek学深度思考:用三步"思维链"打造组织护城河

科技不单仁行 2025-03-27 19:36:47

01

在3月24日晚间,比亚迪交出历史最强成绩单,2024年营收7771亿,同比增长29%;归母净利润402.5亿,同比增长34%。向DeepSeek学深度思考:用三步"思维链"打造组织护城河

营收首次突破千亿美元,超越特斯拉,成为全球第一大新能源车企。

回想前几年,我站在比亚迪展厅的专利墙前,看着1250件专利名牌如同神经网络般密集排布。

这家曾被人嘲笑"土味造车"的企业,在2019年的至暗时刻,利润同比下降40%,扣非净利润仅2.3亿,汽车、光伏、储能等产业均陷入困境,月销量长期徘徊在3-4万辆,被戏称为“比三万”,但现在应该称呼为“迪王”了。

其实在上周发布会之后,我就通过deepseek用巴菲特“护城河理论”梳理了比亚迪和特斯拉,那哪个公司的护城河更深,更有投资价值呢?

deepseek按照我的护城河四个问题的框架回答的非常好,不亚于一个商业分析师。

但是,前提条件是你要理解巴菲特护城河理论。

那么,AI可以模仿人类思考,人类是不是也可以反向学习AI?

就像2016年阿尔法狗在围棋战胜人类之后,人类通过向AI学习,围棋水平提升了一个新的高度。

所以,今天和大家分享,我最近在和AI协作投资、研究的过程中,如何将投资研究的工作效率提升了4倍?如何向DeepSeek学习深度思考?

02

首先,什么是深度思考?

埃隆·马斯克说,深度思考对于解决问题和创造新事物非常重要,你需要深入研究一个问题,理解其本质和根源,然后提出创新的解决方案。

诺奖获得者、行为经济学之父丹尼尔·卡尼曼说:深度思考是一种对信息进行批判性分析的能力,它涉及对信息的综合、评估和推理。

这种思考方式可以帮助我们避免被表象所迷惑,做出更明智的决策。

在AI身上,就是体现在Deepseek让人惊叹的思维链,

它通过分步推理、动态修正、多模态整合模拟人类的思考过程,将复杂问题分解为多个中间步骤,并逐步推导得出结论,从而提升模型在逻辑推理、数学计算、代码生成等任务中的准确性与透明度。

也就是把Open AI等AI大模型的“黑箱决策”转化为可追溯、可验证的逻辑链条,也给了我们向AI学习的机会。

这样的训练和技术分为三个阶段,也可以迁移到企业和投资中。

第一、预训练(Pre-training)

构建知识的“底层操作系统”,也是构建思维链里面的底层逻辑基础。

它的核心逻辑是让AI像人类幼童般“博览群书”。

通过海量文本数据(书籍、网页、代码、对话记录等)来训练模型,使其掌握语言规律和基础知识。

这个过程如同给AI装了一套“底层操作系统”,决定了它的知识广度和基础能力。

预训练阶段特点是无监督学习,无需人工标注,模型通过预测“下一个词”来自我进化。

这个过程中要特别注意,数据库或者叫语料库的偏向性。

我在看到比亚迪的年报之后,让Deepseek帮我统计比亚迪和特斯拉两家公司从2020年到2024年的营收、研发费用/研发费用率、销售费用/销售费用率。

结果,出现了两个问题。

1、没有使用刚刚发布的比亚迪2024年年报的营收数据,只是用比亚迪2024年前三季度的数据来推算,特斯拉也是这样的情况,导致计算结果错误。然后,我就给它投喂了比亚迪和特斯拉最新的年报,数据才会修改。

2、在看到2024年数据错误后,我在想其他数据是不是也会出现错误?

我马上就用专业股票软件数据核对,结果营收数据对了,但是中间的研发费用、销售费用出现了错误。

由于数据更新速度和语料库的原因,会导致大模型出来的结果出现重大失误,行业简称:数据幻觉。

这里我给大家一个警示,再好的大模型,精华进去,精华出来,垃圾进去,就垃圾出来。

这也是为什么这么多中国企业宁肯自己耗资几十万,买英伟达50、90GPU,本地部署deepseek,用自己的公司和行业数据投喂,问答就更有正确性和专业性,同时能够保证数据的隐私安全。

像比亚迪电池实验室就是类似的思维,将2000份专利浓缩成“技术要素矩阵表”,形成研发人员理解和运用的结构化知识体系。

华为海思芯片团队要求工程师阅读全球3000+顶级论文建立知识图谱,美的集团在工业互联网平台预训练阶段,就投喂了亚马逊、西门子等50家企业数字化转型案例,构建出制造业知识库。

03

二、监督微调(SFT, Supervised Fine-tuning)

打造专业领域的“行为规范”,定向训练思维链生成规则。

核心逻辑:像培训新员工一样“手把手教学”,用高质量经过标注的数据(问答对、操作指南等)调整模型行为,使其输出符合人类需求。

这个过程如同给AI编写“岗位说明书”,规范专业技能。

像宁德时代质检系统用5万张电池缺陷图片做SFT(监督微调)训练,将误检率从12%降至0.7%。

大疆农业无人机监督学习3000种农田作业轨迹,实现果树环绕喷洒等高难度动作。

三、强化学习(RL, Reinforcement Learning)

在实战中修炼“顶级高手”,精细化调整思维链质量。

就像奥运会选手模拟的“以赛代练”,通过实时反馈机制(用户点击、评分、对比选择等),让AI自主优化决策路径。

这个过程如同给AI安装“进化引擎”,使它在复杂环境中持续突破极限。

强化学习阶段的精髓,就是设计奖励机制,定义清晰的评估标准,如:对话质量评分,类似我们给团队发奖励和奖状一样。

更高级的是采用多维度博弈:让多个AI智能体相互竞争、协作,像Alpha Go 1.0是投喂了人类历史的百万围棋棋谱,到了Alpha Go 2.0阶段,就是自我对弈模式,不需要棋谱。

04

那我们如何才能想要像AI一样深度思考和学习,记住三个要点。

第一,建立“行动-反馈-调整”的正循环,就像打游戏升级一样,每完成学习任务立刻检验效果,用他人评价修正自我认知;第二,深度拆解顶尖案例,看书的时候,边读边画知识图谱,把复杂信息提炼成可复用的思维模型。这也是我2024年做的最多的研究,将过去腾讯、美的、华为、小米等公司做了深度分析,梳理成成长模型,同时把过去二十年,五波牛市进行了深度复盘。

第三,用头脑风暴对抗思维惯性。遇到问题同时想出3种解决方案,就像下棋推演一样比较优劣,日常可以安排15%的陌生领域挑战,睡前花10分钟回顾当天所学,这样大脑会像AI训练神经网络一样,在不知不觉中提升举一反三的能力。

深度思考不是天才专利,而是可复制的系统方法。

当我们拆解AI和中国企业的进化密码,就会发现"预训练-监督学习-强化学习"的思维链三阶进化,正在塑造中国制造的思维基因。

假如每个岗位都能像AI模型那样持续学习、规范输出、快速进化,组织的思维链就会成为企业坚固的护城河。

毕竟,连机器都知道深耕胜过乱撞,人类又怎么总做思维上的"机会主义者"?

责任编辑 | 罗英凡

图片均来源于网络

本文不构成任何投资建议,股市有风险,投资需谨慎

■ 免责声明

本文涉及有关上市公司的内容,为作者依据上市公司根据其法定义务公开披露的信息(包括但不限于临时公告、定期报告和官方互动平台等)作出的个人分析与判断;文中的信息或意见不构成任何投资或其他商业建议,市值观察不对因采纳本文而产生的任何行动承担任何责任。

0 阅读:1

科技不单仁行

简介:感谢大家的关注