熵简科技费斌杰:DeepSeek-R1的突破正推动AI实现辅助投资决策

早知懂解析 2025-02-20 17:25:25

AI辅助投研在向AI辅助投资决策演进。

本文为IPO早知道原创

作者|罗宾

在金融领域,DeepSeek已经在加速AI新投资范式产生。近日,IPO早知道对话了智能投研服务商「熵简科技」创始人、CEO费斌杰,他分析了DeepSeek如何驱动投研AI应用带来效率突破,提升投资的超额收益。

今年春节期间,熵简科技基于DeepSeek-R1模型对FinGPT进行了定向蒸馏训练,以有限的算力支持大量用户访问。公司推出了国内首个具备深度推理能力的金融大模型FinGPT Deep,并搭载于熵简科技的智能投研平台AlphaEngine。

FinGPT升级后,AlphaEngine实现了1)多步推理问答;2)精准资料溯源及3)融合分析师思维,展示完整投研分析过程的功能,让投资线索主动浮现。作为金融专业人士的AI搜索引擎,AlphaEngine已有超40000名机构投资者用户。

在DeepSeek于今年1月发布的论文《DeepSeek-R1:通过强化学习提升大型语言模型的推理能力》中的关键结论让熵简团队清晰认识到,现在训练行业模型的最佳方式是以开源的基座模型去蒸馏行业小模型。蒸馏过程中的行业特定训练集由机器学习的规则化模型训练生成,取代对人工标注的依赖。

费斌杰表示:“这是DeepSeek-R1给第三方AI厂商带来的重要机会。我们有丰富的技术能力,但之前受限于没有庞大的投研团队贡献大规模的专业知识数据集,现在这个痛点可以靠涌现的方式来攻克,距离这个行业产生智能化突破就不远了。”

他认为,投研场景中,强化学习可用于解决具有明确反馈的问题:推荐股票等任务的反馈(如股票涨跌)是确定的,这种任务确定性使得强化学习更加高效,因为金融类模型不需要通过对话得出反馈。第二,进一步看,投研模型训练中,可以选定有明确反馈的问题作为评判模型,这样通过规则化评价模型来优化投研模型表现,可大幅降低模型训练成本、加速模型收敛。

另外,随着部署模型趋于一种平价的服务,费斌杰表示,第三方AI服务商更应该将自己擅长的领域做精做细。“DeepSeek等模型开源使很多企业可能将重新考虑是否继续投入更多资源进行模型的部署。因此对第三方AI厂商来说,未来部署模型可能不再是一个好的选择,而要找到与企业之间新的合作模式,例如企业方可以自主部署模型,我们则通过标准化的接口去服务企业内部的场景。”

以下是对话内容(有删节):

费斌杰(来源:受访人提供)

IPO早知道:公司成立至今业务上有哪些主要变化?部署了DeepSeek后有哪些计划?

费斌杰:1)大模型出来之前的4-5年,我们主要帮助国内券商、公募基金等大型资管机构建立了投研数据中心,标准化地积累了私域的行业数据。

2)第一个转折点是大模型出来后,我们发现AI在技术上的质变,把我们之前的工作积累转化为标准化产品,推出了旗舰产品AlphaEngine。用户可以在我们的专家数据库中做搜索。由于它提供的全新的AI辅助投研的体验,产品推出后一年时间,用户从零增长至40000多,服务了超5000家国内资管机构。

3)DeepSeek-R1的出现对行业和我们来说都是新的转折点。此前的产品定位是AI辅助投研,现在我们的产品正在往AI辅助投资决策方向演进。我们从去年开始就根据大量客户调研理出了大概三四十个辅助投研的功能清单,上一版模型只能实现其中的20%不到,现在,这一比例有望提升到40-50%,有效边界又前进了一步。

IPO早知道:在进一步分析这种转折点之前,现在哪些数据的价值没被充分挖掘?

费斌杰:数据在很多层面都远远未被挖掘出来。很明显的一点是研究报告中的信息含量在大幅衰减,而各种会议的信息密度越来越高,每天有大量公开会议和一到几人的小型会议,它们的时效性强,把这些会议资料都进行文本化分析,一定有高价值。

也正是因为我们的平台接入的是这类行业私域的资料库,所以我们在以DeepSeek-R1模型进行蒸馏后,AlphaEngine的用户体验有一种质变。

IPO早知道:对视频尤其是外文视频信息的准确提取会有难度吗?

费斌杰:这是可以实现的。视频资料对AI的传导路径有两种,一种是把视频资料直接交给多模态模型去分析,但这样成本过高,结果也不一定准。另一种普遍采取的方法是将视频里的音轨提取出来,翻译成文字再做文本分析,由于删除了图像内容,语音转文字的准确度要求更高。

所以为了让模型最终的回答效果更好,我们不仅要有一个强大的基座模型,还要有优质的多模态数据转化模型。我们现在也在做这件事情,针对会议视频做了FinAudio的模型,可以将投研类会议的音频数据准确地翻译成文本,其中涉及的专有名词由一些人员去标注数据。在训练完这个模型后,很多金融机构都成功部署了,这也是市场的一种刚需。

AI模型自主涌现推理过程

DeepSeek-R1突破智能投研痛点

IPO早知道:AI模型如何在投研中支持或提示做决策、局限性是什么?DeepSeek对此带来的具体突破是什么?

费斌杰:这个问题很深,但根据DeepSeek-R1论文里的做法,这个问题有明确结论:现在我们要训练行业模型,最佳方式是以开源的基座模型去蒸馏行业小模型。蒸馏的过程中我们应该准备一些行业内的特定领域训练集,这些训练集不需要靠人工数据标注产生,而更多是由机器学习的规则化模型来生成。

几年前要以AI方法支持投研,机构得让分析师、基金经理帮AI厂商标注很多数据,让机器按照专业人员的知识图谱、分析框架进行有监督的学习,这样效率很低。投研专业人员又是人数很少的群体,最终产生的训练集规模远远不够,更别说去满足600B参数级别大模型的需求。

DeepSeek-R1论文中提到的中间模型DeepSeek-R1-Zero就已经验证了一个关键结论:不用标注数据、不用做SFT(监督微调),只需要纯强化学习,就能让大模型涌现出一些推理过程。这就意味着,在我们行业,只要准备足够多的有明确结论的数据集,就可以以规则化的方式来产生强化学习的训练集。

比如我让大模型推荐下周最有可能跑赢大盘的10只个股,这就可以作为一个有明确结论的问题。大模型通过各种方式去推理,可以用财务数据、市场情绪、龙虎榜、专家分析等等方法,最终它给出的10只股票我们可以用一套规则化的系统检验它们是不是跑赢了。现在,这样的训练集能批量产生,几乎是无穷无尽的。

大模型利用这些训练集,会自己涌现出推理过程,通过强化学习来想明白一家公司是否值得投资,是要价值投资,还是通过分析量价来投资。

我认为这是DeepSeek-R1给我们第三方AI厂商带来的一个很重要的机会。我们有丰富的技术能力,但之前会受限于没有庞大的投研团队贡献知识数据,现在这个痛点可以靠涌现的方式来攻克了,距离这个行业产生智能化的突破就不远了。

IPO早知道:基于这种推理能力的提升,AlphaEngine产品还有哪些需求可以被实现?

费斌杰:有很多了,首先一个例子就是我们最近在攻克的一个需求:让AI来挖掘投资线索,目前来看实现起来没有太大问题。

投资者的挖掘能力是资管行业最核心的能力,但这个事的难度是比大家想象的要高很多,因为它也分你要寻求的是短期、中期还是长期机会,越长期肯定越难,它里面思考的深度越深。

目前R1的推理能力比较适合挖一些短中期机会,所以我们准备把这种挖掘投资线索的能力作为一项标准服务提供给机构投资者用户,为之提供有效的辅助。

另一个例子,投研本质上就是在不确定的信息中去挖掘出正确的非共识,所以怎么让大模型判断某个信息是“非共识”还是“共识”就很重要。

具体来看,比如有一些投资经理就希望让AlphaEngine写一个投资日报,排除所有的市场一致预期。用户就想看过去一天市场发生了哪些变化,其中哪些信息是与市场预期相背离的,把这些信息总结到100字左右的短文就够了。这时候我们就可以基于大模型用技术的手段去解决。

IPO早知道:基金经理经验的价值更凸显在哪些投资风格中?

费斌杰:就像刚才提到的,优秀的基金经理对中长期机会的把握目前是超过AI的,他们知道怎么从海量的信息中找到最关键的判断标准并坚持,至少现在AI的推理能力达不到这个层次。三个月以上都算偏长期的投资维度了。

价值投资做到极致,或高频量化做到极致,都很难被AI取代。我们的模型更适用于寻找非长期机会的中低频策略。而且在风格漂移的阶段,AI可能会做得更好,会更灵活地切换风格。

AI多快成为新的alpha来源

取决于算法创新

IPO早知道:投资者对数据的利用效率不断提高,某种策略alpha衰减也在加快,投研服务如何帮他们找出适合不同阶段的投资策略?

费斌杰:我也被很多朋友问到这个问题。我还没完全想好,但整体感受是AI一定会成为一个全新的alpha来源,这也是未来两三年会出现的一波全新的机会。对投资机构和投研服务方来说,就看谁能把握得更快了。必须将AI的能力内化。

AI行业应用的扩散将遵循典型的“创新扩散曲线”:早期采用者获得超额收益,中期跟随者形成竞争均衡,最终演化为行业基础设施。

内化的意思不是说部署一个本地模型,也不是接一个API,而是真的能够在算法上创新,首先就要把DeepSeek-R1的论文吃透,此篇论文中把PPO算法优化成GRPO算法,就是一个很大的改进。国内有这样的懂算法的人才,但金融机构能不能物色到这样的人才,并将算法和场景做结合,这是能否抢占先机的关键。

IPO早知道:他们一般来自于哪里?画像是什么?

费斌杰:自己彻头彻尾的操盘过大模型的训练的人会更合适,不应该是纯做应用或纯做Agent layer的一类。至少得做过MoE模型的训练,熟悉架构,知道怎么做pipeline、怎么做分布式训练。当然,像DeepSeek那样招到一些清北的数学天才,从理论层面做算法创新,确实是更宝贵的。

IPO早知道:熵简也在服务一些海外对冲基金,他们的需求与国内有什么差异?

费斌杰:我们拓展海外客户最大的契机是前几年全球对中国资本市场的关注太少,我们希望借此机会让外资更多地理解和关注中国的资本市场,这是一个挺大的机遇。同时,中国的AI应用能力有显著的溢出效应,在国际上我们的产品力并不逊于海外的同类公司,中国不缺AI人才。

海外机构更多关注的是大类资产配置。因为中国是他们配置的一个选项,他们提出的问题普遍会偏宏观一些,不会一开始就关注很多个股,而是从政策等角度进行分析。

第二,从我的感受来看,国外的AI应用虽然在资本市场比较火热,但在我们细分行业海外产品的迭代速度比国内可能要慢两到三步左右。因此,我们的产品出海时遇到的阻力其实比较小。更多的情况是客户感受到“你有这个功能,我没用过”,而不是“这个功能我们已经用过了,你相比它有什么优势”。

第三,海外客户付费能力确实强,且更愿意支持SaaS化的订阅制服务。国内客户更倾向于私有化部署或定制化服务,但海外很少有机构愿意这样做,这可能也与海外人力成本高有关。

AI进化推动优质投研能力的普惠和平权

IPO早知道:AI服务于金融资管,有哪些方面今后可以较快改善?

费斌杰:以无人驾驶作类比,投研领域的L4阶段最终目标应该是每个投资机构都可以把优质的训练集或优质的独家行业资料喂给自己的AI,让大模型能给出决策判断,这一步何时实现还要打个问号。

但现在行业正在从L1向L2迈进的进程是比较确定的,我们可以往AI辅助投资决策做一些探索,从寻找中短线机会开始尝试更长线的投资布局,而且AI支持下的投研,其策略风格可能最终更加稳定,因为大模型最后学习出的主要策略特征会趋同,整个市场的训练集是趋同的。如果大家的策略都能变为相对中长期的策略,长期来看这对于资本市场的稳定发展是有好处的。

另一种明显的改善在于,AI能推动优质投研能力的普惠和平权,优秀的模型可以服务于资管机构,也可以在合规的前提下服务于个人投资者。虽然这一块不是我们的规划,但肯定有机构未来会去做这件事。

IPO早知道:几年前在AI能力还支持不了很多业务场景时,熵简的定位主要为数据中台公司。怎样的公司能坚持下来、不断进化?

费斌杰:数据中台公司分化成了两种,一类做多行业拓展,公司以技术中台赋能各个行业;我们选择了第二种路径,打造一个平台后,和一个行业做深度结合。我认为对于创业公司来说,最佳的方式是选一个两厘米宽度的事儿,把它做到两米深,做到行业最极致的部分,这个价值才能变成利润。这样的好处是倒逼企业不得不去做精,做精的过程就会创新。

当时我们的信念是,这个行业的数据和私域资料的积累沉淀是很关键的事,虽然当时AI分析不清楚这些资料,但它会是一种初始壁垒。后面要继续做好,壁垒不止于此,需要有一个团队,大家都想把这件事做成。

0 阅读:0

早知懂解析

简介:感谢大家的关注