作 者 | 九卦姐
来 源 | 九卦金融圈
从DeepSeek等开源大模型的崛起,到银行自主训练专属AI,科技与金融的融合加速推进。数字金融百人访谈,聚焦银行科技实践,探讨AI如何重塑金融业务,描绘未来智能银行的蓝图。
本期嘉宾:
新网银行副行长李秀生,西南财经大学管理科学与工程学院计算金融系主任、教授王俊,和新网银行风控科学部负责人卫浩
本期主持人:
任帅

近期,全球 AI 市场迎来一系列重要变革。苹果与阿里展开合作、文心一言全面免费开放,DeepSeek 等开源大模型的崛起,正悄然改变行业竞争格局。同时,全球科技企业加速 AI 技术布局,试图在日益激烈的竞争中抢占先机。在这一背景下,开源与闭源模式的取舍、算力与算法优化的权衡,以及 AI 在银行业等的深度应用,成为业内关注的焦点。
近日,一场主题为“DeepSeek如何改变AI的游戏规则?AGI的高门槛正在消失?”的沙龙顺利举办。这场沙龙由新网银行与西南财经大学管理科学与工程学院联合主办。新网银行副行长李秀生,西南财经大学管理科学与工程学院计算金融系主任、教授王俊,新网银行风控科学部负责人卫浩为我们揭示了DeepSeek背后的技术奥秘及其在银行业的应用潜力。
DeepSeek技术发展趋势
问:DeepSeek的技术创新和突破体现在哪些方面?
王俊:DeepSeek大模型的发布是国产大模型在世界舞台的首次亮相,得到了全球认同,彰显了中国科技的力量。与其他大模型相比,DeepSeek在多个方面实现了突破和创新。
在设计架构上,DeepSeek采用了混合专家架构,将大模型拆分为多个子专家模型,包括细粒度和通台专家模型,这些模型相互协同工作,提高了训练效率。同时,该架构是动态的,采用路由偏置调整策略,解决了子专家模型间的负载不均衡问题,减少了参数,加快了计算速度,提升了推理能力。
在训练层面中,DeepSeek注重数据策略,不仅关注数据量,还注重数据质量和多样性,使用大量合成数据提升大模型的推理能力和运算效率。此外,DeepSeek还运用了强化学习技术、知识蒸馏技术和多头潜注意力机制等技术,增强了模型的推理能力,实现了知识的有效迁移,并大幅减少了资源浪费,提升了计算效率。
在硬件适配方面,DeepSeek表现出色,能够在国产芯片、GPU和云平台上得到应用,打破了高端范例的垄断,降低了相关门槛。这一特性使得DeepSeek在未来的应用场景中,包括端测应用,都能得到更好的深化和发展。
问:DeepSeek感觉更有文采,是否仅针对中文优化?
王俊:DeepSeek在中文处理上确实表现出色,因为它采用了中文语料库进行训练,对中文的理解更为深入,能更好地满足中文需求。
卫浩:DeepSeek具备R1的深度搜索功能,通过思维链训练模式,提高了意图和语义理解能力。这种能力不仅限于中文,也能在处理长上下文和复杂意图时表现出色。因此,DeepSeek的优化不仅针对中文,还在其他方面有所提升。
问:DeepSeek R1对AI行业竞争格局的影响?
王俊:DeepSeek R1的发布对AI市场竞争格局带来了显著变化。首先,从市场主体角度看,DeepSeek作为一种开源、低成本且高效的大模型,对市场上的头部科技公司如OpenAI和英伟达等产生了冲击。对于OpenAI这类闭源大模型公司,DeepSeek的定价策略迫使其重新审视商业模式和技术优化方向。而对于英伟达等芯片公司,DeepSeek的发布证明了不一定依赖于高端GPU就能进行顶级推理,这促使英伟达等思考AI基建的投资逻辑和发展模式应如何调整。
其次,DeepSeek的开源模型为大模型创业公司提供了科技土壤和机会,降低了创业门槛,吸引了更多参与者加入,加剧了市场竞争。同时,云平台如阿里云、腾讯云等也受益于门槛降低,云服务的适配性和多样化得以扩展。
从技术层面看,算法成为技术变革的焦点。DeepSeek等开源模型加速了技术迭代速度,增强了算法优化。在应用端,成本降低和门槛降低使得更多行业能够应用大模型,拓宽了行业宽度和适用性。此外,DeepSeek还推动了端侧应用层面的深度挖掘,如智能玩具、智能家电和智能汽车等领域。
而在硬件需求方面,DeepSeek的发布提升了对中级GPU的需求,降低了对顶级GPU的依赖。这有助于国产替代和算力协同优化,提高了算力的充分利用率。
问:DeepSeek在哪些领域应用潜力显著?
王俊:AI大模型已广泛应用于各个领域。在计算机领域,大模型能助力代码补全、代码理解和构建。在教育领域,基于学生的学习习惯和行为,可以构建个性化大模型,辅助学生学习,记录学习进度,加强薄弱环节,拓展优势领域。在媒体娱乐领域,大模型能用于内容生成、模型构建和场景搭建,如动画制作、游戏设计和短视频制作,还能合成数字人,用于电商推荐等。
在制造业中,大模型能监测零件或电池的可靠性,预测其寿命。在气候风险预测方面,人工智能算法解读未来天气情况,为高速公路等提供预警和路线优化。这些只是AI大模型应用的冰山一角,它已渗透到各行各业,为人类生活带来便利和创新。
开源与闭源模式的博弈与融合
问:开源与闭源未来是竞争还是并行?
李秀生:在软件行业,开源与闭源两种模式并存且各有成功案例。Linux和安卓作为开源软件的代表,极大地推动了操作系统领域的发展,都取得了显著成就。然而,我个人更看好开源模式,因为它能够汇聚更多人的智慧和力量,共同推动技术的进步和创新。未来,开源与闭源或将继续并行发展,但开源的潜力值得期待。
王俊:我认为开源与闭源是相互融合、相互竞争的关系。开源技术公开,能吸引众多开发人员参与,促进技术快速迭代,但盈利能力和商业模式不确定。闭源则注重构建自身护城河和门槛,投入巨大,商业模式独特但多样性较弱。两者各有优势与缺陷,因此在实践中可能会相互借鉴、融合,并在某些领域形成竞争态势,构成一种复杂的关系。
AI应用门槛降低的机遇与挑战
问:降低AI门槛的利弊?
王俊:AI降低应用门槛带来了诸多利处,如激活市场、加速技术迭代、刺激应用领域的宽度和深度发展,以及促进人才培养。然而,同时也存在一些问题和挑战。首先数据隐私保护是一个重要关注点。在开源生态中,很多人会参与各个环节的优化,这可能导致个人用户和企业敏感性信息的泄露。因此,数据隐私保护需得到足够重视。同时,开源模型的安全性问题也不容忽视。如何防止模型被篡改,以及本地化部署后如何防范网络攻击,都是亟待解决的问题。
此外,随着门槛降低,市场竞争将愈发激烈。如果开发者或创业者在二次开发或迭代优化时没有特色或多样性,可能导致同质性竞争压力增大,甚至引发价格战等不良现象。
道德伦理问题也是一个重要议题。在开源生态下,从业者和技术人员可以进行本地化部署训练和优化算法,但新产生的大模型是否符合人类的道德伦理标准却难以保证。
问:对银行业的主要影响?
李秀生:一方面,对复合型人才的需求提高,要求既懂银行业务又懂人工智能,以构建更好的AI应用。
另一方面,网络安全、数据安全及金融科技伦理的要求也更为严格,银行需合法合规地应用新技术。大型商业银行综合能力较强,而中小银行在这些方面仍有提升空间。
因此,银行业特别是中小银行在应用AI大模型时,需同步建设相关能力,以更好地利用新技术,确保合法合规并提升竞争力。
DeepSeek在银行业的应用与变革
问:DeepSeek对银行业的理念冲击?
李秀生:在人工智能领域,DeepSeek的出现带来了两大理念上的变化。首先,它打破了“大力出奇迹”的执念,即不再盲目追求极端的算力。DeepSeek证明了通过优化算法和模型,也能在较低算力下实现高效性能。这一点对英伟达等硬件厂商产生了冲击,导致其股价下跌。
其次,DeepSeek进一步加剧了开源与闭源之争。这一变化对银行业等金融机构产生了深远影响。过去,只有大银行才能斥巨资构建算力、引入模型,但DeepSeek让中小银行也看到了应用大模型的曙光。
对于未来,随着技术的不断进步和成本的进一步降低,大模型将不再是大银行的专属奢侈品,而是能够广泛应用于中小银行等金融机构中。这将为商业银行带来重要的技术变革趋势,推动其更加智能化、高效化地发展。
问:银行如何构建智能技术能力?
李秀生:银行业作为信息化程度较高的行业,其计算机系统经历了多次重大变革。如今,随着人工智能技术的快速发展,银行正面临第四轮信息系统进化的挑战与机遇。
以新网银行为例,自2016年成立起,就在反欺诈和信用风险控制领域充分应用了人工智能技术,实现了高效、大规模的贷款处理。然而,随着大模型的出现,银行开始考虑在更多领域进行探索和尝试。银行已在客服领域应用大模型,成功替代了部分人工客服,并正在营销、贷后管理等领域尝试大模型的应用。
大模型时代的来临,要求银行从人工智能的充分应用角度思考如何重塑银行的经营管理和流程。银行需要首先思考如何构建应用,再考虑如何组织数据、提升数据质量、进行标签标注以及应用行外数据。
在选择大模型时,银行需基于自身应用特点、战略思考来选择合适的模型组合。此外,算力的构建也是银行面临的重要问题。银行需考虑使用高端英伟达产品还是国产算力,搭建私有算力还是在云上进行运算。这些决策都需基于银行的战略需求和实际情况。
总的来说,商业银行在大模型应用上需从战略层面进行思考,同时考虑算力、数据、算法以及应用等多方面因素。而人才的需求变化也将为银行带来新的思考。银行需紧跟技术发展趋势,不断创新和变革,以适应大模型时代带来的挑战与机遇。
王俊:大模型的使用存在资源禀赋差异。大型银行可凭借科研团队和算力资源,基于DeepSeek等开发核心技术,解决复杂任务。
中小型银行则可选择开源或本地化部署,甚至调用API进行业务分析和推理,缩小与大银行的鸿沟。银行需将独特业务融入AI中,注重行业适配性、个性化定制和业务特色性。
因此,大型银行和中小银行在使用人工智能时,都应结合自身资源和业务特点,进行合理规划和部署。
问:用户感知到应用AI后金融服务有提升?
李秀生:从用户角度看,大模型对银行业的影响正逐渐显现,尽管目前更多体现在银行内部流程的优化上,但对客户的感知将愈发明显,如专属客户经理和个性化交互等,大模型将很快带来直接且显著的变化。
在客户服务层面,以往商业银行的专属客户经理服务主要面向高端客户。然而,随着大模型的出现及成本降低,未来每位客户都有可能拥有自己的专属客户经理。大模型能够深入了解客户需求,与客户自由沟通,提供个性化服务,这一变化预计很快就会实现。
在产品形态方面,当前商业银行的应用界面大多采用固定的图标或菜单选择方式,缺乏个性化。但大模型能够快速感知客户需求,使得用户与银行的交互方式不再局限于固定的图标选项。未来的银行应用可能通过与用户的交流过程,即可完成服务,提供更加流畅、个性化的用户体验。
在智能投顾领域,人工智能已有多年应用历史。大模型的出现将进一步提升该领域的能力,为客户提供更好的体验。然而,智能投顾的结果不仅与过去数据相关,还受国际国内形势变化影响,需要综合考虑多种因素。
问:银行风控条线更看重AI应用的什么能力?
卫浩:从风控角度来看,通用人工智能大模型在解决数字化风控问题上面临挑战。尽管大模型具备广泛的能力,如理解问题、进行数学运算和生成代码等,但在风控这一垂直领域,其表现并不尽如人意。原因在于,大模型的训练主要依赖于公开的互联网数据和代码,缺乏针对风控领域的专门数据语料训练,因此其逻辑可能与风控的实际需求不完全吻合。
对于银行而言,首要关注的是数据问题。这包括确保在客户授权后,能够从征信公司等渠道获取足够宽度的画像数据维度。同时,银行需要积累大量的代表性样本,以供模型后续训练使用。此外,数据治理能力和数据质量也是关键因素,科技架构上的数据可用性同样不可忽视。
在算法层面,大模型提供了一种新的技术框架和逻辑范式。通过预训练和微调两个阶段,可以更灵活地适配具体的风控任务。这改变了以往根据单一任务构建模型的方式,为风控模型的技术构建提供了新的思考方向。
当然,算力也是不可忽视的因素。在客户服务方面,风控模型需要在一定时间内做出决策,同时模型的复杂度、可解释性和风险管理的可控性也有严格要求。目前,基于现有的开源模型,已经能够满足一些风控上的要求。
总体而言,数据、算法和算力在风控领域都至关重要。但相比之下,数据可能是最为关键的一点。银行需要重视数据的收集、治理和质量,以确保风控模型的有效性和准确性。同时,也需要不断探索新的算法和算力解决方案,以应对日益复杂的风控挑战。
问:未来银行风控模式如何演进?
卫浩:银行风控经历了从线下人工审批到线上评分卡辅助决策,再到机器学习自动化智能审批的阶段。随着大模型的出现,风控将进入第三阶段。未来趋势包括多模态数据风控和领域化智能风控。
多模态数据风控将利用图片、视频、文本等结构化数据,在客户授权下作为授信审批依据。领域化智能风控则针对金融领域不能直接应用通用大模型的问题,尝试基于金融语料构建预训练模型,再用于下游风险识别、客户匹配度识别等领域。这种两阶段模式已得到验证,且随着模型参数增大和数据增强,模型性能逐渐增强。因此,领域化智能风控模型将成为未来趋势。
问:“AI幻觉”问题!大模型应用的风险与应对?
李秀生:AI幻觉问题在当前技术发展阶段仍然存在,是AI研究者和应用者共同关注的问题。解决此问题主要依赖三方面:一是技术本身的不断升级和优化,以提升避免AI幻觉的能力;二是确保AI获取足够的知识,有时所谓的AI幻觉可能仅因数据不足或领域知识空白所致;三是应用方需审慎对待AI输出,避免盲目接受其答案,尤其是在知识空白或不确定的领域。
王俊:大模型幻觉问题普遍存在,从技术方面出发有几大避免策略:
首先,数据质量至关重要,数据的标准化、一致性、代表性、完整性和准确性有助于大模型在训练时获取更多知识,从而更好回答问题。
其次,训练过程中需寻找合适的训练方法,如正则化等,以确保训练结果可靠稳定。
第三,外挂知识库或约束条件,如知识图谱或语义规则,使大模型在生成文本或讲话时符合约束规律。最后,人工干预必不可少,包括人工审核和监管生成结果,以及及时反馈问题。
AI时代的银行人才的需求与培养
问:银行需要何种科技人才?
李秀生:在互联网应用行业,互联网思维助力了互联网大厂的成功。随着人工智能时代的来临,对人才的需求转变为具备人工智能思维的金融和科技复合型人才。新网银行作为互联网银行,近年来已强调互联网思维,并将在未来重视人工智能思维。在业务产品设计、客户营销、日常经营活动以及构建整体经营管理体系时,都需要融入人工智能思维。
因此,银行将评估员工是否具备这一能力、基础或潜质,以培养适应未来银行发展所需的人才。
问:高校AI人才培养方向?
王俊:在人工智能时代,高校致力于培养AI加专业领域的复合型人才。为此,我们在课程设置上进行了改革和优化,纳入了数据分析、数据挖掘、机器学习、深度学习和多模态数据等课程,让学生在本科阶段就能接触人工智能相关知识。
同时,我们增加了实训项目和实验课程,鼓励学生参加金融科技大赛等比赛,将知识转化为实践能力。此外,我们希望与业界加强产学研合作,通过联合实验室、专家讲座等形式,让学生更深入地了解业界需求和业务,从而激发他们的学习动力和培养符合业界需求的人才。
问:银行从业者如何应对AI挑战?
李秀生:人工智能技术的不断进步给传统银行从业者带来了挑战,但也提供了新的机遇。面对变革,从业者需要保持冷静,不断学习,紧跟时代变化,找到自己在社会和企业中的位置。
技术人员需要调整自己,应用人工智能技术来提升自己的能力。
而业务人员则不必过于担心被替代,因为人工智能技术的应用门槛降低了,即使不懂计算机的人也可以利用人工智能工具构建流程和应用,发挥自己的价值。
因此,只要勇于学习,紧跟技术变化,银行从业者就不会被淘汰,反而能更好地适应时代技术的进步。
问:风控人员如何提升能力?
卫浩:人工智能是一门数据驱动的科学,最重要的是实践。动手实践是掌握这门技术的关键,因为人工智能需要在解决实际问题的过程中不断学习和优化。同时,要有开放的心态去学习新技术,利用互联网和大模型等学习工具,不断提升自己的技术能力。
在风控领域,人工智能技术的应用需要更高的人才要求,不仅需要对技术原理有深入的了解,还需要对模型的优势、能力边界和风险有充分的认识,以确保技术的正确应用。因此,风控人员需要具备深厚的技术功底和广泛的知识面。
AI与银行业的未来展望
图片
问:AI在银行业的下一步趋势?
李秀生:随着AI和大模型技术的发展,商业银行正面临重塑。这不仅涉及系统升级,更将深刻改变银行的业务流程、产品形态、决策机制、人员组合及岗位设置。虽然金融风险管理的本质未变,但服务方式、产品形态和运作机制将发生巨变。这一过程或许渐进,预计三至五年后,商业银行的面貌将焕然一新。
王俊:随着DeepSeek和人工智能的发展,银行业正逐步从边缘应用到核心应用转变。未来,人工智能大模型将更多地参与账户交易等核心业务,如精准推荐和智能投顾。
在模型分化方面,闭源与开源将并存并竞争,但开源生态已逐渐形成,将吸引更多银行从业人员加入。在开源社区的环境下,银行业务的扩展、多样性以及数据安全合规性等问题可以得到共同讨论和合作。这将促进银行业与人工智能、大模型的结合,推动更多新产品和新业务的产生。未来银行业与人工智能的结合将更加紧密,前景可期。