行业首创！百川智能全新金融大模型发布：准确率远超GPT-4o

12月23日，百川智能全链路领域增强大模型Baichuan4-Finance正式发布。不同于行业常见的大语言模型，Baichuan4-Finance主要面向金融领域，但并未放弃通用能力。

在FLAME-Cer评测中，Baichuan4-Finance整体准确率高达93.26%，领先GPT-4o近20%，其中银行、保险、基金、证券等多个项目的从业资格认证测试中，Baichuan4-Finance准确率更是达到了95%以上。

（图源：百川智能）

在更偏向一级应用场景的FLAME - Sce和国内主流开源金融评测基准FinanceIQ两大评测中，Baichuan4-Finance整体成绩均优于GPT-4o和开源金融大模型XuanYuan3-70B-Chat。

据百川智能介绍，为实现模型在提升专业能力的同时，不损失通用能力，百川智能专门打造了一套全链路领域增强方案，行业首创领域自约束训练技术，涵盖高质量数据集构建、模型预训练、微调、强化学习等流程。Baichuan4-Finance正是该方案的最新成果，其高质量金融数据集全面严谨，包含核心专业金融知识数据及实践应用类数据，为提升金融能力提供良好支撑。

（图源：百川智能）

此外，百川智能还在领域自约束训练中引入高精通用数据混合训练，以确保通用能力能够稳步增长。后训练环节，百川智能通过合成数据、指令数据进行有监督微调，针对金融领域特定场景进行样本增强，进一步提升了大模型的性能表现。

对于Baichuan4-Finance，软通动力表示，该大模型的通用能力和专用能力均完美契合他们的需求，部署该大模型后，用户满意度提升了20%。

在大模型普及度日益提高的今天，如何权衡大模型的专业能力和通用能力已成为令AI企业头疼的难题。若使用大量通用数据训练大模型，很可能造成数据污染，降低大模型在专业领域的准确性，而不使用通用数据训练大模型，则可能导致大模型的通用能力增长停滞乃至下降。

百川智能通过行业首创的自约束训练技术和全链路领域增强方案，以专业金融知识和实践应用类数据训练大模型，用于提升Baichuan4-Finance面对金融领域专业应用场景时的能力。特选高精通用数据用于混合训练，则能够在避免外部数据污染的同时，提升AI大模型的通用能力。

（图源：百川智能）

该方案对于AI企业的数据样本筛选、算法、监督和调整能力提出了极高的要求，从多项测试表现来看，Baichuan4-Finance在金融领域的能力已跻身第一梯队，远超GPT-4o和XuanYuan3-70B-Chat。

百川智能表示，已与华为、中科曙光、软通动力、达观数据、中国移动/电信/联通等软硬件公司及运营商达成合作，为爱奇艺、完美世界游戏、360集团等数千家企业提供了服务。

通用大语言模型竞争烈度较高，且难以实现盈利创收，AI公司为大模型加入专业能力，面向特定人群是行业趋势。率布局金融领域的百川智能，或将通过Baichuan4-Finance奠定行业地位，与更多企业达成合作，并为个人用户提供更加完善的使用体验。

25年1月7日，CES（国际消费电子展） 2025 即将盛大开幕，雷科技报道团蓄势待发，即将飞赴美国·拉斯维加斯现场全程报道，敬请关注。

揭秘! 字节“豆包模型”背后的可能受益公司

玩酷网

行业首创！百川智能全新金融大模型发布：准确率远超GPT-4o

揭秘! 字节“豆包模型”背后的可能受益公司

雷科技