作 者 |百融云创研究院
来 源 | 九卦金融圈
在当今这个日新月异的科技时代,人工智能(AI)及其核心——大模型技术,正以前所未有的速度推动着全球经济的转型升级和社会生活的深刻变革。作为AI技术领域的佼佼者,百融云创凭借其在大语言模型、自然语言处理(NLP)、深度机器学习、隐私计算和云计算等领域的深厚积累,正积极拥抱并试图引领这场科技革命的新浪潮。
本文整理自百融云创创始人、董事长张韶峰9月1日在“金融行业大模型应用的新进展和新趋势”闭门研讨会中的发言内容,深入探讨AI及大模型如何成为全球生产力提升的最强引擎以及中国AI发展的特色之路。
1
AI及大模型的划时代发展
什么是AI,为什么AI这么强大?因为可以模拟人脑慢思维的两种能力:归纳和演绎。归纳是一种从个别到一般的推理方法,即从特定的事实或观察中推导出一般性的结论或原则。演绎则是一种从一般到个别的推理方法,即从已知的一般性原理或前提出发,推导出关于个别情况的结论。
自AI技术诞生以来,大模型作为其核心组成部分之一,一直备受关注。大模型以其强大的数据处理能力和广泛的应用场景,正在逐步改变着我们的生活方式和工作方式。从最初的简单算法模型到如今的大规模预训练模型(Foundation Model),大模型的发展经历了从无到有、从小到大的跨越式进步。
2017年,Google Brain团队提出的Transformer架构为大模型的发展奠定了坚实基础。这一架构通过引入注意力机制,使得模型能够高效关注输入序列中的关键部分,从而提高了处理效率和准确性。随后几年里,随着技术的不断迭代和升级,大模型的性能和应用范围也得到了显著提升和拓展。
大模型之所以能够在全球范围内迅速崛起并受到广泛关注,主要得益于其强大的泛化能力和相对较低的成本。在预训练阶段,大模型能够在更大、更多样性的数据集上以无监督的方式学习更抽象、更深层次的知识;而在微调阶段则能够针对具体任务进行优化调整,实现高效应用。这种“一次训练、多次使用”的特点使得大模型在不同领域和场景中都能够发挥出巨大的价值。
百融与全球大模型前沿趋势始终一致。
2
大模型将是全球生产力提升的最强引擎
据麦肯锡报告指出:大模型有望为全球经济贡献约7万亿美元的价值;而中国则有望贡献其中约2万亿美元。这一数字充分展示了大模型在全球经济中的重要地位和发展潜力。
高盛的调查显示,罗素3000指数公司中有16%的公司在2023年的财报会议中提到了大模型,其经济学家估计,大模型将在十年内提高1%的整体劳动生产率,并为标普500指数带来约14%的增长。
美国的大模型商业化应用进展迅速,已经覆盖了医疗、金融、房地产、媒体等多个领域。大模型在金融行业的价值场景主要为营销与销售、投顾与投研、客服与运营、风控与合规。
2023年3月30日,彭博社发布专门用于金融领域大语言模型的LLM(500亿参数)BloombergGPT,通过给定的主题和语境,自动生成高质量的金融报告、财务分析报告及招股书,同时辅助会计和审计方面的工作、提炼梳理财经新闻或者财务信息。
斯坦福大学发布的《2023年人工智能索引报告》中显示,2022年,美国的35个大模型中,只有3个大模型来自于实验室,32个都诞生于产业中。
中国的大模型商业化应用正在逐步展开,但整体上仍处于起步阶段。
截至今年4月,海内外前十应用访问量相差约46倍,国内尚未出现超级应用。海外前十的AI产品访问量共计55.02亿,国内仅1.2亿,海外排名第一的GPT访问量为18.6亿,Kimi为2004万,相差93倍。
AI的6000亿美元问题:
2003年9月红杉资本分析师大卫·卡恩(David Cahn)发表了一篇题为《AI的2000亿美元问题》,提出AI基础设施建设的预期收入与AI生态系统的实际收入增长之间存在巨大差距。目前这个2000亿美元的问题,已经翻成了6000亿美元,这里面蕴含的问题是如何从终端获得价值,再深入思考,既然AI这么厉害,为什么AI还没有从本质上改变人类的生活?
张韶峰总指出,人工智能是一项本质的根本性的技术,深度嵌入场景,并辅以组织的创新、监管的创新、商业模式的创新才能真正的发挥其威力。
3
大模型发展的几个趋势和判断
1、AI Agent让大模型从有趣到有用:大模型是大脑,AI Agent除了大脑,还有手有脚,像人一样能思考能执行(Function Call)
Agent(代理)这一概念最初根植于哲学领域,它描绘了一种具备欲望、信念、意图并能够自主行动的实体。AI Agent与大型语言模型(LLM)之间的关系可以类比为一个复杂生物系统与其高度发达的大脑。AI Agent像人一样思考与行动:独立思考、自主执行、持续迭代,智能体能够实现多个大模型的协同工作,补充知识、调用搜索,增强大模型的能力,深度嵌入若干行业的若干业务场景并解决问题。AI Agent的架构设计遵循严谨的逻辑与专业的原则,确保各组件间的高效协同。
百融凭借其在大模型领域的深厚积累,通过自主搭建的大模型底层框架,实现了对百亿级参数的高效训练,自主大模型的跨越式发展为AI Agent的底层架构带来了突破性的技术方案。
百融的Agent builder赛博坦通过集成生成式大模型、RAG策略及插件化架构,构建了一个高效、智能、可定制的多场景、多语言交互解决方案,为企业提供了强大的自动化客户服务与知识管理能力,更重要的是能够直接促进业务交易,2023年百融AI Agent促进了550亿金融资产交易,2024年预计800亿。
百融VoiceGPT是AI Agent深度场景化的领先实践,VoiceGPT高度成熟,目前已经迭代出情感识别和情感语音输出功能、语义理解准确率提升至97%,适合于多行业多场景的应用,包括金融行业及非金融行业的营销、客服、通知、回访等场景。
百融Agent builder赛博坦整体技术框架
2、场景、场景、场景,深入场景的应用才能让大模型实现从通识向专业的进化,数据飞轮驱动业务增长飞轮
大模型能力决定下限、场景适配度决定上限。只有深度嵌入场景形成数据飞轮,才能反哺提升模型能力和效果。
一个大模型能够解决所有问题吗?Scaling Law是OpenA于2020年提出的理论:认为模型越做越大,就可能实现通用人工智能。
但在实践中,通识大模型其实难以满足具体场景问题,这里需要的是垂直大模型,目前业内公认通识大模型能够具备本科生的水平,那么专业垂直大模型则应该具有博士的水平。
而且完成一个具体任务往往需要不同垂直大模型的组合,每一个大模型负责解决一个业务单元的问题,多个垂直大模型精密集成解决特定场景的问题。
案例:如何利用AI Agent批量复制1万个优秀的理财经理?
行业痛点:因为资源的稀缺性,普通居民难以享受财富管理专业服务
百融利用RAG技术训练财富垂直大模型
3、多模态大模型技术持续演进,混合多模态有望催生现象级应用
多模态大模型的输入及输出都是文本、图像、语音、视频的任意组合。多模态是基于大模型的智能体不但能思考,还能够执行的关键技术。混合多模态实时交互变革人机交互方式,有望催生强交互性场景应用。
百融的数字人叫做AvatarGPT,可应用于机场、商城等人流密集、需要智能引导的场景。依托百融自研的大语言模型,AvatarGPT实现了高达95%的语义识别准确率,首字输出速度最快可达200毫秒。结合非结构化数据处理专利与函数调用技术,知识抽取、理解及执行均达到前所未有的精准度。
在全球AI大模型竞争中,中美两国占据主导地位,目前全球发布的大模型数量,中美合计占约80%;只有中美两国具有:大量资金、丰富人才、强大教育系统、强烈获胜意愿。
美国在AI领域的投入与领先,将投入3000亿美元,其芯片技术领先中国约10年,并可能与加拿大等国家合作获取能源与人才,目前美国高度关注中国AI发展,英伟达软件CUDA只能在英伟达的GPU上运行,不能兼容其他硬件。
但中国仍然凭借超大市场规模、丰富应用场景的优势走出一条特色化之路:卷AI的原生应用、形成应用与技术的飞轮:
卷行业大模型解决方案、满足场景的需求,在终端实现价值,获得利润,持续从市场应用中获得利润,反哺技术及人才,通过应用领域的研发倒逼并推动基础模型的赶超,最终实现底层技术的突破。