专访 | 企业家杂志
在数字化浪潮的推动下,人工智能正以其独特的方式重塑企业运营的每一处角落。近期,艾瑞数智首席数据官张晓璐有幸接受《企业家》杂志专访,深入剖析了生成式AI的最新趋势及其在To B服务领域的应用现状,描绘了一幅AI技术助力企业提高生产办公效率、实现业务创新的蓝图。从多模态大模型到超长文本生成,再到智能体的创新应用,张晓璐为我们提供了一个全新的视角,以理解AI技术在推动产业变革中的核心作用。
《企业家》杂志
弘扬企业家精神 传播管理智慧
张晓璐 艾瑞数智首席数据官
《企业家》:当前生成式AI的最新趋势是怎么样的?
张晓璐:在当前科技浪潮中,生成式AI技术正以前所未有的速度发展,引领人工智能新一轮变革。当前生成式AI最新趋势呈现以下几个方面。
第一,以多模态大模型Sora为代表。随着技术的不断进步,多模态模型的应用影响着影视、直播、媒体、广告、动漫、艺术设计等数个行业。Sora作为这一趋势的代表,为用户提供更为丰富和多元的输出,展示了多模态大模型在生成内容方面的巨大潜力。
第二,在文本生成方面,超长文本生成技术也取得了显著进展。以月之暗面的Kimi为代表的超长文本生成,能够处理高达200万token的上下文,为用户生成连贯、复杂的文本内容。
第三,模型小型化。为了满足移动设备和其他资源受限设备的需求,模型的小型化成了生成式AI领域的另一个重要趋势。华为、小米、OPPO等手机厂家已经在新的手机中内置了端侧大模型应用,如翻译、会议摘要等。这些模型通常小于10B,既保证了性能,又降低了对设备资源的占用。
第四,智能体的应用。在软件中加入智能体,是生成式AI领域的又一创新。通过将智能体融入软件系统中,可以大幅提升系统的性能和智能化水平。
尽管大模型在生成式AI领域取得了历史性突破,但公众对其能力的认知与期待往往存在偏差。实际上大模型的能力仍然存在一定的局限性,需要不断地优化和改进。
《企业家》:艾瑞数智发布的《2023年中国人工智能产业研究报告(VI) 》中提出,从产业应用角度,大小模型结合仍是当下人工智能产业的核心应用落点。请您介绍一下大小模型的特点及应用场景。
张晓璐:2023年是大模型的起步之年,代表性的事件是ChatGPT。大模型问世以来,模型的研发成本结构发生变化,由边际成本变为固定成本,模型从专才向通才过渡。大模型的训练时间变长、成本变高,一旦开发完成,模型可以胜任多种通用任务。大模型的场景主要是生成类,通用性更强的任务,如对话类的各种助手和文生图、文生视频类的工具。
小模型开发成本低,为专项任务开发定制,往往在专业领域擅长,但不适配其他任务。小模型的场景主要是决策类的、专业性更强的任务,如安防、人脸识别等场景,卷积神经网络(Convolutionnal Neural Network,简称CNN)、循环神经网络(Recurrent Neural Network,简称RNN)等小模型成熟度高,计算机视觉(Computer Vision,简称CV)产品应用具有高实时性与高性价比;人机对话采用的自动语音识别(Automatic Speech Recognition,简称ASR)、语音合成(Text-To-Speech,简称TTS)等小模型已发展成熟,基于性价比、时延等要求,很多简单对话场景仍应用小模型。
从需求侧角度出发,客户关注的重点不是对于大小模型的选择,而是AI产品方案的实现与应用产生的最终价值。目前,包括艾瑞数智的多数厂家普遍采用大小模型结合的办法,以在满足客户需求的前提下,达到成本效益的最优化。
以艾瑞数智服务运营商营销场景为例,实现“客户—产品—渠道”的智慧大脑的核心是推荐引擎,其实是一个所谓的“小模型”(专才)。而轻创平台中实现海报创作、H5落地页创作的是AIGC模型,是一个“大模型”(通才)。两者结合起来,可以用较低的成本实现销售转化率36%,覆盖率200%的提升。
《企业家》:当前大模型明显的痛点,一是适配场景有待发掘,二是落地成本偏高。哪些潜在应用场景需要重点关注?如何改善落地成本偏高的问题?
张晓璐:大模型和场景的适配性关键看大模型的可控性。大模型技术从之前的完全不可控到部分可控,如生成式对抗网络(GAN),可以让图片中的马生成斑马。GPT3.5出现后,多轮对话和可控文生图技术逐渐普及。近期的大语言模型的应用场景主要是新一代搜索,如国外的perplexity.ai 和国内的秘塔AI等,个人助手copilot,文生图的创作,再到数字人技术。
△艾瑞数智运营人员使用轻创平台(营销素材生成、管理平台)为第三十一届成都大运会游泳夺金这一热点事件创作营销海报。
可预见的未来,随着大模型可控性能力的增强,AI Native应用会越来越多,它可以完成自动驾驶、程序设计、内容创作,再到AI4Sci等精确性要求更高的应用。
目前,GPU成本和能源消耗是落地成本的主要瓶颈。GPU本质上是由硅制成,而硅是从沙子中提炼的,因此其成本可以忽略不计。除了英伟达,中国的企业如华为、海光、寒武纪等也在迅速崛起。市场预测显示,到2030年,GPU的供需有望达到平衡。能源消耗问题最终将通过可再生能源和可控核聚变技术的进步得到解决,这需要技术创新来推动。
在模型层面,短期内降低落地成本的方法包括模型优化,例如由NUS校友创立的潞晨科技所采用的优化技术,或者通过模型压缩技术、结合大模型与规则或小模型,以及大模型与多Agent协作等多种策略来实现。
《企业家》:生成式AI的产品价值在于其强大的内容生成能力,能够为用户提供高度个性化的内容生产,满足企业内外服务的多样化需求。企业对于生成式AI产品的应用现状是怎样的?
张晓璐:第一,快速颠覆类。电商、游戏和广告行业线上程度高,且内容质量直接决定其价值创造,AIGC应用能够产生最大化的价值,并渗透至核心生产环节。据统计,AIGC相关应用已经帮助游戏行业在研发制作环节节约50%~70%人力或时间成本。
第二,匀速增长类。媒体、影视、教育这类行业也以内容为价值核心,主要特征是内容生产更多环节在实体环境完成,具有更强的专业性、灵活性,AIGC可变革的上限略低,且会更加考验技术的成熟度。
第三,稳中求变类。金融、电信和政府部门等行业价值链中涉及大量内容生产和人与人交互的环节,数字化转型付费意愿和付费能力强。但同时因为其具有业务流程、组织架构可变性较低,对数据安全极为敏感等特质,因此对AIGC应用的态度最为保守。解决大模型私有化部署的ROI问题是打开这类市场的关键。
第四,潜能挖掘类。农业、制造业等行业以实体部分为重,内容在其营销、销售等个别环节充当辅助角色,这决定了AIGC技术在其中产生的影响相对有限。领军公司快速落地尝试、腰部和尾部公司缓慢跟进的态势加剧了行业内部分化。
《企业家》:场景产品侧作为生成式AI技术的核心落点,B端与C端的市场发展成为产业界关注的焦点。您认为发力B端和C端有什么不同之处?
张晓璐:发力B端和C端,在生成式AI技术的应用和发展上存在一些显著的不同之处。
第一,业务逻辑与需求差异。B端的企业客户通常有特定的业务需求和复杂的业务逻辑,AI技术的应用需要与企业的业务流程紧密结合,实现业务场景的定制化和优化。企业客户对AI技术的可靠性、安全性和成本效益有更高的要求。C端消费者的应用往往更注重用户体验和便捷性,产品通常需要直观易用,能够快速吸引消费者的注意力和兴趣。
第二,市场接入和推广策略。B端的企业市场推广往往需要更长的销售周期和更深入的技术演示与验证。建立信任和品牌影响力是关键,同时需要关注合规性和数据安全。C端的消费者市场推广则更侧重于营销和品牌建设,利用社交媒体、广告和口碑传播等方式快速触达用户。
第三,技术落地和应用场景。B端的技术落地需要逐步渗透,打通业务逻辑,实现场景的落地应用闭环。B端产品方案需要融合更多的大模型技术,以适应不同的业务场景。C端的技术落地可能更注重阶梯式的能量爆发,供给侧需要满足硬件设备条件及大模型能力适配,软硬件生态成熟后,C端应用可能会迅速普及。
第四,风险和挑战。B端面临的挑战可能包括场景融合难度、技术可靠性、大模型落地模式的适配等问题。C端的挑战可能包括合规性、内容可控性、软硬件生态的成熟度等问题。
总的来说,B端市场更注重深度的技术整合和定制化服务,而C端市场则更侧重于用户体验和快速的市场响应。两者在市场策略、产品开发、服务模式和技术应用上都有所不同,需要不同的方法和策略来实现。
《企业家》:大模型在To B企业服务赛道上的应用情况如何?哪些是企业目前青睐的应用场景?
张晓璐:去年是探索的开始,今年是起势的一年。目前在大模型的To B企业服务商看,从前端的营销、客服,到生产,再到内部的管理都有涉及。大模型技术通过提供深度学习和自然语言处理的能力,正在帮助企业实现更精准的数据分析、自动化的客户服务和智能化的生产流程管理。这不仅提升了工作效率,还为企业带来了决策支持和业务创新的可能性。
推荐系统、垂直领域知识问答、轻创平台(营销素材、生成、管理平台)、智能客服是To B服务的主要应用。这些应用通过利用大模型的高级算法,能够根据用户行为和偏好提供个性化推荐,快速响应专业领域的咨询,简化创意内容的生成流程,以及提供7×24的自动化客户支持。
企业目前青睐的应用场景包括出海、游戏等。出海方面,大模型能够帮助企业克服语言障碍,通过多语言处理能力支持跨国界的沟通和市场拓展。在游戏行业,游戏设计和开发过程中,大模型可以辅助生成故事情节、角色对话,甚至通过玩家行为分析来优化游戏体验。