文丨许闲团队
AI会否取代保险代理人的激烈讨论余音未了,更大范围的保险从业者也有可能被AI取代的话题已经展开。
随着人工智能与大语言模型技术的发展,人们对于AI对人类工作的替代性展开了激烈的讨论。而在保险领域,由于以ChatGPT为代表的大语言模型呈现出的强大对话能力,这一讨论往往聚焦于“ChatGPT是否能够取代保险代理人?”。
然而,随着GPT-4V(ision)等多模态大模型的兴起,被取代者的范围会要大大扩展了。GPT-4V不仅展示了卓越的自然语言处理能力,更关键的是,它在处理多模态数据(如文本和图片)方面显示出强大能力。这种全方位的处理能力预示着其在核保、风控、理赔等多个保险业务领域的广泛应用潜力。
那么,在这个高速发展的时代, GPT-4V是否只是一个工具,会不会在不久的将来,成为保险从业人员的全面“替代者”?
近日,复旦大学许闲教授团队(成员来自复旦大学与罗切斯特大学)发布了一项研究报告,对以GPT-4V为代表的多模态大模型(LMMs)在各项保险领域多模态任务上的表现进行定性分析,对GPT-4V在保险行业的潜在应用进行了探索。
该研究首次探索了保险与前沿 LMMs 技术的结合可能,对促进保险的跨学科交流与发展及未来研究工作的持续推进作出基础性探索。
让我们看看,除了可以“替代”保险代理人,基于许闲教授团队的实验测试,AI还能为保险业做什么、不能做什么,存在哪些问题和挑战——
1 AI完成保险任务的能力强大:既能理解保险内容,又能了解保险场景许闲团队的研究基于保险险种和保险业务阶段两个维度,对保险领域的多模态任务进行了系统分类。
在险种选择上涵盖了人身险与财产险中的代表性险种(健康险、车险、家庭/企业财产险、农险);
在业务阶段上涵盖了承保评估、风险监测、损失理赔三个关键的业务流程,以体现任务划分的全面性与代表性。
研究收集并测试大量的贴近保险业务场景的图文案例,展示出GPT-4V 在保险相关任务中表现出了强大的能力,不仅对保险领域的多模态内容有很强的理解能力,而且对保险场景有全面的了解。
1、在车险领域,该研究对GPT-4V的车辆承保评估、车辆风险监测、车辆损失理赔与车辆欺诈识别能力进行深入的探索分析,并通过具体案例呈现GPT-4V的能力——
①车辆承保评估:GPT-4V展现出了强大的车险承保评估能力,它能够对车辆型号、车辆外观状况、车辆VIN等关键要素进行提取。值得注意的是,它还能对报纸在图片中的作用进行了精确的分析(用于确定拍摄时间)。
②车辆风险监测:GPT-4V能够对车内发生的危险驾驶行为(打电话,玩手机)进行精确识别。
③车辆损失理赔:GPT-4V能够对车辆损失进行损失识别、损失描述与损失程度分析
④车辆欺诈识别:GPT-4V能基于车辆事故图片,对车损报告中的不匹配或夸大损失现象进行识别。
2、在家庭/企业财产险领域,该研究对GPT-4V的家庭/企业财产承保评估、家庭/企业财产风险监测与家庭/企业财产损失理赔能力进行深入的探索分析,并通过具体案例呈现GPT-4V的能力——
①家庭/企业财产承保评估:GPT-4V能够对家庭房屋以及企业建筑的整体风险情况进行系统性的分析评估。
②家庭/企业财产风险监测:GPT-4V能够基于家庭/企业的监控画面,对实时发生的异常事件(起火、高空坠物等)进行监测和预警。
③家庭/企业财产损失理赔:GPT-4V能够对家庭房屋与企业设施的损失情况、受损原因与受损程度进行识别与分析,但对具体的损失金额大小难以进行精确估算。
3、在健康险领域,该研究对GPT-4V的健康承保评估、健康风险监测与健康损失理赔能力进行深入的探索分析,并通过具体案例呈现GPT-4V的能力——
①健康承保评估:GPT-4V能够对投保人的医疗报告内容进行提取,并对其健康风险状况进行分析。
②健康风险监测:GPT-4V能够基于监控画面,对威胁投保人健康的风险事件(如老年人摔倒)进行识别与预警。
③健康损失理赔:GPT-4V能够对医疗费用凭证进行识别与信息提取,并对医疗项目与就诊报告之间的关联性与匹配性进行分析。
4、在农险领域,该研究对GPT-4V的农田承保评估、农田风险监测与农田损失理赔能力进行深入的探索分析,并通过具体案例呈现GPT-4V的能力——
①农田承保评估:GPT-4V能够对农田的作物种类进行识别,并对其风险状况与风险等级进行分析。
②农田风险监测:GPT-4V能够对农作物的生长阶段进行识别,并对影响作物生长的威胁事件(如野生动物入侵、火灾等)进行监测和预警
③农田损失理赔:GPT-4V能够对农田的损失原因、损失状况与损失等级进行分析评估,但无法进行精确的损失估计。
2 明显不足与挑战:动态精确数值记忆,图片幻觉、不同语言识别问题会影响应用该研究发现,尽管GPT-4V在保险领域的多模态任务上展示出了强大的能力,但也呈现出了明显的不足和挑战。
例如,GPT-4V在进行风险评估或损失理赔时,往往无法提供准确的风险概率或准确的损失数值。又如,在某些测试案例中GPT-4V出现了幻觉的现象。
再如,GPT-4V对不同语言文档的信息提取分析能力不尽相同,研究的测试表明其对欧美国家的语言文字(英文、德文、法文)上表现更为精确,而在东亚国家的语言文字(中文、日文、韩文)上表现较差。在此之外,研究也提及了多模态大模型不仅仅只是技术工具,它可能会同保险协同发展,从而对传统保险业务形成颠覆性挑战。
1、动态变化精确数值内容难以记忆,存在精确估损挑战:
研究以车险为例,通过额外信息输入的形式实现了精确的损失评估,但GPT-4V本身对此类动态变化的精确数值内容难以记忆,这对精确的损失评估构成了挑战。
2、存在图片识别幻觉,会限制实际应用:
研究发现了GPT-4V两种幻觉现象,分别是多图输入幻觉(多图输入和单图输入结果不匹配)与物体识别幻觉(物体识别错误),这些幻觉会对多模态大模型在保险领域的应用形成根本性的挑战。
3、不同语言文字识别能力不同,东亚国家文字上表现很差:
该研究测试了GPT-4V对全球保费收入排名前八的国家的主流语言文档的识别提取能力,发现GPT-4V在不同文字上的能力不匹配,在东亚国家文字上表现很差。这对多模态大模型在全球的保险业推广形成阻碍。
3 AI或将变革传统保险业务研究还认为,上述探讨的重点是多模态大模型这一新兴技术对保险业传统业务的影响,但保险业本身也在不断发展。通过引入新兴技术,可以创新的运营方式,与保险业相辅相成,促进行业内的共同发展。
以汽车保险为例,随着自动驾驶技术的创新,汽车保险也在不断发展,多模态大模型可以与这一发展交织在一起,共同进化,产生颠覆性的影响。
比如多模态大模型可以发挥其视觉、听觉和语言处理综合能力,进行实时数据分析和决策支持;或通过多模态大模型引入处理视觉数据方面,帮助保险公司开发基于实时行为和环境反馈的新型风险评估模型。