腾讯混元大模型稳居卓越领导者象限!

教你看点商行 2024-08-07 14:14:38

本月2号,SuperCLUE-V基准8月榜单发布,引发了AI领域的广泛关注。腾讯混元大模型凭借其在多模态理解上的卓越表现,成功斩获国内大模型排名第一,并稳居卓越领导者象限。

所谓的多模态理解,其实就是大家常说的“图生文”,也就是用语言准确的归纳图片中的物体。目前拥有这项能力的大模型其实并不少,但用过的人都知道,不少大模型的主要语境是英语,这就导致其对中文的理解能力比较差,很多情况还会出现偏差,在识别图片时,往往语境上的偏差是致命的。

而腾讯混元大模型对中文语境更加理解,能够理解中文语境下的弦外之音,甚至能够准确领会古诗词的意境,这对于AI大模型来说还是相当有难度的。值得一提的是,此次SuperCLUE-V基准测评涵盖了国内外最具代表性的12个多模态理解大模型,包括4个海外模型和8个国内代表性模型。评估内容涉及基础能力和应用能力两大方向,以开放式问题对模型进行全面评估。腾讯混元大模型在多模态基础能力和应用能力上,获得了总分71.95的高分,显示出其在技术和应用层面的综合优势。

而在应用方面,腾讯推出的AI原生应用腾讯元宝,从发布之初就具备了多模态理解能力。无论是文档截图、人像风景、收银小票,还是随手拍的照片,元宝都能基于图中内容给出精准的理解和分析,在日常生活和工作中,这项能力还是相当重要的。

总的来说,腾讯混元大模型在多模态理解上的突破,不仅展示了其强大的技术实力,也标志着国产大模型在理解复杂现实世界方面迈出了重要一步。因为中文语境和英文语境的差异,相信未来,腾讯混元的多模态理解能力将让其成为更适合中国人使用的大模型。

0 阅读:1

教你看点商行

简介:感谢大家的关注