AI技术的升级迭代,让整个社会的发展,日新月异。近日,继6月初科大讯飞在24周年庆上,发布了讯飞星火认知大模型(以下简称讯飞星火)V1.5后,讯飞星火又升级至2.0版本。
据了解,讯飞星火上次更新,主要升级了多轮对话,逻辑和数学能力等。此番更是发布了其代码能力和升级后的多模态能力的突破,同时发布了搭载讯飞星火的编程助手、教师助手,升级学习机、讯飞智作2.0等多项应用和产品。
图源:讯飞星火2.0发布会现场
科大讯飞董事长刘庆峰、研究院院长刘聪对升级版的讯飞星火,充满信心。刘庆峰表示,代码能力是支撑认知大模型智慧的关键维度,多模态能力则是实现通用人工智能的必经之路,也是科大讯飞既定的人工智能技术长期战略,大模型赋能个体和行业的大未来正在到来。
作为与综合性互联网平台有着不同定位的讯飞星火大模型,其实际能力如何?我们接下来从多个维度进行评测、分析对比,或许可以看出讯飞星火与其他大模型平台的差异化之处,以及讯飞星火更广泛的应用价值与市场价值。
多模态能力加持,操作体验升级
AI大模型作为生产力工具,其实际使用体验、内容输出的模态,也是决定其市场竞争力的关键。与其他大模型产品只覆盖了部分终端相比,讯飞星火同时支持五端(安卓、IOS、小程序、PC、H5),加上这次基于多模态能力的升级,其操作体验也更进一步。
过去,科大讯飞在AIGC上的布局了三大模块:音频创作、视觉创作和文本创作。而音频创作,更是讯飞星火的基本盘。在此基础上,讯飞星火也逐步完善了其以虚拟人为核心的完整视频创作能力。
据了解,讯飞星火多模态是指将多种模态信息输入到同一个模型中进行训练,从而使模型具有多种不同类型的数据处理能力。而多模态输入包括文本、图像、声音、传感器等多种数据。
而在虚拟人多模态合成方面,科大讯飞从2018年首发多语种虚拟人口唇驱动,2021年发布了2D真人捏脸系统。目前已经形成了3D虚拟口唇表情和动作的AI驱动到AI贯穿3D形象构建的全流程。
据了解,虚拟人领域的关键技术是动作生成,也就是如何让虚拟人的肢体语言与其输出的内容对应。而该项技术的关键因素之一是语音发音中的韵律节奏、另一个就是动作意图。
针对这一难点,讯飞星火针的解决方案是对这两部分进行建模,能够很好实现动作合成。据中国AIGC产业峰会数据显示,讯飞研究院提出的语义驱动虚拟人动作技术,在虚拟人动作的拟人度和契合度方面,都较传统方案有很大改善,从2.63分提升到3.75分左右。
图源:中国AIGC产业峰会数据
讯飞星火目前也在进一步优化半身数字人像生成技术以及3D虚拟人的动态生成技术。值得一提的是,近两年科大讯飞研究院打造了个性化3D虚拟人复刻系统,实现了基于一张图片、一段语音就能驱动3D虚拟人,同时还支持3D虚拟人发型、眼睛、嘴型进行动态二次编辑。
例如,向讯飞星火发出一段文字、一张图片、一段语音就能驱动3D虚拟人,而加一些对虚拟人的形容词进行描述,就可以对数字人的形象进行“定制”,甚至实现个性化“复刻”。
对比发现,目前讯飞星火目前将各种多模理解、多模生成的能力实现统一、进行多模输入和输出的大模型产品,在市面依然十分少见。例如,百度文心一言目前只有文-文、文-图,不支持虚拟人视频生成,甚至其PC端目前并不支持图片上传,仅有APP端支持图片输出,相关能力应用也是。
不过,今年6月,例如商汤科技发布了如影App,也可以提供丰富的视频创作素材库,用户只需选择喜欢的视频模板,输入文案,就可一键生成知识分享、品牌宣传、短视频带货、培训宣讲、热点资讯等各类数字人视频。
只是,像讯飞星火这样能将多模态内容生成融为一体,在一款产品中集中呈现,在业界依然十分罕见。在AI大模型的研发成果与实际应用产品布局方面,讯飞星火已经快人一步。
场景为王,多场景应用释放价值
任何技术发挥市场价值,都需要首先结合应用场景,实现其应用价值。AI大模型之所以热度不减,是因为其确确实实在人们的工作、生活中能够起到提高“生产力”的作用。因此,此类产品能够覆盖多少应用场景,也是其是否能够获得用户肯定、好评的关键因子。
科大讯飞一直在强调讯飞星火的场景价值,且正在各个击破。对于用户而言,讯飞星火的一大优势是针对以办公场景为代表的各类垂直场景中的需求进行了细分,因此对于用户解决实际问题,也更有针对性,效率更高。
例如,相比一般的大模型产品可以提问、撰文、写诗、做算术题,讯飞星火还可以创作剧本。但是有些大模型产品却并不支持。本次实测题目是:请以校园霸凌为题材,写一部心理剧剧本,角色需要包含老师、同学、家长、校长,场景为办公室、操场、宿舍、食堂。
测试结果是:百度文心一言、科大讯飞星火就分别按照剧本内容、角色、场景要求输出了多幕剧,但是通义千问却明确表示:作为机器人,无法回答此类问题。
图源:文心一言评测截图(剧本创作)
图源:通义千问评测截图(剧本创作)
图源:讯飞星火评测截图(剧本创作)
亲测发现,除了在场景覆盖方面,讯飞星火相对更为全面外,讯飞星火对于用户输入语言的情绪感知能力方面,也与其他产品有着明显的区别。
值得一提的是,多模态能力之外,搭载讯飞星火2.0的讯飞智作2.0等产品,通过文图生成、图片理解等,进一步释放其应用价值。
据了解,借助这些产品,可通过AIGC实现创意视频制作和后期生成,而讯飞智作APP就是结合了以上很多AIGC能力,讯飞星火试图将其打造为一个音视频内容的AI创作基地。
例如,讯飞星火的图像问答、识图创作等功能,就是目前市面大模型产品较少具备的。亲测发现,新版本的讯飞星火支持上传图片,可以进行图片内容识别、解读,并且能准确地进行图片上的算术题目进行精确计算。
图源:讯飞星火测评截图(图像描述、识图创作)
以2023年高考数学题为例,将下图中的试题截图上传至讯飞星火,并要求其对图片中的数学题进行计算。短短几秒钟,就能输出其计算过程,并输出正确结果。
不难看出,由于其丰富的多模态功能,讯飞星火也可以广泛应用在教育场景下的试卷批改、错题辅导、错别字检测等场景,进一步发挥其优势。
值得注意的是,目前百度文心一言(PC端)、阿里通义千问等大模型产品并不支持图片输入及图像问答、识图创作等,甚至在这些平台的对话窗口,并无图片上传功能。
图源:讯飞星火测评截图(图片识别、解答高考数学题)
另外,在图片内容生成方面,讯飞星火可以按照语义表达,输出对应场景的图片。而通义千问等平台提示无此功能,而文心一言虽然也具备这样的功能,但是输出的图片内容与提问者所需要表达的意境差距较大,而且画面不像绘画那么真实。
图源:通义千问评测截图(画画、生成图片)
图源:讯飞星火评测截图(画画、生成图片)
图源:文心一言评测截图(画画、生成图片)
与此同时,讯飞星火升级后的代码能力,也可以通过测试对比窥见一斑。不过,亲测对比文心一言、通义千问,也都有这些功能,只是相比而言,讯飞星火的代码更加简洁,且相关代码说明也十分详细,通义千问的代码与讯飞星火相当,但是代码编写说明也是一笔带过。
对比之下,文心一言输出的代码虽然也是正确的,但是实现方式却相对繁琐,且只提示了程序运行的操作方式,并未说明编程的思路与原理。
图源:讯飞星火评测截图(编程写代码)
图源:文心一言评测截图(编程写代码)
图源:通义千问评测截图(编程写代码)
由此可见,对比同一梯队的不同大模型产品,丰富多样的场景,是讯飞星火的优势所在,而且这些场景,多数与科大讯飞的教育基因有关。
为了让开发人员更好地应用星火认知大模型V2.0,科大讯飞专门发布了全新产品“智能编程助手iFlyCode 1.0”。该产品可将五项代码能力无缝融合到开发环境,同时提供专业的代码知识服务。
目前,讯飞星火的大模型助手中心,有超过500个垂直场景,2000多个助手,对比通用大模型,可以拥有更精准的结果和更高的效率,并将释放其在垂直领域的行业优势。
讯飞星火的智能化水平与应用空间展望
实际上,目前AI大模型产品纷纷竞技、秀肌肉后,高下也逐渐明朗。例如,近日,新华社研究院发布《人工智能大模型体验报告2.0》(以下简称《报告》),通过500道题目、对标接受过高等教育的人类水平、更强调对产业和生活的实际价值,严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计。
其中,讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一,《报告》认为讯飞星火“在工作提效方面优势明显”。值得一提的是,其中参测的8款大模型均为科技巨头或背靠权威院所,“根正苗红”的玩家。
而通过权威机构的评测及上文评测可以看出,讯飞星火发挥了其在教育行业的专业性,无论是操作体验、内容输出质量、还是语义理解、输出内容的可读性、情感表现力都略胜一筹。
值得期待的是,科大讯飞作为教育行业的垂直AI玩家之一,其讯飞星火大模型产品未来的商业应用,还有更大的想象空间。例如,讯飞星火有了生成式AI的基本功能及升级版的智能化特点后,可以在智能硬件、教育互动、商务办公、居家出行等多方面得以应用。
研究发现,人工智能与各行业的深度融合是促进产业升级和转型的重要方式之一,而对于AI大模型的价值远景,业内的共识是,向专业垂直深耕,向行业横向拓宽,才是其走向商用的未来所在。据讯飞星火2.0发布会时公开的数据,讯飞星火已陆续在教育、办公、汽车、金融、工业、医疗等行业应用落地,4109个助手开发者团队开发出7862款星火助手。
在科大讯飞的行业基因驱使下,讯飞星火的全行业布局,也将让其场景相比其他综合类的大模型产品,更加丰富多样。与此同时,得益于其多年的数据沉淀,讯飞星火的机器学习能力也势必更强,迭代速度也将更快。
正如科大讯飞董事长刘庆峰在讯飞星火2.0发布会上表示:“我们希望通过通用人工智能,极大降低社会创新创业门槛”。这也意味着,讯飞星火不只是教育AI工具,更可以像其广告语:星星之火,可以燎原。
结语
“群模乱舞”之下,各大互联网基因的企业争先恐后入局,但是却各有优劣。讯飞星火作为独特的存在,依靠其在教育+AI赛道的深耕沉淀,形成了“以点带面”,从垂直行业切入,向周边产业应用延展的独特发展模式,与其星火燎原的初心遥相呼应,值得行业借鉴,未来可期。
前段时间,携程也推出了基于旅游行业的首个垂直行业大模型应用。对此,业界人士更倾向于认为,大模型产品是应用与场景为王,结合行业、垂直赛道的大模型,将会有着更大的想象空间。
可以预见的是,作为教育行业最懂AI的玩家,AI赛道最懂教育的玩家,科大讯飞在全方位布局大模型在更多行业的应用之时,也因为其开放性,而加速其商业化的步伐。
作者:尼古
编辑:尼克
免责声明:本文基于已公开的资料信息或受访人提供的信息撰写,但科技四少及文章作者不保证该文章提及或者展示关联等信息资料的完整性、准确性。在任何情况下,本文中的信息或所表述的意见均不构成对任何人的投资建议。