7个第一!讯飞星火,如何改写中国大模型生态?

正解局 2024-10-26 13:34:25

前不久,谷歌的前CEO参加了斯坦福大学的一个对谈,他在这次谈话中提到了两个AI行业的关键点:

1:AI技术现在进步非常快,以至于每过六个月就要更新一次关于AI未来发展的演讲。

2:他认为AI技术的发展需要非常大的投资和消耗大量的能源,大公司凭借其整合能力,应用适配能力,竞争力会越明显。

就在最近,今年的诺贝尔物理学奖、化学奖、经济学奖都颁发给了AI领域的科学家。

趋势已经非常明显:人工智能大模型竞争,就是我们这个时代的核竞赛。

但对于中国的很多企业来说,发展大模型的困难有很多。

其中就包括拿不出先进的算力,缺乏专业人员,缺乏专业细化的技术方案,拿不出可以高度适配市场的应用,找不到使用场景……

尤其是AI大模型“不好用,不聪明”的问题,使得产品的市场化很难推进。

因此,国产AI大模型的进取路线,应该是与更多的中小企业和用户的沟通,从而切实开发出适合用户提高工作效率,提升工作效益的数智化应用。

10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞董事长刘庆峰发布讯飞星火4.0 Turbo。

在国产AI大模型行业,投下了一颗深水炸弹:

根据真实数据背靠背测试,七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中讯飞星火4.0 Turbo实现9项第一!

根据艾伦人工智能研究所、OpenAI等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,讯飞星火4.0-Turbo在其中9项测试集实现对美国三大主流模型(GPT-4o、Claude 3.5 Sonnet、Gemini 1.5pro)的超越,效率相对提升50%。

今年9月,OpenAI发布了推理性能强大的o1系列,其超长思维链、树搜索及自我反思评价等能力引发业界高度关注,发布会上,刘庆峰表示,科大讯飞已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类OpenAI 01的高难度数学能力显著提升。

长期以来,GPT-4o都是大模型的一个标杆。

有没有GPT-4o聪明,能不能比GPT-4o好用,是国产大模型必须要面对的问题。

因为AI市场的判断逻辑很简单——不好用,就抛弃。

但是问题又来了,怎么用好讯飞星火4.0 Turbo呢?是不是就和Siri一样,一问一答?

科大讯飞的理解是,要专门为大模型适配应用上的小锅炉。

除了讯飞星火4.0 Turbo,讯飞还首发了10项基于讯飞星火底座能力的硬核产品与创新应用:

定义多模AIUI标准,发布超拟人数字人;发布星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型;发布首个基于“问题链”的高中数学智能教师系统、星火智慧黑板2.0、AI作业过滤器等;发布星火智办一体机、智能座舱人机交互效果评测机器人VIAS以及科大讯飞多语种AI翻译透明屏。

如果说讯飞星火4.0 Turbo回答了国产大模型好不好用的问题,那么这10项产品和应用则回答了国产大模型到底怎么用的问题。

比如面对直播、游戏等领域,讯飞的超拟人数字人首次可以实现语音、视频、图文的全部联动的多模态交互,无论是扮演孙悟空还是小猪佩奇,数字人反应都惟妙惟肖。

在旅游画面中,超拟人数字人还能对画面中产品的品牌、功能等信息进行“秒回”。

很多人出国害怕语言不方便,而讯飞星火多语言大模型,除中英文外,已经支持俄、日、阿、法等8个语种,在翻译场景的应用,效果甚至超过了GPT-4o。

科大讯飞董事长刘庆峰表示,讯飞星火底座能力要不断提升,对标全球最好水平,同时还要针对真实应用场景做到全球最好,不断扩大多语种范围。

“我们一定要代表中国给世界第二种选择……讯飞作为中国唯一的认知智能全国重点实验室承建单位,我们有使命有责任要做多语言大模型。”

“用人工智能技术解决社会刚需”,是科大讯飞一直以来的出发点之一。

在教育领域,中国教育科学研究院与科大讯飞深度合作,汇集北京、上海、重庆、深圳、合肥、成都、大连、广州等12个区域50多位数学教研员、400多位优秀教师与讯飞星火大模型人机共创的智慧系统。

目前的模型已经可以智能生成教学问题链,以循序渐进的方式辅助教师启发学生思考并逐步解决问题,为教师和学生双双减负。

搭载了高中数学智能教师系统的星火智慧黑板2.0,则是让传统的黑板从板书工具跃迁为教学AI助手。

在医疗行业,讯飞星火医疗大模型2.0及智能医学影像平台也正式发布,可帮助影像技师快速评估图像质量,及时纠正检查问题,同时迅速生成诊断报告,通过相关问答,帮助临床医师制定诊疗方案。

在司法领域,庭审笔录以及裁判文书编写一直是困扰司法工作者的难题,如今星火法律大模型也可以辅助相关文书的编写,极大提升司法工作者的效率。

“讯飞星火已成为央国企大模型的第一选择。”

大模型到底该怎么用,刘庆峰晒出了成绩单:

央国企中标第一、教育医疗市场第一、智能汽车市场第一、大模型开发者生态第一、智能硬件市场第一、赋能科研应用第一、赋能工业应用第一。

在当前炙手可热的汽车产业上,科大讯飞也首发了汽车端侧星火大模型,从今年第四季度起,奇瑞、广汽、长城等多款车型,将会搭载星火大模型上市开售。

以数字化能力赋能实体经济,科大讯飞的目标不仅仅个人,更是产业,更有行业。

从数据上看,截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300+应用场景,所覆盖行业和场景数都是第一。

应用生态的繁荣,是中国人工智能的未来。

根据IDC研究报告和市场公开数据显示,科大讯飞在当下的语音语义市占率中第一、大模型开发者规模第一,达78.1万。

前文提到,AI技术的发展需要非常大的投资和消耗大量的能源。

在算力战场,中国未来只有自主研发一条路可走,这当然不一定能成功,但一定会产生大量的赢家和输家。

与去年发布的“3.0版本”相比,这次讯飞星火4.0 Turbo在技术细节上的考量和设计,有极大的提升。

可见讯飞团队在这一年时间里,花了很大功夫做研究,所调动的资源也超过常见的标准。

在大模型一年更新两代的世界里,慢,等于0。

据悉,为了保持大模型的领先度,科大讯飞还将牵头成立AI基金,用5亿创业基金推动开发者创业,加速前沿技术产业化进程,并与地方政府联合为AI创业团队提供产业落地支撑。

发布会上,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。

还记得去年10月24日,首个国产万卡算力集群“飞星一号”平台上线,就是科大讯飞整合行业资源,引领全国产算力平台发展。

如今的“飞星二号”,还将带来新模型新算法的再次跃迁,持续探索无人区。

值得一提的是,越来越多的企业也在依托讯飞智能体平台,孵化员工自己的AI助手。

比如最近国能集团举办“国家能源杯”大赛,共126支队伍参赛,最终创新孵化了54个场景。

“AI for Science决定了中国科技发展的速度,赋能科研是讯飞星火的重要使命。”

纵观AI技术发展的脉络,其实都遵循着同一个逻辑——通过有效的市场化商业循环,让各方都从商业循环中获利,从而促进技术的可持续发展。

当国内使用人工智能、开发人工智能的企业形成规模,互相之间形成了有效互动的商业循环,大家都能从商业循环中获利。

我们其实就不用担心AI技术落后美国了,因为整个产业会在利益驱动下迅速向前。

而在当下,科大讯飞也正以引领者的姿态,带动中国人工智能产业向深处寻找答案。

0 阅读:24

正解局

简介:洞察产业/城市/企业,正解中国成长的力量。