近日,2023年高考落下帷幕,“用AI写高考作文”的话题也备受热议。2023年,受ChatGPT热潮的影响,国内的AI大模型产品也如雨后春笋。例如,百度、阿里、360等互联网巨头企业均相继推出文心一言、通义千问、360智脑等AI大模型产品。
与此同时,一些深耕教育AI赛道的玩家也不甘人后,借助AI大模型,将其原本的优势得以释放。作为智能语音和人工智能赛道的上市企业,科大讯飞推出的大模型产品讯飞星火,也在这波AI热潮中备受关注。
那么,与高考与教育赛道高度相关的讯飞星火,实际写作水平与使用体验如何?笔者对其进行了高考作文相关的系列提问。通过亲测体验,发现这确实是一款十分智能的AI大模型产品。虽然也有一些美中不足的地方,但是也可谓瑕不掩瑜。
瑕不掩瑜,真实水平或不敌优等生
首先,笔者以全国甲卷为例,与科大讯飞星火认知大模型进行了对话。该卷作文题目是:人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人。这句话引发了你怎样的联想与思考?请写一篇文章。
笔者将该高考作文的要求,全文输入讯飞星火。讯飞星火的“高考作文”如下:全文一共855字,回答时间在30秒以内。
图源:讯飞星火认知大模型
通过输出的内容可以看出,科大讯飞星火对于提问的语义理解基本正确,行文的逻辑也十分顺畅,例如,在如何正确的利用时间方面,讯飞星火采用了“因为......所以”等表达方式,可谓有理有据,同时行文的措辞表达也非常的口语化,并没有多么华丽的辞藻与晦涩难懂的句子。
不过,作为体现考生写作水平最重要的考试,高考作文还会考查考生作文的立意新颖程度、文字功底等。而如果从这些角度去评价讯飞星火的“高考作文”,也不难看出其存在的明显不足。
首先,在立意方面。讯飞星火用“时间”是把杀猪刀为题,虽然通俗易懂,但是未免过于普通,甚至让人觉得有些敷衍套作的意味。
其次,文章中有多个论点,例如“时间很重要”、“我们应该学会利用时间”、“应该劳逸结合等”。只是,这些观点的论据,都带有一定的说教意味,既没有引经据典,也没有太多实例辅助读者理解,因此论据也显得不够具体和有说服力、更缺少文采。
虽然文末举了两个例子,但是没有插入到文章对应的观点之中进行佐证,也显得不够完整。为了验证讯飞星火的智能性,笔者继续对其进行提问,试图让其再写一篇立意更新颖、更有深度的文章。全文如下,一共827字,回答时间同样在30秒以内。
通过全文内容可以看出,这次的“高考作文”在内容方面,更加接近笔者的需求。例如,行文中用到了莎士比亚、爱因斯坦、爱迪生、乔布斯等名人名言。
只不过,除了前两位名人关于时间的名言能够对其观点进行佐证外,文章中引用的爱迪生与乔布斯的名言却与观点关系并不大,因此依然显得说服力不足。由此可见,虽然讯飞星火理解了作文题目要求的语义,但是在引经据典的作文要求方面,还是有“套作”的嫌疑。
据笔者亲测多款大模型产品,发现这类产品“套作”的现象十分普遍。因此有网友分析表示,或许AI大模型产品并不理解“套作”的含义。按照一些网友的理解,套作指的是不能生搬硬套、套公式套模板。因此,也有网友评价讯飞星火自动生成的文章过于普通,更像是一个普通初中生的作文。
除此以外,笔者发现,大多数大模型产品的“高考作文”,体裁都是议论文。因此,也试图让讯飞星火换一种体裁与风格,试试讯飞星火写作更加生活化的话题作文的水平。于是,又以2023年新课标I卷关于“故事”的话题作文,来对讯飞星火进行测试。
将作文题目全文输入讯飞星火,输出的文章字数是763字,文章的中心思想是:故事有力量,而好故事的意义与价值是多方面的。全文也非常有层次的进行了逐个论点的陈述、佐证。而佐证的内容,主要是引经据典,通过古代、近现代的文学作品进行举例说明,从而得出结论。
不过,全文体裁看起来,依然是一篇议论文。笔者认为,现代元素还是少了一些,依然具有很强的说教味道。如果能够结合好故事给身边亲友带来的改变来举例说明,或许远比只是提到那些文学作品,更有说服力。
体验过关,但美中有不足
好在讯飞星火在功能体验上,比市面其他大模型产品,更加体贴入微。例如,除了查看历史提问、新建对话等,而且相关菜单也放在了十分显眼的位置,避免用户无法快速找到历史对话记录,还可以一键选择“重新回答”。
于是,笔者试着换一种提问方式,并试着连续发问。不过亲测发现,科大讯飞星火似乎不太支持连续发问。
对于笔者针对上一篇作文的疑问,讯飞星火也采用了“忽略”的处理方式。没有正面回答笔者关于对上一篇“高考作文”不满意的回答,而是直接重新写了一篇文章。
值得惊喜的是,这次输出的关于“好故事”的作文,终于不再是议论文了。而是很具生活化,列举了很多实际生活案例的一篇文章,因此读起来也更加像真实考生的创作。
由此可见,AI大模型产品输出的内容如何,关键还在于用户如何提问。在讯飞星火能够全面理解用户提问的语义基础上,只要提问的内容足够具体、要求合理,讯飞星火是能够输出用户真正想要的内容的。
不过,美中不足的是,讯飞星火在理解用户的提问意图时,还是存在一些明显的偏差。例如前文的多次测试中,明确要求作文需要自拟题目,字数不少于800字。但是讯飞星火实际输出的作文,既没有标题,字数有时也不及800字。通过亲测对比其他大模型产品,这种问题也相对普遍。
由此也可以预见,未来大模型产品如何更加精准的进行语义理解,将是非常重要的竞争力之一。
人类未来需要什么样的AI大模型产品?
测完讯飞星火大模型产品的智能程度、用户体验,我们不妨从用户角度来看,人类到底需要什么样的大模型产品。首先,我们来看看讯飞星火是怎么回答这个问题的,也非常有意思。
通过讯飞星火的回答,不难看出,这些因素确实是用户未来十分关注的优化方向。只是,在这些特点之前,如何建立机器人与人类之间的良好沟通,才是第一步。
这正如不同国家的人,使用不同的语言,如果没有翻译机,彼此又不懂他国语言,那么就是鸡同鸭讲,自然得不到正确的反馈。因此笔者认为,所有的大模型产品,未来首要需要解决的,便是如何正确地理解人类的基础语言,包括随着时代变化而产生的新词汇、网络语言、口语、方言等。
难能可贵的是,科大讯飞一直深耕智能语音和人工智能赛道,其翻译机产品在全球畅销,便是其对不同语言转换技术的有力印证。因此,对比之下,讯飞星火相比其他大模型,理论上具有更强的技术研发能力,能让讯飞星火目前存在的一些瑕疵进行优化迭代。
而在各个互联网科技大厂都纷纷推出大模型产品之时, 今年高考的“作文大赛”,既是一个练兵场,也是一块试金石。在各个大厂集体奔赴考场时,谁负谁胜已经不再重要,重要的是借助这次契机,大厂的AI大模型存在什么利弊,或许各大玩家心知肚明。
非常有趣的是,当笔者试图提问讯飞科技,AI大模型产品哪家强之时,其回答非常的“圆滑”,也非常的低调,并没有宣称自己就是行业第一,甚至在回答内容里,提到的都是别家的产品,都没有提到“讯飞星火”。如果用调侃的语气来看这样的回答,科大讯飞这种“低调务实”的精神,还是值得肯定的。
人类的进步,永远都是思想的突破。人工智能的应用,目前还只是万里长征的第一步。虽然离人们想要的完美尚有距离,但是一定会向着人类想要达到的效果迈进。
结语
作为教育AI赛道的玩家之一,科大讯飞显然是更懂教育、更懂学生的。因此,相比一些大模型产品面向的行业大而全,讯飞星火在AI大模型集体写作文这个热门事件上,几乎是独一无二的存在,因此讯飞星火在受到更多关注的同时,也将背负着更多人的希望。
我们相信,在AI大模型的应用越来越成熟的同时,其逐渐向行业垂直,走向专业化、生态化也将成为必然,而科大讯飞不仅能将讯飞星火用在其学习机等AI硬件产品上,更将因为其开放性,而为教育行业添砖加瓦、增色添彩。
太牛了,我蛮认可讯飞滴