AI大模型产品集体奔赴高考考场，教育赛道的讯飞星火能赢吗？

近日，2023年高考落下帷幕，“用AI写高考作文”的话题也备受热议。2023年，受ChatGPT热潮的影响，国内的AI大模型产品也如雨后春笋。例如，百度、阿里、360等互联网巨头企业均相继推出文心一言、通义千问、360智脑等AI大模型产品。

与此同时，一些深耕教育AI赛道的玩家也不甘人后，借助AI大模型，将其原本的优势得以释放。作为智能语音和人工智能赛道的上市企业，科大讯飞推出的大模型产品讯飞星火，也在这波AI热潮中备受关注。

那么，与高考与教育赛道高度相关的讯飞星火，实际写作水平与使用体验如何？笔者对其进行了高考作文相关的系列提问。通过亲测体验，发现这确实是一款十分智能的AI大模型产品。虽然也有一些美中不足的地方，但是也可谓瑕不掩瑜。

瑕不掩瑜，真实水平或不敌优等生

首先，笔者以全国甲卷为例，与科大讯飞星火认知大模型进行了对话。该卷作文题目是：人们因技术发展得以更好地掌控时间，但也有人因此成了时间的仆人。这句话引发了你怎样的联想与思考？请写一篇文章。

笔者将该高考作文的要求，全文输入讯飞星火。讯飞星火的“高考作文”如下：全文一共855字，回答时间在30秒以内。

图源：讯飞星火认知大模型

通过输出的内容可以看出，科大讯飞星火对于提问的语义理解基本正确，行文的逻辑也十分顺畅，例如，在如何正确的利用时间方面，讯飞星火采用了“因为......所以”等表达方式，可谓有理有据，同时行文的措辞表达也非常的口语化，并没有多么华丽的辞藻与晦涩难懂的句子。

不过，作为体现考生写作水平最重要的考试，高考作文还会考查考生作文的立意新颖程度、文字功底等。而如果从这些角度去评价讯飞星火的“高考作文”，也不难看出其存在的明显不足。

首先，在立意方面。讯飞星火用“时间”是把杀猪刀为题，虽然通俗易懂，但是未免过于普通，甚至让人觉得有些敷衍套作的意味。

其次，文章中有多个论点，例如“时间很重要”、“我们应该学会利用时间”、“应该劳逸结合等”。只是，这些观点的论据，都带有一定的说教意味，既没有引经据典，也没有太多实例辅助读者理解，因此论据也显得不够具体和有说服力、更缺少文采。

虽然文末举了两个例子，但是没有插入到文章对应的观点之中进行佐证，也显得不够完整。为了验证讯飞星火的智能性，笔者继续对其进行提问，试图让其再写一篇立意更新颖、更有深度的文章。全文如下，一共827字，回答时间同样在30秒以内。

通过全文内容可以看出，这次的“高考作文”在内容方面，更加接近笔者的需求。例如，行文中用到了莎士比亚、爱因斯坦、爱迪生、乔布斯等名人名言。

只不过，除了前两位名人关于时间的名言能够对其观点进行佐证外，文章中引用的爱迪生与乔布斯的名言却与观点关系并不大，因此依然显得说服力不足。由此可见，虽然讯飞星火理解了作文题目要求的语义，但是在引经据典的作文要求方面，还是有“套作”的嫌疑。

据笔者亲测多款大模型产品，发现这类产品“套作”的现象十分普遍。因此有网友分析表示，或许AI大模型产品并不理解“套作”的含义。按照一些网友的理解，套作指的是不能生搬硬套、套公式套模板。因此，也有网友评价讯飞星火自动生成的文章过于普通，更像是一个普通初中生的作文。

除此以外，笔者发现，大多数大模型产品的“高考作文”，体裁都是议论文。因此，也试图让讯飞星火换一种体裁与风格，试试讯飞星火写作更加生活化的话题作文的水平。于是，又以2023年新课标I卷关于“故事”的话题作文，来对讯飞星火进行测试。

将作文题目全文输入讯飞星火，输出的文章字数是763字，文章的中心思想是：故事有力量，而好故事的意义与价值是多方面的。全文也非常有层次的进行了逐个论点的陈述、佐证。而佐证的内容，主要是引经据典，通过古代、近现代的文学作品进行举例说明，从而得出结论。

不过，全文体裁看起来，依然是一篇议论文。笔者认为，现代元素还是少了一些，依然具有很强的说教味道。如果能够结合好故事给身边亲友带来的改变来举例说明，或许远比只是提到那些文学作品，更有说服力。

体验过关，但美中有不足

好在讯飞星火在功能体验上，比市面其他大模型产品，更加体贴入微。例如，除了查看历史提问、新建对话等，而且相关菜单也放在了十分显眼的位置，避免用户无法快速找到历史对话记录，还可以一键选择“重新回答”。

于是，笔者试着换一种提问方式，并试着连续发问。不过亲测发现，科大讯飞星火似乎不太支持连续发问。

对于笔者针对上一篇作文的疑问，讯飞星火也采用了“忽略”的处理方式。没有正面回答笔者关于对上一篇“高考作文”不满意的回答，而是直接重新写了一篇文章。

值得惊喜的是，这次输出的关于“好故事”的作文，终于不再是议论文了。而是很具生活化，列举了很多实际生活案例的一篇文章，因此读起来也更加像真实考生的创作。

由此可见，AI大模型产品输出的内容如何，关键还在于用户如何提问。在讯飞星火能够全面理解用户提问的语义基础上，只要提问的内容足够具体、要求合理，讯飞星火是能够输出用户真正想要的内容的。

不过，美中不足的是，讯飞星火在理解用户的提问意图时，还是存在一些明显的偏差。例如前文的多次测试中，明确要求作文需要自拟题目，字数不少于800字。但是讯飞星火实际输出的作文，既没有标题，字数有时也不及800字。通过亲测对比其他大模型产品，这种问题也相对普遍。

由此也可以预见，未来大模型产品如何更加精准的进行语义理解，将是非常重要的竞争力之一。

人类未来需要什么样的AI大模型产品？

测完讯飞星火大模型产品的智能程度、用户体验，我们不妨从用户角度来看，人类到底需要什么样的大模型产品。首先，我们来看看讯飞星火是怎么回答这个问题的，也非常有意思。

通过讯飞星火的回答，不难看出，这些因素确实是用户未来十分关注的优化方向。只是，在这些特点之前，如何建立机器人与人类之间的良好沟通，才是第一步。

这正如不同国家的人，使用不同的语言，如果没有翻译机，彼此又不懂他国语言，那么就是鸡同鸭讲，自然得不到正确的反馈。因此笔者认为，所有的大模型产品，未来首要需要解决的，便是如何正确地理解人类的基础语言，包括随着时代变化而产生的新词汇、网络语言、口语、方言等。

难能可贵的是，科大讯飞一直深耕智能语音和人工智能赛道，其翻译机产品在全球畅销，便是其对不同语言转换技术的有力印证。因此，对比之下，讯飞星火相比其他大模型，理论上具有更强的技术研发能力，能让讯飞星火目前存在的一些瑕疵进行优化迭代。

而在各个互联网科技大厂都纷纷推出大模型产品之时，今年高考的“作文大赛”，既是一个练兵场，也是一块试金石。在各个大厂集体奔赴考场时，谁负谁胜已经不再重要，重要的是借助这次契机，大厂的AI大模型存在什么利弊，或许各大玩家心知肚明。

非常有趣的是，当笔者试图提问讯飞科技，AI大模型产品哪家强之时，其回答非常的“圆滑”，也非常的低调，并没有宣称自己就是行业第一，甚至在回答内容里，提到的都是别家的产品，都没有提到“讯飞星火”。如果用调侃的语气来看这样的回答，科大讯飞这种“低调务实”的精神，还是值得肯定的。

人类的进步，永远都是思想的突破。人工智能的应用，目前还只是万里长征的第一步。虽然离人们想要的完美尚有距离，但是一定会向着人类想要达到的效果迈进。

结语

作为教育AI赛道的玩家之一，科大讯飞显然是更懂教育、更懂学生的。因此，相比一些大模型产品面向的行业大而全，讯飞星火在AI大模型集体写作文这个热门事件上，几乎是独一无二的存在，因此讯飞星火在受到更多关注的同时，也将背负着更多人的希望。

我们相信，在AI大模型的应用越来越成熟的同时，其逐渐向行业垂直，走向专业化、生态化也将成为必然，而科大讯飞不仅能将讯飞星火用在其学习机等AI硬件产品上，更将因为其开放性，而为教育行业添砖加瓦、增色添彩。

玩酷网

AI大模型产品集体奔赴高考考场，教育赛道的讯飞星火能赢吗？

科技四少