AI考试答案：94%未被检测，成绩超学生

在人工智能不断进步的今天，一项由英国雷丁大学进行的研究揭示了一个令人瞩目的现象：AI生成的考试答案在现实世界的“图灵测试”中往往能够逃过经验丰富的考官的法眼，而且在94%的情况下，这些答案的得分甚至高于学生的实际提交。这一发现为全球教育界敲响了警钟，呼吁制定新的政策和指导方针来应对这一问题。

这项研究是雷丁大学评估人工智能在研究、教学、学习和评估中的风险和益处的一部分。研究结果已经引起了教育界的广泛关注，促使学校更新了面向教师和学生的指导方针。

研究者们呼吁全球教育界效仿雷丁大学的做法，形成新的政策和指导，以更多地解决这一新兴问题。在最近发表在《PLOS ONE》杂志上的一项严格的盲测中，ChatGPT生成的考试答案在多个本科心理学课程中提交，结果在94%的情况下未被检测出来，而且平均得分高于真实学生提交的答案。

这项研究是迄今为止同类研究中最大、最严谨的一次，挑战了人类教育者检测AI生成内容的能力。雷丁大学心理学和临床语言科学学院的副教授Peter Scarfe和教授Etienne Roesch领导了这项研究，他们表示，研究结果应该为全世界的教育者提供一个“警醒”。

教授Roesch强调，作为行业，我们需要就期望学生如何在作业中使用和承认AI的角色达成一致。这对于防止社会信任危机同样重要。我们的研究突出了我们作为信息的生产者和消费者所承担的责任。我们需要加强我们对学术和研究完整性的承诺。

雷丁大学教育和学生体验副校长Elizabeth McCrum教授表示，AI将对我们生活的许多方面产生变革性影响，包括我们如何教学生以及如何评估他们的学习。雷丁大学已经开展了大量的工作，考虑我们教学的所有方面，包括更多地利用技术来增强学生的体验和提升毕业生的就业能力。

这项研究不仅展示了AI在学术评估中的潜力，也凸显了教育界在适应AI时代所面临的挑战。随着AI技术的不断发展，教育者、学生以及政策制定者需要共同努力，确保教育评估的公正性和有效性。如果您对AI在教育领域的应用有自己的看法，或者对这项研究感兴趣，欢迎在评论区分享您的观点，让我们一起探讨AI时代的教育未来。

参考资料：DOI： 10.1371/journal.pone.0305354

玩酷网

AI考试答案：94%未被检测，成绩超学生

曦照认知