在人工智能不断进步的今天,一项由英国雷丁大学进行的研究揭示了一个令人瞩目的现象:AI生成的考试答案在现实世界的“图灵测试”中往往能够逃过经验丰富的考官的法眼,而且在94%的情况下,这些答案的得分甚至高于学生的实际提交。这一发现为全球教育界敲响了警钟,呼吁制定新的政策和指导方针来应对这一问题。
这项研究是雷丁大学评估人工智能在研究、教学、学习和评估中的风险和益处的一部分。研究结果已经引起了教育界的广泛关注,促使学校更新了面向教师和学生的指导方针。
研究者们呼吁全球教育界效仿雷丁大学的做法,形成新的政策和指导,以更多地解决这一新兴问题。在最近发表在《PLOS ONE》杂志上的一项严格的盲测中,ChatGPT生成的考试答案在多个本科心理学课程中提交,结果在94%的情况下未被检测出来,而且平均得分高于真实学生提交的答案。
这项研究是迄今为止同类研究中最大、最严谨的一次,挑战了人类教育者检测AI生成内容的能力。雷丁大学心理学和临床语言科学学院的副教授Peter Scarfe和教授Etienne Roesch领导了这项研究,他们表示,研究结果应该为全世界的教育者提供一个“警醒”。
教授Roesch强调,作为行业,我们需要就期望学生如何在作业中使用和承认AI的角色达成一致。这对于防止社会信任危机同样重要。我们的研究突出了我们作为信息的生产者和消费者所承担的责任。我们需要加强我们对学术和研究完整性的承诺。
雷丁大学教育和学生体验副校长Elizabeth McCrum教授表示,AI将对我们生活的许多方面产生变革性影响,包括我们如何教学生以及如何评估他们的学习。雷丁大学已经开展了大量的工作,考虑我们教学的所有方面,包括更多地利用技术来增强学生的体验和提升毕业生的就业能力。
这项研究不仅展示了AI在学术评估中的潜力,也凸显了教育界在适应AI时代所面临的挑战。随着AI技术的不断发展,教育者、学生以及政策制定者需要共同努力,确保教育评估的公正性和有效性。如果您对AI在教育领域的应用有自己的看法,或者对这项研究感兴趣,欢迎在评论区分享您的观点,让我们一起探讨AI时代的教育未来。
参考资料:DOI: 10.1371/journal.pone.0305354