Chatgpt考试答案未被发现，在英国大学测试中击败了人类学生

2024-06-27

一项新的研究发现，Chatgpt生成的笔试答案不仅可以逃避检测，而且比真正的学生的分数更高。令人惊讶的是，未被发现的AI生成的意见书中有94％的意见与真正的学生的工作无缝融合。

在英国大学考试中，CHATGPT优于人类学生

根据有趣的工程，雷丁大学的研究人员发现，AI生成的考试的答案优于真正的学生，比学生的成绩始终高。

该研究的重点是代表33名假学生提交考试答案，以提交心理学和临床语言科学学院的考试系统。

该研究发现，未发现的AI生成的意见中有94％的人尚未被发现，而Chatgpt-4的分数始终比真实的学生更高。

此外，在83.4％的情况下，AI提交的表现优于随机选择的真实学生提交的成绩，引起了人们对当前AI检测方法可靠性的担忧，以及AI促进的广泛学术不诚实的可能性。

虽然人工智能面临无时间限制，该研究旨在模拟现实的考试条件，学生可以在规定的时间限制内使用AI。

它集中于以简短的问题和论文为特色的考试。短期考试允许2.5小时，而论文的完成时间为8小时。

领导这项研究的副教授彼得·斯卡夫（Peter Scarfe）告诉有趣的工程学，这些工程是无监督的带回家考试，为学生提供了足够的机会在给定的时间限制内使用AI。研究人员推测，一些学生可能在研究期间已成功提交了AI生成的工作。

Scarfe指出，与学生相比，问题的内容起着至关重要的作用，可能会影响AI生成的回答的表现。例如，与多项选择的问题相比，论文可能可以证明更复杂的推理。

该研究采用了两种不同的方法，将Chatgpt生成的答案与真正的学生的答案进行了比较。一种方法直接比较了对各个模块的所有学生提交的所有AI生成的响应。

使用重新采样技术的另一种方法，其中将随机的学生提交与AI生成回答。在新闻稿中，研究人员对学术完整性的影响深表关注。

Scarfe强调，全世界的教育工作者应该认真对待这些发现作为警钟。虽然手写考试可能无法完全返回，但雷丁大学的教育和学生经验的读者伊丽莎白·麦克鲁姆（Elizabeth McCrum）教授强调了全球教育需要适应AI的兴起。

她强调了不断努力通过技术增强教学，旨在改善学生的经验并为毕业生提供基本技能。

研究人员敦促就AI在社会中的作用以及在这种不断变化的景观中维护学术和研究完整性的关键需求进行更全面的讨论。