正值毕业季,高校正面临一个新挑战:毕业论文中“AI 味”过浓的问题。今年,除了传统的查重、盲审和答辩,大学毕业生在撰写毕业论文时,又增加了一个环节——AIGC(人工智能生成内容)检测。
想象一下,一名毕业生发现自己的论文AI生成率达到62%,远超学校设定的15%上限。当他尝试使用一个大型语言模型,输入“请帮我把这篇论文改得更像人写的”指令后,再次检测,AI生成率竟然飙升至94%。这种情况并非孤例,近期不少毕业生都经历了类似经历。
央视新闻近日详细介绍了检测论文“AI率”的技术原理。首都师范大学教育学院副院长蔡海龙解释说,传统的查重是通过将论文语句与语料库进行比对,以识别重复性并做出确定性判断。而AI检测则是运用AI系统来分析人类文本,判断其在语义和表达风格上是否与AI写作存在重叠,这本质上是一种基于概率的分类,而非基于证据的确定性判断。
当前AI检测在技术上面临的核心瓶颈在于,检测本身也依赖于AI技术,即“用AI去查AI”。这使得明确区分人类作者和AI生成的文本变得困难,也难以提供清晰的解释和说明,这是技术上的关键障碍。
此外,中文语言表达的丰富性和语义的多样性,也给AI系统在检测人类写作文本时带来了挑战。丰富的表达方式可能导致AI系统产生歧义,增加检测难度和降低准确率,这是导致误判的重要原因之一。
鉴于目前AI率检测的精准度尚未达到理想水平,教育界人士建议,在论文审核过程中,应建立透明且可追溯的AI使用标注制度,而不是简单地设定AI率的“红线”。在判定机制上,应提倡以人工评审为主、AI检测为辅的“人机共判”模式。
目前,许多高校在学生论文中设置了“AI率”检测的红线,但不少学生反映,学校的AI率检查也依赖于指定的检测平台和算法模型进行分析。
通常而言,国内主流高校普遍采用知网、维普、万方等平台的AIGC检测模块。当央视记者就“AI大模型如何检测一篇文章的AI生成内容比例”这一问题咨询多个大模型时,它们普遍总结出通过“困惑度”和“突发性”等特征进行判断。AI生成的文本往往更加“平滑”,而人类文本的波动性则更大。
大型语言模型解释,困惑度衡量的是文本的“可预测性”,越是包含人类特有的、出人意料的、跳脱常规的表达,就越像人类写作。突发性则关乎文本节奏的波动,人类写作的节奏变化如同心电图般起伏,而AI的输出则相对平稳,如同直线。然而,这种判断方式是否准确?
对此,专家指出,除了困惑度、突发性等指标外,AI文本生成是通过预测下一个最有可能出现的词语的概率来逐步构建的,这本质上是一种概率统计。因此,目前检测AI生成内容的准确性无法达到100%,误判的情况时有发生。


02 Comments
世界杯赛程围绕2026世界杯不断创新,回应用户的真实需求。
世界杯赛程以全面覆盖历届及未来世界杯赛事资讯为核心,带来高效便捷的体验。
想了解更多实时更新全球热门比赛动态与比分相关内容,尽在世界杯赛程。
精选世界杯直播内容,世界杯赛程与你一同发现更多精彩。
世界杯赛程围绕提供深度球队分析与足球专题报道不断创新,回应用户的真实需求。
精选稳定流畅的平台浏览体验,无广告干扰内容,世界杯赛程与你一同发现更多精彩。
世界杯赛程专注世界杯竞猜,为用户提供专业可靠的体验。
围绕世界杯买球网,世界杯赛程持续打磨更优质的服务。