“用魔法打敗魔法 ” 南開大學(xué)最新研究成果讓AI“識破”AI
中新網(wǎng)天津8月14日電(記者 孫玲玲)記者13日從南開大學(xué)獲悉,近日,南開大學(xué)計算機(jī)學(xué)院媒體計算實(shí)驗(yàn)室取得最新研究成果,不僅從評估的角度揭示了現(xiàn)有AI檢測方法的性能不足,并創(chuàng)新性地提出了“直接差異學(xué)習(xí)”(Direct Discrepancy Learning,DDL)優(yōu)化策略,教會AI用“火眼金睛”辨別人機(jī)不同,實(shí)現(xiàn)AI檢測性能的巨大突破。相關(guān)成果論文已被計算機(jī)多媒體領(lǐng)域國際頂級會議ACM MM2025(ACM International Conference on Multimedia)接收。

近日,OpenAI發(fā)布新一代人工智能模型GPT-5,再次引發(fā)全球關(guān)注。隨著DeepSeek、ChatGPT、通義千問、豆包等AIGC大模型逐漸從“新奇玩具”變成學(xué)習(xí)、工作中不可或缺的“生產(chǎn)力工具”,其伴生問題也日益凸顯:AI經(jīng)常會“一本正經(jīng)地胡說八道”,生成看似合理的虛假信息,造成“AI幻覺”;依賴AI工具代寫作業(yè)甚至畢業(yè)論文,極大沖擊著學(xué)術(shù)誠信和規(guī)范;論文AI率檢測系統(tǒng)有待完善,論文被誤判的問題時有發(fā)生……如何精準(zhǔn)識別AI生成內(nèi)容,成為亟待解決的熱點(diǎn)問題。
據(jù)了解,目前AI生成內(nèi)容檢測主要有兩種路線,一種是“基于訓(xùn)練的檢測方法”,使用特定數(shù)據(jù)訓(xùn)練一個專用的分類模型;另一種是“零樣本檢測方法”,直接使用一個預(yù)訓(xùn)練的語言模型并設(shè)計某種分類標(biāo)準(zhǔn)進(jìn)行分類。

多項研究表明,現(xiàn)有檢測方法在應(yīng)對復(fù)雜的現(xiàn)實(shí)場景時常顯不足。此前也曾有權(quán)威媒體報道,《荷塘月色》《流浪地球》等經(jīng)典作品被某常用論文AI率檢測系統(tǒng)檢出高AI率。
為何現(xiàn)有的AI檢測工具會“誤判”?論文第一作者、南開大學(xué)計算機(jī)學(xué)院計算機(jī)科學(xué)卓越班2023級本科生付嘉晨解釋道:“如果把AI文本檢測比作一場考試,檢測器的訓(xùn)練數(shù)據(jù)等同于日常練習(xí)題,現(xiàn)有檢測方法是機(jī)械刷題、死記硬背答題的固定套路,難以學(xué)會答題邏輯,一旦遇到全新難題,準(zhǔn)確率就會顯著下降。”
“要想實(shí)現(xiàn)通用檢測,理論上需收集所有大模型的數(shù)據(jù)進(jìn)行訓(xùn)練,但在大模型迭代飛速的今天幾乎不可能?!备都纬空f,讓檢測器真正學(xué)會舉一反三,即提升檢測器的泛化性能,是提升AI文本檢測性能的關(guān)鍵。
為此,研究團(tuán)隊提出了DDL方法另辟蹊徑,通過直接優(yōu)化模型預(yù)測的文本條件概率差異與人為設(shè)定的目標(biāo)值之間的差距,幫助模型學(xué)習(xí)AI文本檢測的內(nèi)在知識,可以精準(zhǔn)捕捉人機(jī)文本間的深層語義差異,從而大幅提升檢測器的泛化能力與魯棒性。
“使用DDL訓(xùn)練得到的檢測器如同有了‘火眼金睛’,即便只‘學(xué)習(xí)’過DeepSeek-R1的文本,也能精準(zhǔn)識別像GPT-5這樣最新大模型生成的內(nèi)容?!备都纬空f。
團(tuán)隊還提出了一個全面的測試基準(zhǔn)數(shù)據(jù)集MIRAGE,使用13種主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4種先進(jìn)的開源大模型(如Qwen等),從AI生成、潤色、重寫三個角度構(gòu)造了接近十萬條人類-AI文本對。
“MIRAGE是目前唯一聚焦于對商用大語言模型檢測的基準(zhǔn)數(shù)據(jù)集。直觀地說,之前的基準(zhǔn)數(shù)據(jù)集是由少而且能力簡單的大模型命題出卷,而MIRAGE是17個能力強(qiáng)大的大模型聯(lián)合命題,形成一套高難度、又有代表性的檢測試卷。”論文通訊作者、南開大學(xué)計算機(jī)學(xué)院副教授郭春樂說。
在MIRAGE的測試結(jié)果顯示,現(xiàn)有檢測器的準(zhǔn)確率從在簡單數(shù)據(jù)集上的90%驟降至約60%;而使用DDL訓(xùn)練的檢測器仍保持85%以上的準(zhǔn)確率。與斯坦福大學(xué)提出的DetectGPT相比,性能相對提升71.62%;與馬里蘭大學(xué)、卡內(nèi)基梅隆大學(xué)等共同提出的Binoculars方法相比,性能相對提升68.03%。
“AIGC發(fā)展日新月異,我們將持續(xù)迭代升級評估基準(zhǔn)和技術(shù),致力于實(shí)現(xiàn)更快、更準(zhǔn)、更低成本的AI生成文本檢測,以AI之力,讓每一篇成果更出彩。”研究團(tuán)隊負(fù)責(zé)人、南開大學(xué)計算機(jī)學(xué)院教授李重儀說。(完)

教育新聞精選:
- 2025年08月13日 14:14:27
- 2025年08月10日 08:53:09
- 2025年08月04日 10:04:58
- 2025年08月02日 15:18:32
- 2025年08月01日 13:47:30
- 2025年07月22日 08:24:46