畢業(yè)論文寫完那天,王子依進(jìn)行第一次AIGC率(人工智能生成內(nèi)容比例,以下簡(jiǎn)稱AI率)檢測(cè)。結(jié)果給了她重重一擊:論文被系統(tǒng)判定70%為AI生成。


過去兩年,湖北大學(xué)、福州大學(xué)、中國(guó)人民大學(xué)、中國(guó)傳媒大學(xué)等多所高校將畢業(yè)論文的AI率納入畢業(yè)答辯流程,并設(shè)置比率紅線。


但許多學(xué)生發(fā)現(xiàn),AI率檢測(cè)結(jié)果并不穩(wěn)定:不同平臺(tái)差別大,有時(shí)甚至相互矛盾。寫得越規(guī)范、用詞越準(zhǔn)確,AI率反而越高。有人引用公式、法條、經(jīng)典文章被判“AI生成”,有人連致謝也被標(biāo)紅。


一邊是學(xué)生想盡辦法“降A(chǔ)I率”“向AI證明自己不是AI”才能參與答辯。模糊的判定標(biāo)準(zhǔn)下,還催生出一條隱秘的灰色產(chǎn)業(yè)鏈。


另一邊是教師在教學(xué)中如何感知和把握AI“介入”。查還是不查、用還是不用、在哪個(gè)階段使用算“作弊”?這些問題沒有統(tǒng)一答案。


這一學(xué)術(shù)監(jiān)管難題,正在困擾全球教育系統(tǒng)。AI率檢測(cè)似乎在幫助識(shí)別“人”與“機(jī)器”的邊界,但已有不少教師開始反思,當(dāng)論文寫作正好落入AI最擅長(zhǎng)的范圍時(shí),當(dāng)前的考核,是否已經(jīng)悖離了教育的初衷?


即將畢業(yè)的大學(xué)生們?cè)谂恼樟裟?。圖源ic

降A(chǔ)I率,比寫論文還難?


直到答辯前一周,王子依仍深陷AI率的困擾。


她就讀于小學(xué)教育專業(yè),畢業(yè)論文研究主題是“小學(xué)游戲化教學(xué)”。早在實(shí)習(xí)期間,她便完成問卷發(fā)放和數(shù)據(jù)收集的工作,原以為只需打磨內(nèi)容、順利答辯即可畢業(yè)。


今年年初學(xué)校發(fā)布新規(guī),論文除查重外,還需接受知網(wǎng)“AI率”檢測(cè),并由個(gè)人在答辯前提交檢測(cè)報(bào)告。檢測(cè)結(jié)果原則上不得超過40%,若超出可能被認(rèn)定為學(xué)術(shù)不端,將可能給予重寫或延畢。


王子依坦言自己在數(shù)據(jù)分析部分使用過AI工具,進(jìn)行樣本獨(dú)立性檢驗(yàn)。但她發(fā)現(xiàn),AI檢測(cè)報(bào)告標(biāo)出的多是一些格式規(guī)范,“其一”“其二”等分點(diǎn)闡述和名詞解釋被大面積標(biāo)記,甚至連致謝中引用的一句歌詞也未能幸免。


王子依嘗試修改被標(biāo)記的句子,但AI率始終在50%上下徘徊。她在社交媒體上發(fā)帖求助,很快涌來上百條評(píng)論。王子依注意到,最近一個(gè)月,常常會(huì)在凌晨?jī)扇c(diǎn)收到新的評(píng)論和收藏。


有學(xué)生稱自己的論文在不同平臺(tái)的AI率相差懸殊,免費(fèi)網(wǎng)站查詢60%,付費(fèi)網(wǎng)站查詢只有10%;有學(xué)生引用的古詩詞被標(biāo)注;有學(xué)生越改AI率越高;還有學(xué)生稱自己將論文里的句號(hào)全部改成逗號(hào),AI率降低了20%。


評(píng)論區(qū)里還有很多降A(chǔ)I率攻略。使用翻譯軟件,將中文內(nèi)容轉(zhuǎn)譯為其他語種后再譯回,結(jié)果語句生硬、邏輯錯(cuò)亂,連作者自己都讀不下去。有人說可以添加“啊”“呢”“哦”之類的語氣詞。


甚至“魔法對(duì)轟”——“用AI降A(chǔ)I率”。王子依采用了這種方法,論文中原本結(jié)構(gòu)清晰的教學(xué)設(shè)計(jì),被轉(zhuǎn)化成了口語化的“老師說什么、學(xué)生怎么回應(yīng)”的對(duì)話體,她說,讀起來像是一本兒童繪本。


新京報(bào)記者在評(píng)論區(qū)看到,也有學(xué)生質(zhì)疑,“憑什么讓AI定義我是不是AI”。來自一所高校首飾設(shè)計(jì)專業(yè)的趙霖有同樣的疑惑,她的論文是作品說明的一部分,但學(xué)校規(guī)定AI率必須低于10%。她原本用AI幫忙潤(rùn)色語句,系統(tǒng)判定90%的內(nèi)容是AI生成。


“我們是先做出作品,再寫出想法,AI只是順了順語言。”她說,結(jié)果系統(tǒng)只看“像不像AI寫的”,卻完全無視思考過程。在她眼中,“抄襲”和“使用AI潤(rùn)色”是兩回事。前者意味著沒有貢獻(xiàn),后者則是一種輔助。但在AI率檢測(cè)面前,這兩者往往被同等對(duì)待。


在一遍一遍的修改和檢測(cè)后,王子依覺得自己的論文“千瘡百孔”,而她自己也像個(gè)被檢測(cè)結(jié)果支配的AI。老師建議她先專注于內(nèi)容,不必過分糾結(jié)檢測(cè)。但她擔(dān)心影響答辯,只能不斷刪減被標(biāo)紅的段落。


早在2024年6月,華東師范大學(xué)與北京師范大學(xué)聯(lián)合推出《生成式人工智能學(xué)生使用指南》,要求確保AI生成內(nèi)容不超過全文的20%;天津科技大學(xué)2024年的要求是AIGC檢測(cè)不得超過40%;福州大學(xué)要求學(xué)生答辯前、答辯后進(jìn)行兩次AIGC檢測(cè),檢測(cè)結(jié)果將作為成績(jī)?cè)u(píng)定和優(yōu)秀畢業(yè)論文評(píng)選的參考依據(jù)。今年以來,又有多所高校加入檢測(cè)隊(duì)伍。


許多學(xué)生開始緊盯每一次檢測(cè)后的“數(shù)字”。多位學(xué)生表示,他們真正擔(dān)憂的,是在一個(gè)模糊的系統(tǒng)面前,要想盡辦法通過檢測(cè)數(shù)字上的“達(dá)標(biāo)”,才能獲得參加答辯的資格。


王子依社交平臺(tái)上收藏的降A(chǔ)I率的“攻略”。 受訪者供圖

“像不像AI”誰說了算?


經(jīng)過大半個(gè)月的努力,王子依提交了知網(wǎng)檢測(cè)AI率為20%的檢測(cè)報(bào)告。但她卻始終搞不懂AI率到底是怎么計(jì)算出來的。


北京航空航天大學(xué)法學(xué)院教授、數(shù)字正義研究中心執(zhí)行主任裴煒分析,目前多數(shù)AI率檢測(cè)系統(tǒng)是基于“語言預(yù)測(cè)”:通過分析大量AI生成文本,歸納出AI的語言習(xí)慣,比如一個(gè)詞組后面通常會(huì)跟著哪些詞等。再將其與學(xué)生論文進(jìn)行比對(duì),如果發(fā)現(xiàn)與AI生成文本的特征高度相似,就可能判定某段文字為“AI生成”。


然而,人類本來也會(huì)使用規(guī)范、重復(fù)的表達(dá),尤其在學(xué)術(shù)寫作、技術(shù)報(bào)告等規(guī)范性文本中?!癆I生成”不是“AI原創(chuàng)”,而是AI基于人類創(chuàng)作的語料,模仿人類思考表達(dá)模式的產(chǎn)物?!皳Q句話說,沒有AI,人也可能做出類似的語詞聯(lián)系和表達(dá)”。


裴煒提到,當(dāng)前AI率的判斷技術(shù)本身存在不確定性。她試用過一些AI檢測(cè)工具,發(fā)現(xiàn)“容易誤傷”,直接使用和認(rèn)定有可能錯(cuò)判學(xué)生的真實(shí)勞動(dòng)成果。


另外,不同檢測(cè)網(wǎng)站的原始數(shù)據(jù)庫不同,也會(huì)造成檢測(cè)結(jié)果的不同。一位人工智能方向的從業(yè)人員向新京報(bào)記者解釋,由于大模型的算法內(nèi)部機(jī)制和決策過程是黑箱式的,無法解釋為什么這段話被判斷為AI生成,只能給出一個(gè)結(jié)果,比如“AIGC率為73%”。


此前Open AI也在2023年1月發(fā)布一款A(yù)I文本檢測(cè)工具“AI Classifier”,旨在確定文本是不是人工智能生成的,但由于準(zhǔn)確率只有26%,于當(dāng)年7月宣布停止。


而即便是人類的語言學(xué)專家,也很難分辨二者區(qū)別。


2023年,美國(guó)南佛羅里達(dá)大學(xué)的一項(xiàng)研究,邀請(qǐng)語言學(xué)專家區(qū)分AI生成的文字內(nèi)容和人類寫的內(nèi)容,72名專家的正確率為39%。


新京報(bào)記者也注意到,多個(gè)檢測(cè)網(wǎng)站都標(biāo)注了“免責(zé)說明”?!癆I生成可能性及被標(biāo)注的文本,僅表示具有AI生成文本的部分特征,并不確定為AI生成,結(jié)果僅供參考?!薄坝捎贏I模型的差異性,檢測(cè)結(jié)果可能存在誤差。”還有“AI特征值與論文質(zhì)量無關(guān),檢測(cè)結(jié)果僅供參考”。


盡管AIGC檢測(cè)的原理和準(zhǔn)確性是模糊的,但學(xué)生們的焦慮很真實(shí)。


新京報(bào)記者在多個(gè)社交平臺(tái)上發(fā)現(xiàn)“代降A(chǔ)I率”的廣告,有的是利用AI網(wǎng)站降重,購(gòu)買相應(yīng)的字?jǐn)?shù),就能自動(dòng)生成;也有提供人工降重服務(wù),聲稱“一對(duì)一修改、改到滿意”。價(jià)格從幾十元到幾百元不等,常按字?jǐn)?shù)或目標(biāo)AI率定價(jià)。


記者詢問了幾位“降A(chǔ)I率”服務(wù)博主,對(duì)方稱一篇1萬字、AI率45%的論文,花80元可以降到個(gè)位數(shù),方法是“純?nèi)斯ふ{(diào)整”。另一位按照修改的字?jǐn)?shù)收費(fèi),千字10元。


另外,新京報(bào)記者看到,有檢測(cè)平臺(tái)一邊提供檢測(cè)AI率,一邊銷售“降A(chǔ)I率”服務(wù)。一家網(wǎng)站智能降A(chǔ)IGC的價(jià)格為每千字3-5元,自動(dòng)改寫AIGC疑似度高的片段;人工降重則需要添加客服微信,根據(jù)論文題目、檢測(cè)結(jié)果、字?jǐn)?shù)以及降到多少進(jìn)行報(bào)價(jià)。


新京報(bào)記者在一個(gè)免費(fèi)進(jìn)行AI率檢測(cè)的網(wǎng)站上看到,有付費(fèi)進(jìn)行降A(chǔ)I率的服務(wù)。圖源:網(wǎng)絡(luò)截圖

“我不再是寫作者,而是信息傳送帶”


在教學(xué)實(shí)踐的另一端,無需檢測(cè),不少老師也能從論文中察覺出“AI味兒”。


表述奇怪、“不合年級(jí)水平”的表現(xiàn)、虛構(gòu)的參考文獻(xiàn)等——這些線索逐漸構(gòu)成他們判斷學(xué)生是否使用AI的依據(jù)。


陜西一所高校的會(huì)計(jì)專業(yè)教師彭玉發(fā)現(xiàn),今年有人交上來的初稿結(jié)構(gòu)還算完整、字?jǐn)?shù)達(dá)標(biāo),但語言干巴,財(cái)務(wù)數(shù)據(jù)分析簡(jiǎn)單又籠統(tǒng)?!坝悬c(diǎn)兒像在很大的數(shù)據(jù)庫里搜點(diǎn)兒東西拼湊出來?!?/p>


她本擔(dān)心誤判,結(jié)果學(xué)生回復(fù)“好的”,答應(yīng)重寫。她意識(shí)到學(xué)生也心虛了。她還記得一個(gè)學(xué)生的致謝里,每個(gè)句子都是句號(hào),對(duì)方也坦承“整頁都是AI寫的”。


類似的直覺也出現(xiàn)在小語種教學(xué)中。一位北京高校的小語種老師嚴(yán)遠(yuǎn)提到,自己所在的學(xué)校尚未啟動(dòng)AI率檢測(cè)機(jī)制,但今年答辯時(shí),他明顯感受到,部分學(xué)生論文中展現(xiàn)出“與其學(xué)習(xí)階段不匹配”的知識(shí)儲(chǔ)備和表達(dá)水準(zhǔn)。


他提到,AI對(duì)翻譯類作業(yè)的影響尤其顯著。學(xué)生提交的外譯中文本中,充滿排比、隱喻和修辭性的陌生表達(dá)。而中譯外的文本,又過于流暢和自然。


西南財(cái)經(jīng)大學(xué)社會(huì)發(fā)展研究院副教授陳晶環(huán)的“警覺期”更早。2022年底Chat GPT問世幾個(gè)月后,她就注意到學(xué)生作業(yè)在質(zhì)量上的明顯躍升。


她最初還欣喜,后來卻發(fā)現(xiàn)許多作業(yè)盡管使用了大量專業(yè)術(shù)語和書面表達(dá),但句與句之間缺乏邏輯遞進(jìn)、語言空洞,甚至彼此相似。她感嘆,如今看到不太流暢的句子,反而高興,覺得是學(xué)生自己寫的。她坦言,“老師也很矛盾?!?/p>


對(duì)于AI率檢測(cè),老師們態(tài)度不一。


彭玉所在學(xué)校今年首次設(shè)立AIGC率檢測(cè)機(jī)制,規(guī)定學(xué)生論文中AI生成內(nèi)容不得超過35%,檢測(cè)費(fèi)用每人最多可報(bào)銷200元。她認(rèn)為這項(xiàng)制度“至少能震懾一批人”。


裴煒則認(rèn)為,即便是目前廣泛使用的“重復(fù)率”,也在學(xué)位論文評(píng)價(jià)中存在缺陷。在法學(xué)專業(yè)中,很多術(shù)語和法律表達(dá)是固定的,如果為了“降重”而扭曲表達(dá),反而有損論述的準(zhǔn)確性和嚴(yán)謹(jǐn)性。相較于重復(fù)率,AI率的情況更為復(fù)雜,在現(xiàn)有技術(shù)和評(píng)價(jià)標(biāo)準(zhǔn)尚不成熟的情況下,直接予以適用可能制造更大的不公與誤傷。


同時(shí)她認(rèn)為人機(jī)協(xié)作的界限非常模糊,如何衡量一個(gè)學(xué)生在寫作中投入了多少“自己的智力”?從簡(jiǎn)單輸入一個(gè)標(biāo)題就生成一整篇論文,到給出完整的研究問題、思路框架,再讓AI完成擴(kuò)展,或是讓AI協(xié)助潤(rùn)色和修改文本,這之間很難用一個(gè)“率”去界定。


嚴(yán)遠(yuǎn)提到要警惕新的技術(shù)官僚主義。學(xué)生們用AI寫論文、用AI查AI率,再用AI降A(chǔ)I率,變成了考察大家誰更會(huì)使用AI,變成教育者和被教育者之間的斗智斗勇。


陳晶環(huán)看到有被AI率誤傷的大學(xué)生,“防守和進(jìn)攻都靠AI,誰也沒能真正走出AI的圈子。”她建議是否可以建立一個(gè)溝通解釋機(jī)制。讓學(xué)生可以提供一些初稿、改動(dòng)痕跡等內(nèi)容,而不是強(qiáng)硬地根據(jù)檢測(cè)數(shù)字決定是否能參與答辯。


而在學(xué)業(yè)之外,AI對(duì)學(xué)生思維習(xí)慣的重塑更讓部分教師警惕。


陳晶環(huán)將其稱為“習(xí)得性求助”?!斑@是一種有問題第一反應(yīng)就不再是自己思考,而是立刻去找AI?!边@種習(xí)得性求助意味著學(xué)生主動(dòng)思考的過程被跳過了:“我不再是寫作者,而是信息傳送帶。”


她感受到,工具的過度使用不僅帶來了思維能力的弱化,更削弱了學(xué)生的閱讀力、耐心和表達(dá)欲望?!坝袑W(xué)生甚至連AI給出的內(nèi)容都不愿讀完,只覺得前兩句差不多,就直接復(fù)制進(jìn)論文?!?/p>


而大學(xué)階段最核心的成長(zhǎng),就在于是否形成了自主思考的習(xí)慣和能力。在她看來,這種被工具牽引和主導(dǎo)、逐漸失去主動(dòng)權(quán)的過程,就是“異化”。


知網(wǎng)個(gè)人AIGC檢測(cè)服務(wù)頁面的常見問題解答中提到,AI特征值與論文質(zhì)量無關(guān),檢測(cè)結(jié)果僅供參考,可能存在誤差。圖源:網(wǎng)絡(luò)截圖

AI無法替代人類對(duì)現(xiàn)實(shí)的感知與回應(yīng)


夜里十一點(diǎn),彭玉的微信又響起,是學(xué)生發(fā)來修改完的論文。


這樣的情況她早已習(xí)慣。大四不少學(xué)生已在實(shí)習(xí)單位報(bào)到,重心不在學(xué)術(shù)上,而是如何盡快完成學(xué)業(yè)、順利畢業(yè)。論文修改是他們?cè)谙掳嗪?,或者擠出周末的時(shí)間趕工出來的。在就業(yè)壓力與工具便利的雙重作用下,論文變成一項(xiàng)需要完成的“任務(wù)”。


本科畢業(yè)論文最初的設(shè)想,是訓(xùn)練學(xué)生的科研能力與培養(yǎng)探索精神,也就是“能不能提出一個(gè)研究問題,并進(jìn)行系統(tǒng)性的分析”。


但陳晶環(huán)指出,在實(shí)踐中,這個(gè)目標(biāo)不斷被“降維處理”?!拔覀円呀?jīng)不苛求本科生做出理論創(chuàng)新了,重點(diǎn)要求學(xué)生要有最基本的學(xué)術(shù)規(guī)范,只要他能用學(xué)術(shù)語言、說得通、講得順,就算合格。”


而表述結(jié)構(gòu)清晰、語言規(guī)范、格式統(tǒng)一,這恰恰是AI最擅長(zhǎng)模仿的領(lǐng)域。


嚴(yán)遠(yuǎn)直言,在如今的技術(shù)面前,傳統(tǒng)的作業(yè)或者考核已經(jīng)失去意義,像一場(chǎng)師生間的互相欺騙,“裝作AI不存在?!?/p>


換句話說,目前高校的教育考核方式,已經(jīng)難以適應(yīng)人工智能等新工具的廣泛使用。更有老師直言,這相當(dāng)于用農(nóng)業(yè)社會(huì)的考法,應(yīng)對(duì)智能社會(huì)的工具。


裴煒認(rèn)為不可能在AI技術(shù)高速發(fā)展的同時(shí),又禁止學(xué)生使用。相反地,在未來社會(huì),學(xué)生的數(shù)字能力、智能能力將是其核心競(jìng)爭(zhēng)力。因此問題的關(guān)鍵不在于學(xué)生使用AI去應(yīng)對(duì)考評(píng),而在于AI時(shí)代教育理念、教育方式和人才評(píng)價(jià)機(jī)制需要與時(shí)俱進(jìn)。


陳晶環(huán)認(rèn)為,技術(shù)的變化正要求教育做出結(jié)構(gòu)性調(diào)整——改變考核方式、更新評(píng)價(jià)指標(biāo)、重塑教學(xué)目標(biāo)?!斑@是教育的責(zé)任,而不是學(xué)生的負(fù)擔(dān)?!?/p>


比起限制或一味禁止AI使用,多位教師提到,重點(diǎn)是在教育中正視工具的存在,并引導(dǎo)學(xué)生在使用中保持思維的主動(dòng)權(quán)。嚴(yán)遠(yuǎn)注意到,一些學(xué)生通過AI輔助,能夠更便捷地查閱多語種資料、了解語法細(xì)節(jié),尤其是在教師未能覆蓋到的地方,AI反而起到了“補(bǔ)課”作用。


面對(duì)這種趨勢(shì),老師們正主動(dòng)調(diào)整,布置無法被AI完成的作業(yè),或者讓AI只能起到輔助作用。


陳晶環(huán)將課程論文寫作改成口頭匯報(bào)對(duì)某本社會(huì)學(xué)著作的理解,并且不使用PPT脫稿講解,這樣學(xué)生就必須在理解的基礎(chǔ)上,用自己的語言表達(dá)。她還讓學(xué)生書寫個(gè)人生活史。這種非結(jié)構(gòu)化、貼近生活的寫作,迫使學(xué)生自己動(dòng)手,無法靠AI代勞。在研究生課程上,她則鼓勵(lì)學(xué)生有意識(shí)地探索AI的可能性。


嚴(yán)遠(yuǎn)嘗試讓學(xué)生翻譯文本并配音。學(xué)生可以用AI翻譯,但必須親自配音。在小語種學(xué)習(xí)中,口頭轉(zhuǎn)述比筆頭兒更能檢驗(yàn)學(xué)習(xí)質(zhì)量。


此外,嚴(yán)遠(yuǎn)在講授生態(tài)環(huán)保等復(fù)雜議題時(shí),課堂時(shí)間限制沒辦法拓展。他鼓勵(lì)學(xué)生用AI梳理背景知識(shí),再在課堂上討論AI給出的觀點(diǎn)。這種方式不僅拓寬了學(xué)生的視野,還激發(fā)了多元思考。“不同同學(xué)使用AI,有時(shí)會(huì)提出意料之外的觀點(diǎn),這反而讓討論更深入和多元?!?/p>


在裴煒看來,技術(shù)帶來的變化是每一代人都要面對(duì)的。從更長(zhǎng)遠(yuǎn)的尺度看,當(dāng)AI更加深入地介入學(xué)術(shù)研究,學(xué)術(shù)誠(chéng)信的邊界如何劃分,在文章中如何提及AI的貢獻(xiàn),AI能否列為論文作者,乃至如何定義學(xué)術(shù)誠(chéng)信、合作、學(xué)術(shù)剽竊,可能都需要教育界和學(xué)術(shù)界一起慢慢探索。


采訪中,陳晶環(huán)提到去大涼山做田野調(diào)查的故事。她長(zhǎng)期關(guān)注彝族地區(qū)的農(nóng)村基層治理,涉及當(dāng)?shù)靥赜械奈幕瘋鹘y(tǒng)。這些信息只有通過實(shí)地田野調(diào)查才能積累起來,如果把時(shí)間線拉長(zhǎng)到十年的追蹤,觀察政策如何影響一個(gè)具體村莊的變遷,這種深度和系統(tǒng)性AI無法做到。


“AI等待被人類喂養(yǎng)?!彼J(rèn)為,AI再?gòu)?qiáng)大,也無法替代人類對(duì)現(xiàn)實(shí)的感知與回應(yīng),這恰恰是最不該放棄的能力。


(應(yīng)受訪者要求,文中嚴(yán)遠(yuǎn)、王子依、趙霖、彭玉為化名)


新京報(bào)記者 李聰

編輯 陳曉舒

校對(duì) 趙琳