頂尖AI會議爆醜聞：逾兩成論文評審竟是AI代筆？

學術界正因人工智能（Artificial Intelligence）的濫用而面臨新的挑戰。當研究人員懷疑自己的手稿被使用人工智能進行同行評審時，他們該如何應對？近日，數十名學者在社交媒體上對提交給明年國際學習表徵會議（International Conference on Learning Representations，ICLR）的手稿和同行評審報告表示擔憂。ICLR是機器學習專家的年度盛會，學者們指出，部分評審意見中存在虛構的引文，以及對其研究工作給出異常冗長和含糊的反饋，引發了廣泛關注。

AI審稿疑雲引發學界關注

賓夕法尼亞州（Pennsylvania）匹茲堡（Pittsburgh）卡內基梅隆大學（Carnegie Mellon University）的人工智能研究員格雷厄姆·紐比格（Graham Neubig）是收到疑似由大型語言模型（LLMs）生成評審報告的學者之一。他表示，這些報告「非常冗長，帶有大量點列式內容」，並要求進行一些「並非典型人工智能或機器學習論文中審稿人會要求的標準統計分析」。然而，紐比格需要幫助來證明這些報告是由人工智能生成的。為此，他在社交平台X上發文，懸賞任何能夠掃描所有會議提交內容及其同行評審報告以檢測AI生成文本的人。

Pangram數據分析揭示驚人真相

第二天，紐約市（New York City）專門開發AI生成文本檢測工具的公司Pangram Labs的行政總裁麥克斯·斯佩羅（Max Spero）回應了紐比格的請求。Pangram公司篩查了提交給ICLR 2026的所有19,490份研究和75,800份同行評審報告。該會議將於明年四月在巴西里約熱內盧（Rio de Janeiro）舉行，預計紐比格和其他超過11,000名AI研究人員將會出席。Pangram的分析結果令人震驚：約21%的ICLR同行評審報告完全由AI生成，超過半數含有AI使用的跡象。斯佩羅表示：「人們之前有所懷疑，但沒有任何具體證據。我們在12小時內編寫了一些代碼來解析這些論文提交的所有文本內容。」

會議主辦方應對與學術界反響

面對這一情況，會議主辦方表示，他們現在將使用自動化工具來評估提交的稿件和評審報告是否違反了關於在提交和評審中使用AI的政策。紐約州（New York）伊薩卡（Ithaca）康奈爾大學（Cornell University）的計算機科學家、ICLR 2026的高級項目主席巴拉特·哈里哈蘭（Bharath Hariharan）表示，這是該會議首次大規模面臨此類問題。他補充說：「在我們完成所有這些流程後……將使我們對信任有更好的概念。」Pangram的分析還發現，在提交的稿件中，有199份（1%）被認定為完全由AI生成，另有9%的稿件包含超過50%的AI生成文本。哥本哈根大學（University of Copenhagen）的計算機科學家德斯蒙德·埃利奧特（Desmond Elliott）的經歷證實了許多研究人員的擔憂。他收到的一份評審報告被其博士生懷疑是AI生成，因為報告中提及的手稿數據不正確且用詞古怪。Pangram的分析證實，這份可疑的評審報告確實完全由AI生成，並且給予了該手稿最低評分，使其處於「接受與拒絕的邊緣」。埃利奧特對此表示「極度沮喪」。

來源：nature.com