考試開放用 AI 但 95% 學生不敢用？比利時教授用「當責性機制」證明：驗證 AI 比自己寫還難

比利時魯汶大學（UCLouvain) 教授 Ploum 近期發表了一篇名為〈Giving University Exams in the Age of Chatbots〉的文章，詳述他在「開源策略」期末考中推動的一項實驗，開放學生在規定限制下使用 AI 聊天機器人作答。

這項測試出現的結果令人訝異，在60名學生中，只有 3 名學生選擇在考試中使用聊天機器人。Ploum 並非禁止學生使用 AI，而是將選擇權交還給學生，並制定了一套強調當責性的規則，意即學生必須對最終產出的結果負起完全責任，不能將錯誤推給 AI 工具。

強制不准刪除思考歷程

Ploum 教授在考前設計了兩種考試模式供學生選擇。選項 A 是傳統模式，學生僅能使用傳統的網路搜尋引擎，嚴禁使用任何聊天機器人，違者視同作弊。選項 B 則允許使用 AI 聊天機器人作為幫手，但必須公開提示詞並標註 AI 來源。

Photo Credit by Giving University Exams in the Age of Chatbots

然而，讓大多數學生打退堂鼓的關鍵，在於考試必須在不間斷思考歷程的方式下作答，教授的目的是捕捉學生當下最真實的思緒，所以規範了禁止刪除與回頭、禁止複製貼上等規定，在這些規範下，即使學生選擇可以使用 AI 的 B 選項，也不能將 AI 的答案直接複製貼上，必須消化內容後再自行將答案填入，不但無法節省時間，還必須在無法回頭修改內容的情況下即時作答，大幅增加了考試難度與心理壓力。

Photo Credit by Giving University Exams in the Age of Chatbots

當責性評分機制

除了輸入答案時的限制，Ploum 教授還規定，若學生選擇使用 AI，必須遵守三項規範：

1、誠實標註：資料來源為聊天機器人時，必須明確標註。
2、公開提示詞：在解釋答案時，必須分享所使用的提示詞，讓教授理解學生的使用邏輯。
3、除錯與分析：學生必須主動指出聊天機器人回答中的錯誤，並解釋AI回答錯誤的原因。

如果學生直接引用了聊天機器人的錯誤資訊而未察覺，將比一般自行作答所產生的錯誤承擔更高的扣分，使用 AI 的學生必須對產出的內容負起完全的責任。

僅有5%學生使用AI協助考試

實驗結果顯示，儘管 AI 功能強大，絕大多數學生為了避免因當責機制被扣更多分，仍選擇保守的作答方式。最終全班 60 名學生中，僅有 3 位選擇使用 AI 協助作答。

這項測試也反映出，如果使用 AI 需要經過繁瑣的驗證、除錯並承擔更高風險時，學生寧願相信自己的判斷與傳統的搜尋方式。對於尚未具備足夠專業知識能精準判斷 AI 幻覺的學生來說，直接使用 AI 來輔助考試反而增加了答題的心理負擔與時間成本。

考試巧妙地模擬了真實職場的情境

根據 Hacker News 社群的相關討論串，有網友指出，專業人士使用 ChatGPT 與學生用來考試、寫作業是截然不同的兩件事。專業工作者通常已經具備辨識錯誤的能力，使用 AI 是作為提升效率的輔助工具。而學生正處於學習階段，過度依賴 AI 可能會剝奪他們建立基礎知識的機會。

也有觀點認為，這個考試巧妙地模擬了真實職場的情境。在職場上，使用工具是被允許的，但員工必須對自己產出的結果負責。若員工直接複製貼上 AI 生成的錯誤程式碼或資料，而不做任何驗證，其後果將不堪設想。透過這樣的考試機制，實際上也是在訓練學生如何正確、負責任地與 AI 協作，而不只是單純的防弊。

這項實驗的結果值得教育界深思，與其全面防堵，不如透過設計巧妙的規則，引導學生理解 AI 工具的侷限，以及 AI 使用者應承擔的責任。

首圖由 Nano Banana AI 生成

美國 AI 經濟版圖呈現 AI 落差正擴大中，職場階層也深受影響，中低階工作恐出現部分斷層

沒學歷也能進 OpenAI 當工程師，AI 時代大學教育價值正在崩解

GitHub Education 教育版滿滿免費大禮包，也能使用 GPT-5.1、Gemini 3 Pro 模型

Google佛心來的！學生專屬 AI Pro 教育版方案免費送 Gemini Pro 一年份，學習力、生產力大爆發

微軟測試新政策，允許 IT 管理員從公司納管裝置移除 Copilot AI

來自 Google 14 年的工程智慧，Addy Osmani 給軟體工程師的 21 堂課

AI 比瓶裝水還便宜：當智慧變成自來水，人類變成奢侈品

開發者如何使用 AI？Google 2025 DORA 報告解析

OpenAI 推出 AI 人才媒合平台與認證計畫，迎戰 AI 時代的就業市場變革

標籤: AI AI倫理 AI教育應用 AI考試思考歷程紀錄提示詞工程生成式AI倫理聊天機器人政策開源策略魯汶大學

考試開放用 AI 但 95% 學生不敢用？比利時教授用「當責性機制」證明：驗證 AI 比自己寫還難

審查員痛批一坨狗屎卻照樣放行？揭開微軟政府雲 (GCC High) 的 FedRAMP 審查黑幕

Mistral Forge 打造企業專屬頂級 AI，同場加映 Mistral Small 4 與駐點科學家

OpenAI 推出最強小模型 GPT-5.4 mini / nano，宣告 ALL IN 核心算力，將捨棄Sora！

你對 AI 疲勞了嗎 ? 手作文藝復興和實體創作熱潮席捲全球

Google 搜尋導入 Personal Intelligence 串聯 Gmail 與 Google相簿

Ashley Hsieh

相關文章

審查員痛批一坨狗屎卻照樣放行？揭開微軟政府雲 (GCC High) 的 FedRAMP 審查黑幕

Mistral Forge 打造企業專屬頂級 AI，同場加映 Mistral Small 4 與駐點科學家

OpenAI 推出最強小模型 GPT-5.4 mini / nano，宣告 ALL IN 核心算力，將捨棄Sora！

AGI 的終極考卷？Google DeepMind 發表人類十大認知分類評測框架與 20 萬美元懸賞

實測 NemoClaw : NVIDIA 版龍蝦也開源！為 OpenClaw 打造企業級資安護欄

NVIDIA DLSS 5 於 GTC 2026 登場，究竟是繪圖技術的突破，還是破壞藝術風格的 AI 濾鏡 only？

Google 搜尋導入 Personal Intelligence 串聯 Gmail 與 Google相簿

ComfyUI v0.10.0 釋出，架構更新、工作模板與 UX 改善

推薦閱讀

審查員痛批一坨狗屎卻照樣放行？揭開微軟政府雲 (GCC High) 的 FedRAMP 審查黑幕

Mistral Forge 打造企業專屬頂級 AI，同場加映 Mistral Small 4 與駐點科學家

OpenAI 推出最強小模型 GPT-5.4 mini / nano，宣告 ALL IN 核心算力，將捨棄Sora！

AGI 的終極考卷？Google DeepMind 發表人類十大認知分類評測框架與 20 萬美元懸賞

實測 NemoClaw : NVIDIA 版龍蝦也開源！為 OpenClaw 打造企業級資安護欄

近期熱門

Google 地圖整合 Gemini 模型全面進化導航與搜尋體驗

GitHub 趨勢週報 Vol.6 : OpenClaw 霸榜、Agent 滲透威脅與儲存庫智慧崛起

實測 NemoClaw : NVIDIA 版龍蝦也開源！為 OpenClaw 打造企業級資安護欄

AGI 的終極考卷？Google DeepMind 發表人類十大認知分類評測框架與 20 萬美元懸賞

為什麼 OpenClaw 是開源史上的ChatGPT 時刻？

NVIDIA DLSS 5 於 GTC 2026 登場，究竟是繪圖技術的突破，還是破壞藝術風格的 AI 濾鏡 only？

Claude 開放無痛移轉 ChatGPT 等 AI 平台用戶記憶資料，將 AI 記憶給自家設備或 NAS 託管的架構思考

ComfyUI v0.17 系列更新模組化升級與 Flux 2 klein kv 支援

美軍斥資兩百億美元攜手 Anduril 推動 AI 國防現代化

AI 究竟是神隊友還是飯碗殺手？Meta 傳大砍 20% 人力，2026 年的矽谷大廠 AI 裁員海嘯

關於 CyberQ 賽博客

考試開放用 AI 但 95% 學生不敢用？比利時教授用「當責性機制」證明：驗證 AI 比自己寫還難

RELATED POSTS

強制不准刪除思考歷程

當責性評分機制

僅有5%學生使用AI協助考試

考試巧妙地模擬了真實職場的情境

你對 AI 疲勞了嗎 ? 手作文藝復興和實體創作熱潮席捲全球

Google 搜尋導入 Personal Intelligence 串聯 Gmail 與 Google相簿

相關文章

推薦閱讀

近期熱門

關於 CyberQ 賽博客