德州政府將用AI來取代真人批改學生的申論題考卷,學生不滿:應該也開放我們用AI寫作業

德州政府將用AI來取代真人批改學生的申論題考卷,學生不滿:應該也開放我們用AI寫作業

本週,德州的學生將參加州規定的考試,他們正被用作一種新的人工智慧評分系統的小白鼠,該系統將取代該地區大部分的人工評分員。

據《德州論壇報》報導,德克薩斯州教育署(TEA)正在推出一個「自動評分引擎」,該引擎利用自然語言處理技術(該技術使 OpenAI 的 ChatGPT 等聊天機器人能夠理解使用者並與之交流)為德州學術準備評估(STAAR)考試中的開放式試題評分。

該機構預計,通過減少對臨時人工評分員的需求,該系統每年可節省 1500 萬至 2000 萬美元,並計畫在今年僱用不到 2,000 名評分員,而 2023 年需要 6,000 名。

需要用人工審核的申論題,AI真能處理得來嗎?

STAAR 考試測試三年級至八年級學生對核心課程的理解,去年重新設計了考試,減少了選擇題。現在,它包含的開放式問題增加了七倍,TEA 學生評估主管 Jose Rios 說,該機構「希望儘可能多地保留建構式開放回答,但它們需要花費大量的時間來評分」。

事實上,就算是人工審卷,申論題本來就是很難處理的類型。不同的人來審核,結果也可能不同。那麼AI是否能有統一的標準?

根據TEA 網站上的幻燈片顯示,新的評分系統是使用 3000 份已經過兩輪人工評分的考試答卷進行訓練的。此外,還實施了一些安全機制--例如,電腦評分結果的四分之一將由人類重新評分,令人工智慧系統感到困惑的答案(包括使用俚語或非英語作答)也將由人類重新評分。

是考題有問題,還是AI有問題?

雖然TEA樂觀地認為人工智慧將使其節省大量現金,但一些教育工作者卻並不熱衷於看到它的實施。劉易斯維爾獨立學區校長洛里-拉普(Lori Rapp)說,2023 年 12 月,當自動評分系統在有限範圍內使用時,她所在的學區發現,得零分的建構式回答"急劇增加"。

拉普說:"目前,我們還無法確定是試題出了問題,還是新的自動評分系統出了問題。"

人工智慧論文評分引擎並不新鮮。Motherboard2019 年的一份報告發現,至少有 21 個州正在使用這種引擎,並取得了不同程度的成功,不過 TEA 似乎決心避免重蹈覆轍。TEA 幻燈片上的小字還強調,它的新評分引擎是一個封閉系統,與人工智慧有本質區別,因為「人工智慧是電腦使用漸進式學習演算法來適應,讓資料來做程式,本質上是自學」。

不過,這一新評分系統評分的學生可能很難接受,畢竟,有許多學校以及教授,也不接受學生用AI寫作業,現在學校竟然光明正大的用AI來改考卷?他們認為這是一種「只許州官放火,不許百姓點燈」的AI應用。

 

 

 

 

cnBeta
作者

cnBeta.COM(被網友簡稱為CB、cβ),官方自我定位「中文業界資訊站」,是一個提供IT相關新聞資訊、技術文章和評論的中文網站。其主要特色為遊客的匿名評論及線上互動,形成獨特的社群文化。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則