レディング大学の研究者は、AIが書いた解答を試験に提出するという興味深い研究を行った。その結果は人間の学生の解答よりも驚くほど優れており、教授たちはAIの解答と人間の解答を区別できなかった。

研究者らは、AIが生成した編集されていない回答を提出するために、33人の偽の学生IDを作成した。回答は、心理学テストにおける学部生のオンライン評価用にChatGPT-4の助けを借りて生成された。研究者らは、短答式およびエッセイ形式の63の質問に対するAI回答を提出したが、論文を採点していた教授らには、この研究について知らされていなかった。

大学は手書きの試験には戻らない

何も知らされていなかった大学教授たちは、33 の試験提出物のうち 1 つだけを AI が書いたものだと特定しました。同時に、他の 32 の提出物は見破られず、実際の学生よりも高い点数を獲得しました。実際の数字では、AI が書いた提出物の 83% が人間の学生よりも高い点数を獲得しました。

関連記事:中国の教育用AIアプリが米国で市場を獲得

この研究はエティエンヌ・ロッシュ教授とピーター・スカーフ准教授が主導した。スカーフ准教授は、彼らの研究は学術評価の完全性とAIがそれに及ぼす影響について国際的に重要であることを示していると述べた。彼は次のように述べた。

「必ずしも完全に手書きの試験に戻るわけではないが、世界の教育分野はAIに直面して進化する必要があるだろう。」

スカーフ教授は、ほとんどの教育機関がより公平な評価を確実にするために従来の手順から移行したと述べた。両教授は、自分たちの研究結果が「教育者への警鐘」であると強調した。

AIエッセイの検出率は低い

研究者らは、AIエッセイはほぼ検出不可能であり、その94%がチェッカーに問題を引き起こさなかったことを明らかにした。この研究を発表したジャーナルPlos Oneは、検出率の低さは過大評価である可能性が高いと述べた。

「AIの提出物は実際の学生の提出物よりも確実に高い成績を獲得したため、これは特に心配です。」

同誌はまた、学生がAIを使って不正行為をしても罰せられないと指摘している。AIを使わない正直な学生よりも高い点数を取れる可能性もある。この研究では、AIが生成した解答が偽の身元を使って1年生から3年生のモジュールに提出された。AIは1年生と2年生のモジュールで人間の学生を上回った。

しかし、3年生の試験では人間のほうが良い成績を収めた。研究者らは、これは少なくとも現状ではAIは「抽象的推論」が得意ではないという考えと一致していると述べた。

AIにはまだ推論能力が欠けている

この研究では、AIの推論能力は時間とともに向上し、検出可能性は低下するとも指摘されている。これにより、学問的誠実さを維持することがより困難になるだろう。研究者らは、この研究により持ち帰り試験や監督なし試験が廃止される可能性があると述べた。

ロッシュ教授は、教育界は学生が仕事でAIをどのように活用できるかについて合意する必要があると述べた。社会全体の信頼を維持するために、他の分野でAIを活用する場合も同様であると主張した。

こちらもお読みください:高等教育の入学者数の減少に対処するためのテクノロジーソリューションが登場

レディング大学の教育担当副学長エリザベス・マクラム教授は、大学は持ち帰り試験を制限していると述べた。同教授は、大学は実生活の状況、特に「職場に関連したシナリオ」で知識を応用することを要求する他の方法の開発に取り組んでいると述べた。

マクラム氏は、学生が倫理的にAIを使用する方法を知ることができるように、一部の評価ではAIの使用が許可されると明言した。しかし、他の課題では人工知能ツールの使用は要求されない。教授は、これにより学生のAIリテラシーが向上し、現代の職場の要件に備えることができると述べた。

クリプトポリタンのアーミル・シェイク記者によるレポート