AIが生成した試験問題は94%のケースで検出されないことが研究で判明

公開日

この記事をシェアする

AIが生成して試験のために提出された論文を検出することはほぼ不可能であることが、研究で判明した。

英国の大学の試験システムの最近のテストでは、人工知能(AI)によって生成されたほぼすべての提出物が検出されませんでした。

レディング大学の研究者らによると、AIが生成した論文は実際の学生が書いた論文と比べて平均して高い成績を獲得したという。彼らは研究結果をオープンアクセスで発表しましたジャーナルPLOS ONE

人工知能は試験に合格できることがすでに証明されているため、一部の学校や大学では学生が ChatGPT などの利用可能な AI ツールを使用することを禁止しています。

しかし、新しい研究によると、このルールを適用することは困難であることが判明しました。

研究者らは、大学の心理学の学士号を取得するために、AIが作成した5つの異なるコースの試験を提出した。

彼らは、「チューリングテスト」ケーススタディと呼ばれるもので、これらの提出物の94パーセントが検出されないことを発見しました。

1950 年に英国の数学者でコンピューター科学者のアラン チューリングにちなんで名付けられたこの指標は、人間と同様の知的動作を示す機械の能力を測定します。

「非常に懸念している」

著者らは、特に「AIが生成した回答の内容」が研究者によって変更されていなかったため、この発見は「非常に憂慮すべき」ものだと述べた。

「全体として、6%という検出率は、試験でカンニングをするためのAIの現実世界での使用を検出する能力を過大評価している可能性が高い」と研究者らは研究の中で指摘し、学生がAIの出力を変更して不正行為を行う可能性がより高いと付け加えた検出されにくくなります。

さらに、83.4 パーセントの場合、AI が生成した提出物は、実際の学生から同じ数の試験を無作為に選択したグループと比較して、より高い成績を収めました。

1 つの例外は、より抽象的な推論を含むモジュールで、実際の学生と比較して AI が管理するのは難しいものです。

「『試験チューリング・テスト』の結果は、世界の教育セクターに新たな常態を受け入れるよう促しており、これがまさに私たちがレディング大学で行っていることだ」と研究の著者らは声明で述べた。

「新しい方針とスタッフと学生へのアドバイスは、人工知能を利用したツールによってもたらされるリスクと機会の両方を認識しています」と彼らは付け加えた。

研究者らは、これらの調査結果を踏まえて学術的誠実性について懸念を表明し、監督付きの対面試験がこの問題を軽減できる可能性があると示唆した。

しかし、AI ツールが進化し続け、専門的な環境で普及するにつれて、大学は「新しい常態」の一部として AI を教育に統合する方法を模索する必要があるかもしれません。

アクセシビリティのショートカットに移動

あなたも気に入るかもしれません