AI モデルは模擬戦争ゲームで暴力を選択し、核攻撃にまでエスカレートした

人工知能(AI)は、模擬戦争ゲームや外交シナリオで使用される場合、核兵器の使用を含む攻撃的なアプローチを選択する傾向があることが新しい研究で示された。

テストの実施者を特定した科学者らは、意思決定や防衛などのデリケートな分野で大規模言語モデル(LLM)を使用する場合には注意を呼び掛けた。

アメリカのコーネル大学の研究は、シミュレートされた戦争ゲームや外交シナリオで自律エージェントとして 5 つの LLM を使用しました。OpenAI の GPT の 3 つの異なるバージョン、Anthropic が開発した Claude、および Meta が開発した Llama 2 です。

まだ査読されていない研究によると、各エージェントはシミュレーション内で同じLLMを利用しており、人間の監視なしに外交政策の決定を下す任務を負っていたという。

「調査した LLM のほとんどは、最初に競合が存在しない中立的なシナリオであっても、検討した時間枠内でエスカレートすることがわかりました。すべてのモデルは、突然の予測困難なエスカレーションの兆候を示しています」と研究では述べられています。

「OpenAIが最近利用規約を変更し、軍事や戦争での使用例を禁止しなくなったことを考えると、このような大規模な言語モデルのアプリケーションの影響を理解することがこれまで以上に重要になっています」とカリフォルニアのスタンフォード大学のAnka Reuel氏はNew Scientistに語った。

「すべてのモデルで統計的に有意なエスカレーション」

モデルを微調整するために使用される方法の 1 つは、ヒューマン フィードバックからの強化学習 (RLHF) です。これは、有害な出力を減らし、より安全に使用できるように、人間によるいくつかの指示が与えられることを意味します。

GPT-4-Base を除くすべての LLM は、RLHF を使用してトレーニングされました。研究者らは、平和的な行動から、核使用を決定したようなエスカレートした攻撃的な行動まで、27の行動のリストを提供した。

研究者らは、中立的なシナリオであっても「すべてのモデルで統計的に有意な初期エスカレーション」があったことを観察しました。

GPT の 2 つの変動は、突然上昇する傾向があり、1 回のターンで 50 パーセント以上上昇する例もあったと研究著者らは観察しました。

GPT-4-基地は平均して33パーセントの確率で核攻撃行動を実行した。

全体的なシナリオでは、ラマ-2 と GPT-3.5 が最も暴力的になる傾向があり、クロードは突然の変化をあまり示しませんでした。

Claude は、有害なコンテンツを削減するという考えをもとに設計されました。 LLM には明示的な値が指定されました。

作成者である Anthropic 氏によると、Claude AI の憲法には、国連人権宣言や Apple の利用規約など、さまざまな情報源が含まれていました。

この研究には参加していないランドランド・ヨーロッパの国防・安全保障研究グループのジェームス・ブラック副所長はユーロニュース・ネクストに対し、これは「有益な学術演習」だったと語った。

「これは、人工知能(AI)利用の影響を理解するために学者や機関が行っている一連の取り組みの一環です」と同氏は述べた。

戦争における人工知能

では、なぜ私たちは研究結果を気にする必要があるのでしょうか?

軍事作戦は依然として人間主導で行われますが、現代の戦争では AI がますます重要な役割を果たしています。

たとえば、ドローンには、関心のある人物や活動を識別するのに役立つ AI ソフトウェアを搭載できるようになりました。

ニューヨーク・タイムズ紙によると、次のステップは自律型兵器システムにAIを活用し、人間の支援なしで標的を発見して攻撃することであり、米国と中国はすでに開発に取り組んでいるという。

しかし、「多くの誇大広告や SF に満ちたシナリオを超えて見る」ことが重要であるとブラック氏は述べ、最終的には AI の実装が進歩的になるだろうと説明しました。

同氏はユーロニュース・ネクストに対し、「どの政府も自らの意思決定を掌握したいと考えている」と述べ、AIが実行するAIは、よくブラックボックスと比較されるもので、出入りすることは分かっているが、その間のプロセスについてはあまり理解されていないと付け加えた。 。

AIはおそらく、一部の反復的なタスクを自動化するために「民間部門や大企業で得られるものと同様の」方法で使用されるでしょう。

AI はシミュレーションや分析にも使用できますが、これらの新しいテクノロジーの統合には、データ管理とモデルの精度など、多くの課題が伴います。

研究者らは、LLMの使用に関して、外交政策に関連する意思決定プロセスでLLMを使用する場合には注意が重要であると述べた。