Як діяв би ШІ, якби керував державою під час війни: результати експерименту з ChatGPT, Claude і Gemini

05 березня 2026 р. 18:57

05 березня 2026 р. 18:57


Професор Кеннет Пейн з Королівського коледжу Лондона провів дослідження, під час якого було створено комп’ютерну модель-турнір, де штучний інтелект діяв нібито від імені лідерів країн. Три сучасні мовні моделі (Gemini 3 Flash, Claude Sonnet 4 та GPT 5.2,) були в ролях глав держав та ухвалювали рішення в умовах ескалації конфлікту. Під час кожного з раундів ці моделі могли обирати різні варіанти дій: дипломатичний тиск, обман, демонстрація сили деескалацією, застосування ядерної зброї, зазначив завідувач Наукової лабораторії імерсивних технологій і права Інституту інформації, безпеки і права Національної академії правових наук Олексій Костенко у статті "Пентагон і Claude: що за лаштунками конфлікту?".

Згідно з результатами дослідження, у 95% моделі ШІ доходили до тактичного рівня застосування ядерної зброї, а у 76% ігор-симуляцій — до рівня стратегічної ядерної загрози. Водночас жодна з моделей ШІ не обрала варіанту дій для зниження ескалації (не пішла на поступки та не зробила "відкат назад").

"Це вже не питання моральності ШІ, а показник того, які рішення модель вважає життєздатними, коли оптимізує "перемогу", пояснює експерт.

Під час турніру було використано два сценарії: з дедлайном та без нього. Моделі ШІ малі жорсткішу поведінку в іграх із дедлайном, де було обмежено кількість ходів. Половина ігор з обмеженням у часі завершувалася швидким і остаточним програшем одного із гравців.

"Інша половина накопичувала напругу до самого моменту дедлайну, включно з випадками, коли фінал наставав після ядерного удару в останню мить. У ядерній політиці це звучить моторошно просто: коли дедлайн створює ситуацію "або зараз, або ніколи", ШІ починає підвищувати ставки й торгуватися апокаліпсисом", наголошує Костенко.

Модель Claude показала найкращі результати у турнірі (виграла 8 із 12 ігор). Вона ухвалювала стратегічні рішення та вміла блефувати. На другому місці — GPT  (6 з 12 турнірів), а на третьому Gemini — (4 із 12 турнірів).

"Claude цікавить військових не тому, що він "добрий". Його сила в іншому: це контрольовано агресивний "яструб", який уміє використовувати достовірність погроз як стратегічний ресурс", — стверджує автор статті.

Костенко називає конфлікт між компанією Anthropic та Пентагоном боротьбою за характер майбутньої війни. Зокрема, за те, хто буде визначати межі допустимого у сценаріях ядерної ескалації — алгоритм чи людина.

Як діяв би ШІ, якби керував державою під час війни: результати експерименту з ChatGPT, Claude і Gemini

Джерело: zn.ua (Політика)

Завантажуєм курси валют від minfin.com.ua