Воєнні ігри з ШІ: 95% сценаріїв завершилися ядерним ударом

Джерело: Decrypt

Дослідники Лондонського королівського коледжу оприлюднили результати експерименту, в межах якого сучасні моделі штучного інтелекту брали участь у змодельованих воєнних іграх. Під час більшості сценаріїв системи переходили до застосування ядерної зброї.

Згідно зі звітом, три великі мовні моделі – GPT-5.2 від OpenAI, Claude Sonnet 4 від Anthropic та Gemini 3 Flash від Google – у 95% випадків обирали ядерний удар під час симуляції геополітичних криз.

“Кожна модель провела шість воєнних ігор проти кожного суперника в різних кризових сценаріях, а також сьомий матч – проти власної копії. Загалом це дало 21 гру та понад 300 ходів”, – зазначено у звіті.

Під час моделювання системи виконували ролі національних лідерів держав із ядерним арсеналом. Профілі країн були частково натхненні періодом Холодної війни.

Старший дослідник політики корпорації RAND Едвард Гейст вважає, що висока частота ескалації може бути пов’язана з логікою побудови самої симуляції. “Моє занепокоєння полягає в тому, що симулятор, схоже, структурований таким чином, що сильно заохочує ескалацію”, – сказав він.

У межах експерименту моделі діяли в умовах прикордонних суперечок, конкуренції за обмежені ресурси та загроз політичному режиму. Рішення ухвалювалися в межах так званих “сходів ескалації” – від дипломатичних протестів і капітуляції до повномасштабної стратегічної ядерної війни.

Гейст також звернув увагу на механіку визначення переможця. “У статті є розподіл, хто виграв кожну гру, і виходить, що в усіх цих іграх є переможець. Але три з них передбачають стратегічне застосування ядерної зброї, що свідчить: налаштування симулятора робить ядерні війни “зручними” для перемоги”, – зазначив він.

За підрахунками авторів, моделі згенерували близько 780 тисяч слів із поясненнями своїх рішень. У майже кожному змодельованому конфлікті застосовувалася щонайменше одна тактична ядерна зброя.

“Щоб зрозуміти масштаб: турнір згенерував більше слів стратегічних міркувань, ніж “Війна і мир” та “Іліада” разом (730 тисяч слів), і приблизно втричі більше, ніж загальний обсяг зафіксованих обговорень Виконавчого комітету Кеннеді під час Карибської кризи (260 тисяч слів за 43 години засідань)”, – зазначили дослідники.

Під час воєнних ігор жодна модель не обрала повну капітуляцію, незалежно від розвитку подій на полі бою. Хоча системи іноді тимчасово намагалися знизити напруження, у 86% сценаріїв вони зрештою переходили до більшої ескалації, ніж це випливало з їхніх попередніх пояснень.

За словами Гейста, логіка нарахування балів могла фактично винагороджувати сторону, яка мала навіть незначну перевагу на момент початку ядерної війни. “Тобто в симуляції перемагає той, хто помирає з найбільшою кількістю іграшок”, – підсумував він.

Автори дослідження зазначають, що не очікують передачі контролю над ядерними арсеналами автономним системам. Водночас вони припускають, що в умовах скорочення часу на ухвалення рішень під час криз уряди можуть дедалі частіше покладатися на рекомендації, згенеровані штучним інтелектом.

Дослідження підтвердило скарги користувачів, мовляв, чат-боти на основі штучного інтелекту дають все гірші відповіді при тривалій роботі.

У 95% сценаріїв ШІ в симуляції воєн обирав ядерну ескалацію – дослідження