У 95% сценаріїв ШІ в симуляції воєн обирав ядерну ескалацію – дослідження

Джерело: Decrypt

Дослідники Лондонського королівського коледжу оприлюднили результати експерименту, в межах якого сучасні моделі штучного інтелекту брали участь у змодельованих воєнних іграх. Під час більшості сценаріїв системи переходили до застосування ядерної зброї.

Згідно зі звітом, три великі мовні моделі – GPT-5.2 від OpenAI, Claude Sonnet 4 від Anthropic та Gemini 3 Flash від Google – у 95% випадків обирали ядерний удар під час симуляції геополітичних криз.

“Кожна модель провела шість воєнних ігор проти кожного суперника в різних кризових сценаріях, а також сьомий матч – проти власної копії. Загалом це дало 21 гру та понад 300 ходів”, – зазначено у звіті.

Під час моделювання системи виконували ролі національних лідерів держав із ядерним арсеналом. Профілі країн були частково натхненні періодом Холодної війни.

Старший дослідник політики корпорації RAND Едвард Гейст вважає, що висока частота ескалації може бути пов’язана з логікою побудови самої симуляції. “Моє занепокоєння полягає в тому, що симулятор, схоже, структурований таким чином, що сильно заохочує ескалацію”, – сказав він.

У межах експерименту моделі діяли в умовах прикордонних суперечок, конкуренції за обмежені ресурси та загроз політичному режиму. Рішення ухвалювалися в межах так званих “сходів ескалації” – від дипломатичних протестів і капітуляції до повномасштабної стратегічної ядерної війни.

Гейст також звернув увагу на механіку визначення переможця. “У статті є розподіл, хто виграв кожну гру, і виходить, що в усіх цих іграх є переможець. Але три з них передбачають стратегічне застосування ядерної зброї, що свідчить: налаштування симулятора робить ядерні війни “зручними” для перемоги”, – зазначив він.

За підрахунками авторів, моделі згенерували близько 780 тисяч слів із поясненнями своїх рішень. У майже кожному змодельованому конфлікті застосовувалася щонайменше одна тактична ядерна зброя.

“Щоб зрозуміти масштаб: турнір згенерував більше слів стратегічних міркувань, ніж “Війна і мир” та “Іліада” разом (730 тисяч слів), і приблизно втричі більше, ніж загальний обсяг зафіксованих обговорень Виконавчого комітету Кеннеді під час Карибської кризи (260 тисяч слів за 43 години засідань)”, – зазначили дослідники.

Під час воєнних ігор жодна модель не обрала повну капітуляцію, незалежно від розвитку подій на полі бою. Хоча системи іноді тимчасово намагалися знизити напруження, у 86% сценаріїв вони зрештою переходили до більшої ескалації, ніж це випливало з їхніх попередніх пояснень.

За словами Гейста, логіка нарахування балів могла фактично винагороджувати сторону, яка мала навіть незначну перевагу на момент початку ядерної війни. “Тобто в симуляції перемагає той, хто помирає з найбільшою кількістю іграшок”, – підсумував він.

Автори дослідження зазначають, що не очікують передачі контролю над ядерними арсеналами автономним системам. Водночас вони припускають, що в умовах скорочення часу на ухвалення рішень під час криз уряди можуть дедалі частіше покладатися на рекомендації, згенеровані штучним інтелектом.

На платформі GitHub з’явився Mytets Plugin – розширення для Claude Code, що змушує штучний інтелект спілкуватися в манері героїв творів Леся Подерв’янського. Київський айтівець Роман Радер випустив жартівливий плагін, який інтегрує специфічний стиль драматурга Леся Подерв’янського в роботу ШІ-асистента.

Популярний електромобіль Xiaomi SU7 став смертельною пасткою для свого власника під час аварії, що сталася у жовтні 2025 року в Ченду. Відмова електронної системи дверей не дозволила врятувати водія з палаючого автомобіля.

Bad Bunny зіграє головну роль в історичній драмі “Порто-Рико”. Це буде його перша велика роль у кіно після появ у фільмах “Швидкісний поїзд” та “Спіймати на гарячому”.

У вівторок вдень у центрі Омахи, штат Небраска, через прорив водогону утворилося велике провалля, яке миттєво поглинуло два автомобілі, що стояли на світлофорі.

Більшість американців почали частіше сумніватися в тому, чи Дональд Трамп зберігає достатню ясність розуму та витривалість для виконання обов’язків президента. Про це свідчать результати кількох опитувань, оприлюднених останнім часом.