Білий дім підтримав тестову хакерську атаку на ШІ, щоб перевірити, наскільки він безпечний

Джерело: Politico

Адміністрація Байдена підтримала навмисну скоординовану тестову атаку на системи штучного інтелекту (ШІ) під назвою red-teaming, яка триватиме три дні, щоб перевірити безпечність системи.

Кілька провідних компаній, включаючи OpenAI, Google і Meta, погодилися на атаки деяких з їхніх найновіших і найпотужніших систем ШІ для навчання.

Хакерська атака підкреслює те, що стало одним із ключових занепокоєнь Білого дому щодо потужних нових моделей ШІ: наскільки вони насправді безпечні та чи будуть вони становити загрозу для американських громадян або для національної безпеки в усьому світі. 

“Наша концепція – і це виходить від президента – полягає в тому, що для використання можливостей штучного інтелекту нам спершу потрібно також керувати ризиками”, – сказав Алан Міслов, старший чиновник управління науково-технічної політики Білого дому.

Він допоміг хакерам розробити командні вправи для перевірки ШІ. 

Компанії технологічної індустрії традиційно неохоче виставляли програмне забезпечення на загальний огляд для тестування. Але цього року, на заклик Білого дому, технологічні компанії OpenAI, Anthropic, Google, Hugging Face, NVIDIA, Meta, Cohere та Stability запропонували свої великі мовні моделі для ретельного вивчення.

Вони нададуть закриті версії своїх моделей для атаки з боку різноманітних хакерів – від звичайних досвідчених відвідувачів конференції до студентів місцевих коледжів, які прилетіли спеціально задля цього завдання.

Компанії погодилися, хоча є певні умови: результати тренувань не будуть оприлюднені до лютого, тож вони зможуть виправити помилки або проблеми, перш ніж користувачі про них дізнаються.

Очікується, що В’єтнам і Росія підпишуть енергетичні угоди під час чотириденного візиту прем’єр-міністра В’єтнаму Фам Мінь Чіня до Москви, який розпочався в неділю.

Нове дослідження UNFPA – фонду ООН, який працює у сфері гендерної рівності, репродуктивного здоров’я та розбудови потенціалу молоді, – виявило поширені випадки неналежного ставлення до жінок під час пологів у Східній Європі та Центральній Азії.

Власник платформи OnlyFans Леонід Радвінський помер від раку у віці 43 років.

Українські полярники здобули кілька перемог у Конкурсі наукових зображень для Вікіпедії. У різних номінаціях вони отримали три перших місця та одне третє – це найбільша кількість перемог для українських учасників за весь час проведення конкурсу.

Іран спростував заяви американської сторони щодо переговорів, заявивши, що контакти з Вашингтоном відсутні, натомість відтермінування ударів по іранській енергетиці Дональдом Трампом насправді викликане побоюваннями глобальної економічної кризи.