OpenAI представила покращений генератор зображень на базі GPT-4o для ChatGPT
Джерело: GPT-4o
OpenAI представила нову функцію генерації зображень на базі моделі GPT-4o, доступну для користувачів ChatGPT. Функція стане стандартною для всіх версій ChatGPT, і дозволяє створювати високоякісні зображення без необхідності окремого вибору моделі, як це було з DALL-E.
Генерація зображень на основі GPT-4o відрізняється від попередніх версій завдяки покращеній здатності точніше відтворювати текст, логотипи та інші складні елементи. Завдяки великій мультимодальній моделі, GPT-4o також може працювати з текстом, зображеннями, аудіо і відео, що дозволяє створювати зображення з різними об’єктами та сценаріями за допомогою лише одного запиту.
Для користувачів з безоплатним доступом залишаються колишні ліміти генерації (до трьох зображень на день), однак нова система демонструє кращу точність при створенні текстових елементів на зображеннях, у порівнянні з попередніми моделями. Оновлена система генерує зображення поетапно, зверху вниз і зліва направо, що дозволяє забезпечити більш детальне і коректне відображення всіх елементів.
Нова функція також дозволяє редагувати завантажені зображення, створюючи нові варіанти, використовуючи наявні зображення як візуальні натхнення.
Оскільки GPT-4o є “омніомодальною” моделлю, що працює з текстом, зображенням, аудіо та відео, вона здатна краще розуміти промпти користувачів, коли потрібно створити кілька об’єктів на зображенні.
Букви зібрали приклади згенерованих картинок, серед яких — варіації популярних мемів та реальних постатей.
Однак у моделі є певні обмеження:
- Через підвищену деталізацію створення зображення може займати до однієї хвилини.
- Довгі зображення, такі як постери, можуть обрізатися надто щільно, особливо в нижній частині.
- Якщо в запиті недостатньо контексту, модель може “додумувати” деталі.
- При створенні складних концепцій, наприклад, повної періодичної таблиці, модель може неточно відтворювати більше ніж 10-20 об’єктів одночасно.
- Символи можуть відображатися некоректно або спотворюватися.
- Виправлення окремих деталей (наприклад, орфографічних помилок) не завжди працює без побічних змін у зображенні.
- Модель може некоректно відображати дрібні деталі.
OpenAI активно працює над поліпшенням цих аспектів у найближчі місяці.
Завдяки вдосконаленим заходам безпеки система блокуватиме можливість створення шкідливих зображень, таких як сексуальні підробки, а також запити на генерацію CSAM.
Усі зображення, створені за допомогою цієї технології, матимуть метадані C2PA, що позначатимуть їх як створені OpenAI.
- Компанія OpenAI планує випустити ранню версію нової функції ChatGPT, яка дозволить користувачам планувати прості завдання “на потім”.
- Чат-бот на основі штучного інтелекту ChatGPT тепер може говорити з користувачами голосом Санта-Клауса. Така функція буде доступна лише до кінця року.
- OpenAI анонсував інтеграцію веб-пошуку в ChatGPT, що дозволяє користувачам отримувати актуальні відповіді з посиланнями на перевірені джерела. Функція доступна для користувачів ChatGPT Plus, Team, і поступово впроваджується для безплатних облікових записів.
- ChatGPT, який надає доступ до новин через інтернет-пошук, почав пропонувати росіянам інформацію з підконтрольних Кремлю російських медіа.
Президент США Дональд Трамп ухвалив рішення про захоплення російських танкерів “тіньового флоту”, а також схвалив просування законопроєкту про “нищівні санкції” проти РФ після того, як дедалі більше розчаровувався у Володимирі Путіні та почав сприймати його як головну перешкоду для припинення війни проти України.
Національна портретна галерея у Вашингтоні оновила експозицію, присвячену Дональду Трампу. З опису до портрета зникли будь-які згадки про два імпічменти та штурм Капітолія, що викликало дискусії щодо політичного тиску на культурні установи.
Швеція витратить 15 мільярдів шведських крон (1,6 мільярда доларів) на протиповітряну оборону, спрямовану, переважно на захист цивільного населення та цивільної інфраструктури.
Більшість країн ЄС проголосували за підписання угоди про вільну торгівлю з провідними державами Латинської Америки. Цей крок дозволить створити найбільший у світі торгівельний простір, що охопить близько 700 мільйонів споживачів.
В Ірані загострюється протистояння між протестувальниками та силовиками, що призвело до масових жертв у багатьох містах країни. На тлі жорстокого придушення мітингів США розглядають варіанти військового втручання, тоді як Тегеран обіцяє атакувати американські бази та Ізраїль.























