OpenAI представила покращений генератор зображень на базі GPT-4o для ChatGPT
Джерело: GPT-4o
OpenAI представила нову функцію генерації зображень на базі моделі GPT-4o, доступну для користувачів ChatGPT. Функція стане стандартною для всіх версій ChatGPT, і дозволяє створювати високоякісні зображення без необхідності окремого вибору моделі, як це було з DALL-E.
Генерація зображень на основі GPT-4o відрізняється від попередніх версій завдяки покращеній здатності точніше відтворювати текст, логотипи та інші складні елементи. Завдяки великій мультимодальній моделі, GPT-4o також може працювати з текстом, зображеннями, аудіо і відео, що дозволяє створювати зображення з різними об’єктами та сценаріями за допомогою лише одного запиту.
Для користувачів з безоплатним доступом залишаються колишні ліміти генерації (до трьох зображень на день), однак нова система демонструє кращу точність при створенні текстових елементів на зображеннях, у порівнянні з попередніми моделями. Оновлена система генерує зображення поетапно, зверху вниз і зліва направо, що дозволяє забезпечити більш детальне і коректне відображення всіх елементів.
Нова функція також дозволяє редагувати завантажені зображення, створюючи нові варіанти, використовуючи наявні зображення як візуальні натхнення.
Оскільки GPT-4o є “омніомодальною” моделлю, що працює з текстом, зображенням, аудіо та відео, вона здатна краще розуміти промпти користувачів, коли потрібно створити кілька об’єктів на зображенні.
Букви зібрали приклади згенерованих картинок, серед яких — варіації популярних мемів та реальних постатей.
Однак у моделі є певні обмеження:
- Через підвищену деталізацію створення зображення може займати до однієї хвилини.
- Довгі зображення, такі як постери, можуть обрізатися надто щільно, особливо в нижній частині.
- Якщо в запиті недостатньо контексту, модель може “додумувати” деталі.
- При створенні складних концепцій, наприклад, повної періодичної таблиці, модель може неточно відтворювати більше ніж 10-20 об’єктів одночасно.
- Символи можуть відображатися некоректно або спотворюватися.
- Виправлення окремих деталей (наприклад, орфографічних помилок) не завжди працює без побічних змін у зображенні.
- Модель може некоректно відображати дрібні деталі.
OpenAI активно працює над поліпшенням цих аспектів у найближчі місяці.
Завдяки вдосконаленим заходам безпеки система блокуватиме можливість створення шкідливих зображень, таких як сексуальні підробки, а також запити на генерацію CSAM.
Усі зображення, створені за допомогою цієї технології, матимуть метадані C2PA, що позначатимуть їх як створені OpenAI.
- Компанія OpenAI планує випустити ранню версію нової функції ChatGPT, яка дозволить користувачам планувати прості завдання “на потім”.
- Чат-бот на основі штучного інтелекту ChatGPT тепер може говорити з користувачами голосом Санта-Клауса. Така функція буде доступна лише до кінця року.
- OpenAI анонсував інтеграцію веб-пошуку в ChatGPT, що дозволяє користувачам отримувати актуальні відповіді з посиланнями на перевірені джерела. Функція доступна для користувачів ChatGPT Plus, Team, і поступово впроваджується для безплатних облікових записів.
- ChatGPT, який надає доступ до новин через інтернет-пошук, почав пропонувати росіянам інформацію з підконтрольних Кремлю російських медіа.
Увечері, 29 березня російські війська завдали удару по військовому госпіталю у місті Харків. Внаслідок ураження БпЛА типу “Shahed” пошкоджено будівлю шпиталю та розташовані поруч житлові будинки.
У Генеральному штабі ЗСУ поінформували про оперативну ситуацію на фронті станом на 22:00 29 березня. Загалом, від початку доби відбулося 198 бойових зіткнень.
Президент Володимир Зеленський заявив, що Україна чекає на реакцію Сполучених Штатів та Європи у відповідь на щоденні атаки російських “шахедів”.
Російські війська ввечері 29 березня атакували Харків безпілотниками.
Сьогодні, 29 березня в Стамбулі відбулися масові протести, на яких сотні тисяч турків виступили проти арешту мера міста, Екрема Імамоглу, який є головним суперником Реджепа Тайїпа Ердогана.