OpenAI презентувала функцію двостороннього голосового перекладу: деталі оновлення ChatGPT4o

Джерело: TechCrunch

13 травня компанія OpenAI презентувала удосконалену голосову модель штучного інтелекту GPT4 Omni, що буде доступна безплатно для усіх користувачів.

OpenAI представила свою нову модель GPT4 Omni у межах презентації Spring Update.

Доступ до неї видаватиметься поступово протягом кількох тижнів, аби уникнути перевантаження серверів.

Головна технічна директорка OpenAI Міра Мураті зауважила, що ChatGPT відтепер матиме можливості пам’яті, тобто навчатися з попередніх розмов із користувачами та виконувати переклад у реальному часі.

Під час презентації розробники продемонстрували realtime переклад двома мовами.

На цей час модель знає 50 мов. Користувач зможе робити голосовий переклад у режимі реального часу. Тож надалі можна буде використовувати GPT-4o у прямому мовленні між людьми.

Окрім цього, GPT-4o може вирішувати задані рівняння. Також модель можна буде використовувати під час планування витрат.

Зокрема для демонстрації роботи нової версії ChatGPT керівники компанії запропонували моделі у режимі реального часу надати інструкції щодо розв’язання математичної задачі, розповісти казку перед сном і заспівати.

Так, на зауваження щодо необхідності дати “більше емоцій”, ChatGPT повернувся до початку казки та справді більш емоційно розпочав розповідь. Також з проханням перейти на голос “робота”, модель з легкістю впоралася з таким завданням.

Загалом з анонсованих нововведень:

  • 50 мов, перекладу текстів поліпшили на 50%;
  • нова версія зберігає всі інтонації, сміється і навіть запинається;
  • працює з текстом, картинками та аудіо;
  • шукає інформацію в інтернеті;
  • пише код у 10 разів швидше за звичайну GPT-4;
  • відповідає на запитання по відео у реальному часі.

Зауважимо, на початку травня сервіс для вивчення іноземних мов Duolingo звітував про зростання квартального виторгу на 45%, одначе акції подешевшали на 18% за день. У звітності за перший квартал Duolingo повідомив про уповільнення темпів приросту нових користувачів.

Одначе, вже 13 травня акції Duolingo знову впали на понад 4%.

Довідка. ChatGPT4o – літера “o” у назві — це скорочення від “omni” (“всебічний”). Нова версія моделі працює з мовою, текстом та відео. GPT-4o в середньому реагує на аудіо за 320 мілісекунд, що можна порівняти з часом реакції людини в розмові

Netflix планує розпочати зйомки нового серіалу за мотивами “Скубі-Ду” у квітні 2026 року.

У Вашингтоні розробили механізм протидії “авторитаризму та самолюбству” у вищих ешелонах влади. Нова ініціатива SERVE передбачає повну заборону на використання імен чинних лідерів країни в назвах лікарень, парків чи культурних центрів.

На тлі того, що прем’єр-міністр Канади Марк Карні 14 січня прибуває до Китаю, Пекін бачать можливість хоча б трохи відірвати країну від США.

Генеральний секретар НАТО Марк Рютте заявив, що Росія під час наступу на Україну щомісяця втрачає до 25 тисяч осіб. Мова саме про загиблих російських військових.

Бельгійський артдилер Клаас Мюллер заявив, що три роки тому придбав на онлайн-аукціоні роботу, яку нині вважають раніше невідомим етюдом художника епохи бароко Пітера Пауля Рубенса. Йдеться про зображення голови, яке можна сприймати як портрет літнього чоловіка з бородою або як обличчя молодої жінки з довгим волоссям, приховане в цій бороді.