OpenAI презентувала функцію двостороннього голосового перекладу: деталі оновлення ChatGPT4o

Джерело: TechCrunch

13 травня компанія OpenAI презентувала удосконалену голосову модель штучного інтелекту GPT4 Omni, що буде доступна безплатно для усіх користувачів.

OpenAI представила свою нову модель GPT4 Omni у межах презентації Spring Update.

Доступ до неї видаватиметься поступово протягом кількох тижнів, аби уникнути перевантаження серверів.

Головна технічна директорка OpenAI Міра Мураті зауважила, що ChatGPT відтепер матиме можливості пам’яті, тобто навчатися з попередніх розмов із користувачами та виконувати переклад у реальному часі.

Під час презентації розробники продемонстрували realtime переклад двома мовами.

На цей час модель знає 50 мов. Користувач зможе робити голосовий переклад у режимі реального часу. Тож надалі можна буде використовувати GPT-4o у прямому мовленні між людьми.

Окрім цього, GPT-4o може вирішувати задані рівняння. Також модель можна буде використовувати під час планування витрат.

Зокрема для демонстрації роботи нової версії ChatGPT керівники компанії запропонували моделі у режимі реального часу надати інструкції щодо розв’язання математичної задачі, розповісти казку перед сном і заспівати.

Так, на зауваження щодо необхідності дати “більше емоцій”, ChatGPT повернувся до початку казки та справді більш емоційно розпочав розповідь. Також з проханням перейти на голос “робота”, модель з легкістю впоралася з таким завданням.

Загалом з анонсованих нововведень:

  • 50 мов, перекладу текстів поліпшили на 50%;
  • нова версія зберігає всі інтонації, сміється і навіть запинається;
  • працює з текстом, картинками та аудіо;
  • шукає інформацію в інтернеті;
  • пише код у 10 разів швидше за звичайну GPT-4;
  • відповідає на запитання по відео у реальному часі.

Зауважимо, на початку травня сервіс для вивчення іноземних мов Duolingo звітував про зростання квартального виторгу на 45%, одначе акції подешевшали на 18% за день. У звітності за перший квартал Duolingo повідомив про уповільнення темпів приросту нових користувачів.

Одначе, вже 13 травня акції Duolingo знову впали на понад 4%.

Довідка. ChatGPT4o – літера “o” у назві — це скорочення від “omni” (“всебічний”). Нова версія моделі працює з мовою, текстом та відео. GPT-4o в середньому реагує на аудіо за 320 мілісекунд, що можна порівняти з часом реакції людини в розмові

Міністерство оборони кодифікувало і допустило до використання переносний тренажер “Безпечне небо” для підготовки зенітних вогневих груп. 

Спеціальний прокурор Джек Сміт офіційно звернувся до судів із проханням закрити дві федеральні справи проти обраного 47-м президентом США Дональда Трампа, зокрема щодо втручання у вибори та зловживання секретними документами.

Казахстан поставив за мету збільшити частку закордонних постачань нафти без російської допомоги. Міністр енергетики країни Алмасадам Саткалієв заявив, що обсяг такого експорту має зрости у 13 разів.

У Генеральному штабі ЗСУ поінформували про оперативну ситуацію на фронті станом на 22:00 25 листопада. З початку доби на цей час зафіксовано 185 бойових зіткнень.

Нападник аргентинської збірної та “Інтера Маямі” Ліонель Мессі з 2025 року планує розпочати продаж власної лінії велосипедів.