OpenAI презентувала функцію двостороннього голосового перекладу: деталі оновлення ChatGPT4o

Джерело: TechCrunch

13 травня компанія OpenAI презентувала удосконалену голосову модель штучного інтелекту GPT4 Omni, що буде доступна безплатно для усіх користувачів.

OpenAI представила свою нову модель GPT4 Omni у межах презентації Spring Update.

Доступ до неї видаватиметься поступово протягом кількох тижнів, аби уникнути перевантаження серверів.

Головна технічна директорка OpenAI Міра Мураті зауважила, що ChatGPT відтепер матиме можливості пам’яті, тобто навчатися з попередніх розмов із користувачами та виконувати переклад у реальному часі.

Під час презентації розробники продемонстрували realtime переклад двома мовами.

На цей час модель знає 50 мов. Користувач зможе робити голосовий переклад у режимі реального часу. Тож надалі можна буде використовувати GPT-4o у прямому мовленні між людьми.

Окрім цього, GPT-4o може вирішувати задані рівняння. Також модель можна буде використовувати під час планування витрат.

Зокрема для демонстрації роботи нової версії ChatGPT керівники компанії запропонували моделі у режимі реального часу надати інструкції щодо розв’язання математичної задачі, розповісти казку перед сном і заспівати.

Так, на зауваження щодо необхідності дати “більше емоцій”, ChatGPT повернувся до початку казки та справді більш емоційно розпочав розповідь. Також з проханням перейти на голос “робота”, модель з легкістю впоралася з таким завданням.

Загалом з анонсованих нововведень:

  • 50 мов, перекладу текстів поліпшили на 50%;
  • нова версія зберігає всі інтонації, сміється і навіть запинається;
  • працює з текстом, картинками та аудіо;
  • шукає інформацію в інтернеті;
  • пише код у 10 разів швидше за звичайну GPT-4;
  • відповідає на запитання по відео у реальному часі.

Зауважимо, на початку травня сервіс для вивчення іноземних мов Duolingo звітував про зростання квартального виторгу на 45%, одначе акції подешевшали на 18% за день. У звітності за перший квартал Duolingo повідомив про уповільнення темпів приросту нових користувачів.

Одначе, вже 13 травня акції Duolingo знову впали на понад 4%.

Довідка. ChatGPT4o – літера “o” у назві — це скорочення від “omni” (“всебічний”). Нова версія моделі працює з мовою, текстом та відео. GPT-4o в середньому реагує на аудіо за 320 мілісекунд, що можна порівняти з часом реакції людини в розмові

Перший заступник міністра закордонних справ Сергій Кислиця, заявив, що на початку повномасштабного вторгнення його в Нью-Йорку неодноразово намагалися підштовхнути до перемовин із російським представником Василем Небензєю. За його словами, навіть генсек ООН пропонував сприяти такій зустрічі, аби “покласти край війні”.

Народний депутат Ярослав Железняк розкритикував державний бюджет на 2026 рік через зменшення видатків на оборону та витрати на інші галузі.

П’ятий сезон серіалу “Дивні дива” за перші п’ять днів після релізу набрав 59,6 млн переглядів, що стало найкращим показником серед англомовних серіалів платформи. Загалом це третій найвищий результат серед усіх проєктів Netflix, поступаючись лише другим і третім сезонам південнокорейського серіалу “Гра в кальмара”.

У центрі італійського міста Пезаро до різдвяних свят встановили тимчасовий льодовий каток. За проєктом конструкція мала розміщуватися поруч із пам’ятником Лучано Паваротті, але зрештою каток повністю оточив бронзову статую тенора прозорими стінками, залишивши її “по коліна в льоду”.

Київський апеляційний суд задовольнив клопотання захисту керівника відділення НАБУ у місті Дніпро Руслана Магамедрасулова, звільнивши його з-під варти. Відповідне рішення оголосив головуючий колегії суддів Валерій Лашевич.