OpenAI презентувала функцію двостороннього голосового перекладу: деталі оновлення ChatGPT4o

Джерело: TechCrunch

13 травня компанія OpenAI презентувала удосконалену голосову модель штучного інтелекту GPT4 Omni, що буде доступна безплатно для усіх користувачів.

OpenAI представила свою нову модель GPT4 Omni у межах презентації Spring Update.

Доступ до неї видаватиметься поступово протягом кількох тижнів, аби уникнути перевантаження серверів.

Головна технічна директорка OpenAI Міра Мураті зауважила, що ChatGPT відтепер матиме можливості пам’яті, тобто навчатися з попередніх розмов із користувачами та виконувати переклад у реальному часі.

Під час презентації розробники продемонстрували realtime переклад двома мовами.

На цей час модель знає 50 мов. Користувач зможе робити голосовий переклад у режимі реального часу. Тож надалі можна буде використовувати GPT-4o у прямому мовленні між людьми.

Окрім цього, GPT-4o може вирішувати задані рівняння. Також модель можна буде використовувати під час планування витрат.

Зокрема для демонстрації роботи нової версії ChatGPT керівники компанії запропонували моделі у режимі реального часу надати інструкції щодо розв’язання математичної задачі, розповісти казку перед сном і заспівати.

Так, на зауваження щодо необхідності дати “більше емоцій”, ChatGPT повернувся до початку казки та справді більш емоційно розпочав розповідь. Також з проханням перейти на голос “робота”, модель з легкістю впоралася з таким завданням.

Загалом з анонсованих нововведень:

  • 50 мов, перекладу текстів поліпшили на 50%;
  • нова версія зберігає всі інтонації, сміється і навіть запинається;
  • працює з текстом, картинками та аудіо;
  • шукає інформацію в інтернеті;
  • пише код у 10 разів швидше за звичайну GPT-4;
  • відповідає на запитання по відео у реальному часі.

Зауважимо, на початку травня сервіс для вивчення іноземних мов Duolingo звітував про зростання квартального виторгу на 45%, одначе акції подешевшали на 18% за день. У звітності за перший квартал Duolingo повідомив про уповільнення темпів приросту нових користувачів.

Одначе, вже 13 травня акції Duolingo знову впали на понад 4%.

Довідка. ChatGPT4o – літера “o” у назві — це скорочення від “omni” (“всебічний”). Нова версія моделі працює з мовою, текстом та відео. GPT-4o в середньому реагує на аудіо за 320 мілісекунд, що можна порівняти з часом реакції людини в розмові

1 жовтня у світі відзначають Міжнародний день літніх людей – подію, покликану підвищити обізнаність про проблеми старіння та водночас відзначити внесок літніх людей у розвиток суспільства.

Жовтень у світі традиційно присвячений підвищенню обізнаності про рак молочної залози – хворобу, яка щороку забирає сотні тисяч життів. ВООЗ наголошує: це час не лише вшанувати мільйони жінок, які зіткнулися з діагнозом, а й підтвердити глобальну відданість рівному доступу до допомоги та покращенню виживання.

Поблизу Радомишля на Підкарпатті відкрили навчальний полігон “Ліпа” для української армії, побудований Королівством Норвегія. Польща є країною-господарем полігону, котрий також буде також місцем обміну українським досвідом у протидії російським безпілотникам.

В NASA повідомили, що вперше в історії космічної агенції серед новообраних астронавтів переважають жінки.

В Одесі рятувальники знайшли тіло десятої загиблої людини внаслідок зливи 30 вересня.