OpenAI презентувала функцію двостороннього голосового перекладу: деталі оновлення ChatGPT4o

Джерело: TechCrunch

13 травня компанія OpenAI презентувала удосконалену голосову модель штучного інтелекту GPT4 Omni, що буде доступна безплатно для усіх користувачів.

OpenAI представила свою нову модель GPT4 Omni у межах презентації Spring Update.

Доступ до неї видаватиметься поступово протягом кількох тижнів, аби уникнути перевантаження серверів.

Головна технічна директорка OpenAI Міра Мураті зауважила, що ChatGPT відтепер матиме можливості пам’яті, тобто навчатися з попередніх розмов із користувачами та виконувати переклад у реальному часі.

Під час презентації розробники продемонстрували realtime переклад двома мовами.

На цей час модель знає 50 мов. Користувач зможе робити голосовий переклад у режимі реального часу. Тож надалі можна буде використовувати GPT-4o у прямому мовленні між людьми.

Окрім цього, GPT-4o може вирішувати задані рівняння. Також модель можна буде використовувати під час планування витрат.

Зокрема для демонстрації роботи нової версії ChatGPT керівники компанії запропонували моделі у режимі реального часу надати інструкції щодо розв’язання математичної задачі, розповісти казку перед сном і заспівати.

Так, на зауваження щодо необхідності дати “більше емоцій”, ChatGPT повернувся до початку казки та справді більш емоційно розпочав розповідь. Також з проханням перейти на голос “робота”, модель з легкістю впоралася з таким завданням.

Загалом з анонсованих нововведень:

  • 50 мов, перекладу текстів поліпшили на 50%;
  • нова версія зберігає всі інтонації, сміється і навіть запинається;
  • працює з текстом, картинками та аудіо;
  • шукає інформацію в інтернеті;
  • пише код у 10 разів швидше за звичайну GPT-4;
  • відповідає на запитання по відео у реальному часі.

Зауважимо, на початку травня сервіс для вивчення іноземних мов Duolingo звітував про зростання квартального виторгу на 45%, одначе акції подешевшали на 18% за день. У звітності за перший квартал Duolingo повідомив про уповільнення темпів приросту нових користувачів.

Одначе, вже 13 травня акції Duolingo знову впали на понад 4%.

Довідка. ChatGPT4o – літера “o” у назві — це скорочення від “omni” (“всебічний”). Нова версія моделі працює з мовою, текстом та відео. GPT-4o в середньому реагує на аудіо за 320 мілісекунд, що можна порівняти з часом реакції людини в розмові

Триває 1076-та доба повномасштабної російсько-української війни. За цей час втрати військ РФ у живій силі (вбиті та поранені) сягли понад 641 тисячу осіб.

Французька столиця, місто Париж, покидає платформу X через дезінформацію та мову ворожнечі, які дедалі зростають у соцмережі американського мільярдера Ілона Маска.

Правоохоронці Київської області в січні завадили двом спробам незаконного вивезення за кордон предметів старовини.

Головнокомандувач Збройних сил України Олександр Сирський відреагував на останні напади на територіальні центри комплектування та соціальної підтримки, назвавши такі атаки ганебними.

Адміністративне керівництво Конгресу США застерігає персонал від використовування китайського застосунку DeepSeek, який дестабілізує американський ринок та залишається недослідженим у сфері інформаційної безпеки.