OpenAI представила новую модель, GPT-4o

Компания OpenAI презентовала генеративную модель GPT-4o, которая будет доступна всем пользователям ChatGPT. В качестве запроса бот принимает любую комбинацию текста, аудио или изображения — и может составить из них ответ.

С GPT-4o (o — omni) пользователи смогут взаимодействовать «больше как с помощником»: нейросеть передает интонации человеческого голоса, умеет ускорять или замедлять темп речи, смеяться и петь. Модель реагирует на аудио в среднем за 320 миллисекунд — это аналогично времени реакции человека в разговоре.

Кроме того, новая версия может обрабатывать данные с фронтальной камеры и описывать происходящее.

Модель поддерживается более чем на 50 языках, в том числе на русском, казахском, китайском, арабском, турецком и грузинском. Она также умеет переводить сказанное.

Продукт доступен бесплатно, однако для пользователей с подпиской ChatGPT Plus лимит сообщений «увеличивается до пяти раз».

В апреле ChatGPT стал доступен без регистрации. Тем не менее пользователи с учетной записью все еще имеют ряд преимуществ: они могут сохранять и просматривать историю чатов, делиться ими и общаться с ботом голосом.

Кроме того, в марте OpenAI внедрила GPT-4 в робота-гуманоида. Он полноценно общается с людьми, объясняет свои действия и выполняет полученные от человека команды.