Компания OpenAI анонсировала GPT-4o, нашу новую флагманскую модель, которая может анализировать звук, изображение и текст в режиме реального времени. Кстати O означает – OMNI. Это как уже сказана означает мультимодальность т.е. нейросеть GPT-4o принимает в качестве входных данных любую комбинацию текста, аудио, изображения и видео и генерирует любую комбинацию текста, аудио и изображения на выходе
GPT-4o — это шаг к гораздо более естественному взаимодействию человека с компьютером. Теперь GPT-4o можно использовать в качестве голосового помощника. Нейросеть эмоционально разговаривает, использует разные интонации и даже обладает харизмой. Взаимодействие происходит более естественно, чем раньше: время отклика на аудиозапросы составляет в среднем 0,3 секунды, что сопоставимо со скоростью реакции человека.
Пользователи уже прозвали нейросеть джипити-ЧО
Попробовать нейросеть можно тут https://hubai.ru/gpt-4o/