OpenAI发布最新旗舰级模型GPT4o，ChatGPT迈入人机交互新阶段

Odaily星球日报 · 2024-05-13T18:23:04.000Z

Odaily星球日报讯 OpenAI 发布最新旗舰级模型 GPT-4o，可以实时推理音频、视觉和文本，主打概念为拟人化、超自然、超低时延的个人语音交互助理。根据 OpenAI 官方网站及 X 平台官方账号相关信息，GPT4o 中的 o 代表 Omni（全面），是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入，并支持生成任意组合的文本、音频和图像输出。它可以在 232 毫秒内响应音频输入，平均 320 毫秒，与对话中人类反应时间相似。在英语和代码方面，它与 GPT-4 Turbo 性能相当，在非英语语言文本上有显著改进，同时 API 速度更快且成本便宜 50%。与现有模型相比，GPT-4o 在视觉和音频理解方面表现特别出色。文本和图像输入将于今日在 API 和 ChatGPT 中推出，语音和视频输入将在未来几周内推出。

OpenAI выпускает свою последнюю флагманскую модель GPT4o, ChatGPT выходит на новый этап взаимодействия человека и компьютера

Odaily Planet Daily News OpenAI выпустила свою последнюю флагманскую модель GPT-4o, которая может выводить звук, изображение и текст в режиме реального времени. Основная концепция — это антропоморфный, сверхъестественный персональный голосовой интерактивный помощник со сверхмалой задержкой. Согласно информации, относящейся к официальному сайту OpenAI и официальному аккаунту OpenAI. Генерация любой комбинации вывода текста, звука и изображения. Он может реагировать на аудиовход за 232 миллисекунды, в среднем 320 миллисекунд, что соответствует времени реакции человека во время разговора. Он работает на одном уровне с GPT-4 Turbo на английском языке и коде, со значительными улучшениями для текста на неанглоязычных языках, а также имеет более быстрый и на 50 % более дешевый API. GPT-4o особенно хорошо справляется с визуальным и звуковым восприятием по сравнению с существующими моделями. Ввод текста и изображений уже сегодня доступен в API и ChatGPT, а ввод голоса и видео появится в ближайшие недели.

Отказ от ответственности: на платформе опубликованы материалы и мнения третьих лиц. Не является финансовой рекомендацией. Может содержать спонсируемый контент. См. Правила и условия.

OpenAI выпускает свою последнюю флагманскую модель GPT4o, ChatGPT выходит на новый этап взаимодействия человека и компьютера

Другие публикации автора

Последние новости