Odaily Planet Daily News OpenAI випустив свою останню флагманську модель GPT-4o, яка може виводити аудіо, зображення та текст у режимі реального часу. Відповідно до інформації, пов’язаної з офіційним веб-сайтом OpenAI та офіційним обліковим записом Generate будь-яку комбінацію тексту, аудіо та зображення. Він може реагувати на вхідний аудіо за 232 мілісекунди, в середньому за 320 мілісекунд, що відповідає часу реакції людини під час розмови. Він працює нарівні з GPT-4 Turbo в англійській мові та коді, зі значними покращеннями в неангломовному тексті, а також має швидший і на 50% дешевший API. Порівняно з існуючими моделями, GPT-4o особливо добре сприймає візуальне та звукове сприйняття. Введення тексту та зображень поширюється в API та ChatGPT сьогодні, а введення голосу та відео – найближчими тижнями.