Щоденні новини Odaily Planet OpenAI чотири рази оновив свою модель у жовтні, щоб допомогти своїй моделі AI краще проводити розмови та покращити можливості розпізнавання зображень. Перше велике оновлення — це Live API, який дозволяє розробникам створювати мовленнєві додатки, згенеровані штучним інтелектом, за допомогою однієї підказки, забезпечуючи природні розмови, подібні до розширеного мовленнєвого режиму ChatGPT. Раніше розробникам доводилося «зшивати» кілька моделей, щоб створити такий досвід. Аудіовхідні дані часто потрібно повністю завантажити й обробити, перш ніж буде отримано відповідь, що означає більшу затримку для додатків у реальному часі, таких як голосові розмови. Завдяки можливостям потокового передавання Realtime API розробники тепер можуть досягати миттєвої природної взаємодії, як голосовий помічник. API працює на базі GPT-4, випущеній у травні 2024 року, і може виконувати висновки щодо аудіо, відео та тексту в режимі реального часу. Інше оновлення включає інструменти тонкого налаштування для розробників, що дозволяє їм покращувати відповіді штучного інтелекту, створені на основі введення зображень і тексту. Спінери на основі зображень дозволяють штучному інтелекту краще розуміти зображення, тим самим покращуючи можливості візуального пошуку та виявлення об’єктів. Процес включає відгуки від людей, які надають приклади хороших і поганих відповідей на тренування. Окрім оновлень мовлення та бачення, OpenAI також представляє «дистиляцію моделі» та «кешування підказок», які дозволяють меншим моделям навчатися на більших моделях і зменшують витрати та час на розробку шляхом повторного використання обробленого тексту. OpenAI очікує, що наступного року дохід зросте до 11,6 мільярдів доларів проти 3,7 мільярдів доларів, очікуваних у 2024 році, повідомляє Reuters. (Cointelegraph)