OpenAI представила нову модель міркування o3, яка з рекордним результатом 75,7% на тесті ARC-AGI встановила новий рекорд, та запровадила технологію "обережного вирівнювання", що підвищує безпеку моделі. Модель наразі відкрита для заявок на безпечне тестування, планується офіційний реліз на початку 2025 року. (Передісторія: Генератор відео OpenAI Sora офіційно запущений! 5 основних функцій, підписка разом) (Додаткова інформація: OpenAI представила повноцінну версію моделі o1 та нову підписку ChatGPT Pro, чи варто платити 200 доларів на місяць?) Розробник ChatGPT OpenAI завершив 12 днів анонсів новинок вчора (20 числа), останніми стали нові моделі міркування "o3" та "o3-mini", ця AI модель має покращені можливості міркування, призначені для вирішення складних завдань, що потребують покрокового логічного міркування. Сьогодні ми поділилися оцінками ранньої версії наступної моделі в нашій серії моделей міркування o: OpenAI o3 pic.twitter.com/e4dQWdLbAD — OpenAI (@OpenAI) 20 грудня 2024 року Особливості моделі 1) Міркувальні можливості встановлюють рекорди SoTA OpenAI заявила, що модель o3 показала відмінні результати в багатьох бенчмарках, включаючи складні завдання з програмування, математики та науки, демонструючи свої потужні логічні міркувальні здібності. В оцінці "ARC-AGI", розробленій Центром досліджень вирівнювання (ARC) для тестування загальної штучної інтелігентності (AGI), o3 досягла проривного результату 75,7% в деяких непублічних тестах, встановивши нові технологічні висоти (State of the Art, SoTA). Крім того, високоякісна версія (high-compute configuration) o3 досягла ще кращого результату 87,5% в тих же тестах, але, можливо, через вимоги до ресурсів ця версія не відповідала критеріям ARC-AGI-Pub (публічно перевірені результати тестування ARC-AGI). Новий перевірений рекорд ARC-AGI-Pub! @OpenAI o3 отримала проривний результат 75,7% на ARC-AGI напівприватній оцінці. А конфігурація o3 з високими обчислювальними ресурсами (непридатна для ARC-AGI-Pub) отримала 87,5% на напівприватній оцінці. 1/4 pic.twitter.com/uQA47JWkl6 — ARC Prize (@arcprize) 20 грудня 2024 року 2) Кілька версій на вибір OpenAI пропонує дві версії: o3 та o3-mini, остання з яких планується до релізу наприкінці січня 2025 року, а повна версія o3 буде випущена пізніше (точний час не оголошено). Ця нова модель використовує нещодавно запроваджений OpenAI API адаптивного часу роздумів (Adaptive Thinking Time), що пропонує три різні режими міркування: низький, середній та високий. Ця функція дозволяє користувачам регулювати тривалість "роздумів" моделі перед відповіддю на запитання. З нижньої ілюстрації видно, що o3-mini може змагатися з теперішньою моделлю o1 за результатами міркування, але значно знижує витрати на обчислення. 3) Підвищена безпека OpenAI запровадила новий метод навчання "обережного вирівнювання (Deliberative alignment)", який безпосередньо навчає великі мовні моделі (LLMs) розуміти людські, зрозумілі безпекові норми та забезпечує дотримання цих норм під час міркування перед відповіддю на запитання. OpenAI у своїй заяві зазначила: Завдяки цьому методу ми успішно оптимізували моделі o-серії OpenAI, що дозволяє їм використовувати техніку міркування "ланцюг думок" (Chain-of-Thought, CoT), розмірковуючи над запитаннями користувача, знаходячи відповідні текстові норми в політиках OpenAI, щоб генерувати більш безпечні відповіді. Походження назви Варто зазначити, що OpenAI пропустила назву "o2" і безпосередньо використала "o3". Генеральний директор Сем Альтман пояснив, що це зроблено, щоб уникнути плутанини з британським постачальником телекомунікацій O2, а також продемонструвати унікальне почуття гумору OpenAI. В ефірі він зазначив: "На знак поваги до Telefónica (материнської компанії O2) та продовжуючи традицію OpenAI, яка не дуже талановита в назвах, ми вирішили назвати її o3." Запрошення дослідників до участі в безпечному тестуванні Наразі o3 та o3-mini перебувають на стадії внутрішнього безпечного тестування, OpenAI відкрила заявки, запрошуючи зовнішніх дослідників взяти участь у безпечному тестуванні. Заявки будуть прийматися до 10 січня 2025 року. Щодо випуску цієї моделі, Сем Альтман без вагань зазначив, що це знаменує собою перехід AI до "наступного етапу". Оглядаючи цьогорічні витоки Bloomberg, класифікація AI OpenAI, наступним етапом після чат-ботів і моделей міркування є Агенти — це розвинені AI-системи, які можуть діяти від імені користувачів. Це є ключовим напрямком, який активно досліджується та розробляється як у криптовалютному ринку, так і в сфері Web2. Система класифікації AI OpenAI. Джерело зображення: Bloomberg Пов'язані новини OpenAI представила нову функцію "підкріпленого навчання з доопрацюванням", що підвищує точність навчання в професійних областях. OpenAI оголосила про безперервну 12-денну трансляцію: запуск багатьох нових функцій, чи можуть AI концептуальні монети бути в тренді? Політичні ігри OpenAI зазнали невдачі, Сем Альтман, ймовірно, не зможе протистояти "AI альянсу" Маска та Трампа. "OpenAI запускає модель o3! Міркувальні можливості на новому рівні, прокладаючи шлях для наступного покоління AI" ця стаття вперше була опублікована на BlockTempo (одному з найвпливовіших новинних медіа про блокчейн).