OpenAI запустила новую модель вывода o3, установив новый рекорд с революционным результатом теста ARC-AGI 75,7%, и представила технологию «разумного выравнивания» для повышения безопасности модели. Модель в настоящее время открыта для приложений для тестирования безопасности и, как ожидается, будет официально выпущена в начале 2025 года. (Предварительные новости: инструмент для создания видео OpenAI Sora официально выпущен! Сразу 5 основных функций и планы подписки) (Справочное дополнение: OpenAI выпустила полноценную версию модели o1 и новый план подписки ChatGPT Pro. Это ежемесячный плата в размере 200 долларов США того стоит? ) ChatGPT 12 дней подряд выпуска новых продуктов OpenAI, разработчика, подошли к концу вчера (20-го числа). Финалом стали новые модели вывода «o3» и «o3-mini». «. Эта модель ИИ обладает более сильными способностями к рассуждению и предназначена для решения сложных задач, требующих пошагового логического рассуждения. Сегодня мы поделились оценками ранней версии следующей модели в нашей серии рассуждений по o-модели: OpenAI o3 pic.twitter.com/e4dQWdLbAD — OpenAI (@OpenAI) 20 декабря 2024 г. Особенности модели 1) Способность к рассуждению устанавливает рекорд SoTA для OpenAI В заявлении отмечается, что модель o3 хорошо показала себя во многих тестах производительности, включая сложное программирование, математику и научные задачи, продемонстрировав свои сильные способности к логическому рассуждению. В оценке «ARC-AGI», разработанной Исследовательским центром выравнивания (ARC) для проверки общих возможностей искусственного интеллекта (AGI) систем искусственного интеллекта, o3 достиг прорывного результата в 75,7% в некоторых закрытых тестах, установив новый технологический уровень. рекорд высоты (современное состояние, SoTA). Кроме того, версия o3 с высокопроизводительной конфигурацией получила более высокий балл — 87,5% в том же тесте, но, возможно, она не соответствовала ARC-AGI-Pub (публично проверяемому) из-за требований к ресурсам этой версии, превышающих стандартные результаты испытаний ARC-AGI). Новая проверенная версия ARC-AGI-Pub SoTA!@OpenAI o3 набрала 75,7 % в получастной оценке ARC-AGI, а высокопроизводительная конфигурация o3 (не подходящая для ARC-AGI-Pub) набрала 87,5 % в тесте ARC-AGI-Pub. Получастная оценка 1/4 pic.twitter.com/uQA47JWkl6 — ARC Prize (@arcprize) 20 декабря 2024 г. 2) Выбор нескольких версий OpenAI предоставляет две версии o3 и o3-mini, последняя, ​​как ожидается, будет выпущена. в 1 2025 году он будет запущен в конце месяца, а полная версия о3 выйдет позже (конкретные сроки не называются). Эта новая модель использует недавно выпущенный OpenAI API Adaptive Thinking Time API, который обеспечивает три различных режима рассуждения: низкий, средний и высокий. Эта функция позволяет пользователям регулировать продолжительность времени, в течение которого модель «думает», прежде чем ответить на вопрос, в соответствии со своими потребностями. Как видно из рисунка ниже, o3-mini сравнима с текущей моделью o1 с точки зрения результатов вывода, но ее вычислительные затраты значительно ниже. 3) Повышение безопасности OpenAI использует новый метод обучения «Сознательное согласование», позволяющий напрямую обучать модели большого языка (LLM) пониманию написанных человеком интерпретируемых спецификаций безопасности и обеспечению соответствия этим спецификациям перед ответом на вопросы. В заявлении OpenAI говорится: «С помощью этого метода мы успешно оптимизировали модели OpenAI серии o, чтобы они могли использовать технологию рассуждения «Цепочка мыслей» (CoT) для размышления над вопросами пользователей и поиска решений. Извлекайте соответствующий нормативный текст. из внутренней политики OpenAI для создания более безопасных ответов. Происхождение названия Стоит отметить, что OpenAI пропустила наименование «o2» и напрямую использовала «o3». Генеральный директор Сэм Альтман объяснил, что это было сделано для того, чтобы избежать путаницы с британским телекоммуникационным провайдером O2 и продемонстрировать уникальное чувство юмора OpenAI. В прямом эфире он сказал: «Из уважения к Telefónica (материнской компании O2) и в продолжение прекрасной традиции OpenAI, которая крайне плохо умеет давать имена, мы назвали ее o3. Приглашаем исследователей принять участие в тестировании безопасности. В настоящее время o3 и o3». -mini находится на стадии внутреннего тестирования безопасности, и OpenAI открыла заявки на приглашение внешних исследователей для участия в тестировании безопасности. Прием заявок заканчивается 10 января 2025 г. Что касается запуска этой модели, Сэм Альтман без смирения заявил, что это знаменует собой официальный переход на «следующий этап» развития ИИ. Оглядываясь назад на отчет Bloomberg о рейтинговой шкале искусственного интеллекта OpenAI в середине этого года, можно сказать, что следующим этапом после чат-ботов и моделей вывода являются агенты — продвинутые системы искусственного интеллекта, которые могут выполнять действия от имени пользователей. Это ключевое направление, которое в настоящее время изучают и развивают как рынок криптовалют, так и сфера Web2. Подразделения рейтинговой системы искусственного интеллекта OpenAI. Источник: Bloomberg Соответствующие отчеты OpenAI выпускает во второй день новую функцию «тонкой настройки обучения с подкреплением» для повышения точности обучения в профессиональных областях искусственного интеллекта. OpenAI объявила, что будет вести прямую трансляцию в течение 12 дней подряд: запуская множество новых функций, могут ли концептуальные монеты AI стать реальностью. попал в засаду? Политическая игра OpenAI провалилась, сможет ли Сэм Альтман победить «альянс ИИ» между Маском и Трампом? «OpenAI запускает модель o3! Способность рассуждать поднимается на более высокий уровень, открывая путь для следующего поколения ИИ». Эта статья была впервые опубликована в BlockTempo (Dong District Dongzhi — самое влиятельное новостное СМИ о блокчейне).