Співзасновник OpenAI Ілля Сутскевер на конференції NeurIPS, що проходила 15 грудня в Ванкувері, Канада, зазначив, що розвиток ШІ досяг критичного поворотного моменту, технології попереднього навчання поступово стикаються з обмеженнями, і в майбутньому ми будемо рухатися до штучного надінтелекту (ASI).
Дані для попереднього навчання ШІ зустріли "стелю", перетворення є неминучим.
Сутскевер на конференції заявив, що ера попереднього навчання ШІ незабаром закінчиться. Він вважає, що нинішня кількість даних в Інтернеті наближається до межі, і в майбутньому необхідні нові технології для подальшого просування ШІ до наступного етапу, зрештою розвиваючи штучний надінтелект (ASI).
Сутскевер зазначив, що з постійним покращенням апаратного та програмного забезпечення та алгоритмів обчислювальні можливості ШІ значно зросли, але дані, які використовуються для навчання ШІ, не можуть безмежно розширюватися. Сутскевер порівняв дані з "викопним паливом" ШІ, зазначаючи: "Дані не зростатимуть безмежно, оскільки Інтернет лише один. Дані подібні до викопного пального ШІ, і вони вже майже вичерпані, тому в майбутньому потрібно знайти способи ефективно використовувати наявні дані."
(Примітка: попередньо навчена модель означає, що її не потрібно навчати з нуля, це модель, яка вже засвоїла базові знання.)
Три ключові технології для просування розвитку ШІ.
Хоча Сутскевер вказав на проблеми, з якими стикається ШІ, він також представив три ключові технології, які можуть вплинути на еволюцію ШІ до штучного надінтелекту (ASI):
Автономний ШІ (Agentic AI): може приймати рішення та виконувати завдання без ручного втручання, здатен динамічно коригувати свою поведінку відповідно до цілей та середовища. На відміну від агента ШІ, агент ШІ зазвичай діє пасивно або відповідно до фіксованої логіки, вимагаючи більше людського втручання.
Синтетичні дані (Synthetic Data): використовуючи ШІ, генерують високоякісні симуляційні дані для вирішення проблеми недостатності даних. Наприклад: якщо потрібно навчити модель ШІ розпізнавати автомобілі, що їдуть дорогами, але даних про трафік у реальному світі недостатньо, ми можемо використовувати синтетичні технології для "генерації" багатьох симуляцій автомобілів і сцен.
Миттєві обчислення (Inference Time Computing): підвищує обчислювальні можливості моделей ШІ, дозволяючи ШІ швидше вирішувати складні проблеми.
Сутскевер вважає, що ці три технології можуть просунути сучасні технології ШІ до "штучного надінтелекту" (ASI).
Хвиля інтересу до ШІ охопила ринок блокчейну та LLM.
Концепція агентів ШІ привертає увагу не лише в технологічній сфері, багато мем-криптовалют та великих мовних моделей (LLMs) також почали інтегрувати технології ШІ, такі як агент ШІ Truth Terminal, який сам просуває мем-криптовалюту GOAT у соціальних мережах, чия ринкова вартість зросла до 600 мільйонів доларів, навіть відомий венчурний капіталіст a16z Марк Андріссен висловив подив щодо Truth Terminal.
А нещодавно найвідомішим прикладом поєднання агентів ШІ з великими мовними моделями став модель Gemini 2.0, випущена Google DeepMind. За заявою Google, Gemini 2.0 може безпосередньо генерувати зображення, текст, навіть перетворювати текст на мову та регулювати звукові ефекти для різних мов. Також можна безпосередньо використовувати Google для пошуку, виконання коду, а також використовувати сторонні інструменти, налаштовані користувачем.
Переваги автономного ШІ, вирішення проблеми "галюцинацій" ШІ.
Сутскевер зазначив, що автономні ШІ та миттєві обчислення розуму допомагають вирішити проблему "галюцинацій" ШІ (AI Hallucinations) під час навчання. Так звані галюцинації ШІ виникають через недостатність навчальних даних, через що модель ШІ може видавати помилкову або недостовірну інформацію. Оскільки нове покоління моделей ШІ все ще залежить від даних, отриманих від старих моделей, ця проблема лише поглиблюватиметься.
Сутскевер зазначив, що для вирішення проблеми "галюцинацій" автономні ШІ можуть покращити здібності до міркування та миттєвих обчислень, щоб ефективно оцінювати дані та підвищувати надійність та ефективність ШІ.
Зіткнувшись з великою проблемою, коли дані для навчання ШІ досягли межі, що викликає "галюцинації", насправді це не зовсім збігається з думками Хуана Женьсюн (Nvidia). Раніше Хуан Женьсюн також підкреслив цю проблему в інтерв'ю і запропонував три важливі етапи для поліпшення "галюцинацій" в майбутньому:
Початкове навчання:
Це базовий етап для ШІ, під час якого відбувається масове поглинання даних з реального світу, щоб "вчитися" та "відкривати" різні знання, але це лише початок, ще не досить глибоко.
Пізніше навчання:
Це етап посилення ШІ, коли через людський зворотний зв'язок, наприклад, людську допомогу у виставленні оцінок, а також через власний зворотний зв'язок ШІ, використовуючи синтетичні дані для моделювання більшої кількості ситуацій. У цей час будуть включені технології, такі як підсилене навчання, навчання з кількома шляхами тощо, щоб допомогти ШІ зосередитися на вдосконаленні конкретних навичок, щоб краще розуміти, як вирішувати проблеми.
Масштабування часу тестування (Test Time Scaling):
Цей етап можна розглядати як початок "мислення" ШІ. Коли ШІ стикається зі складними проблемами, воно поетапно розбирає проблему, повторно моделює різні рішення, потім постійно коригує, щоб знайти найкращу відповідь. Хуан Женьсюн вважає, що якщо дати ШІ більше "часу для роздумів", його відповіді можуть бути більш точними або якість може бути вищою.
Ця стаття поставить крапку в попередньому навчанні ШІ! Співзасновник OpenAI: автономний ШІ та синтетичні дані пришвидшать прихід епохи штучного надінтелекту. Вперше з'явилася на Lian News ABMedia.