Автор: jolestar
На минулому тижні я трохи попрацював з AI-агентом, позавчора відвідав захід ai16z у Пекіні, щоб подивитися, чим зараз насправді можуть займатися AI-агенти, та подумати про їхнє майбутнє.
Стан AI-агента нагадує мені ту мем-картинку, де в автоматі для продажу продуктів ховалася людина. Уявлення про AI-агента, яке ми маємо, вже починає набувати самосвідомості, але насправді в AI-агенті ховається розробник. (Тут уявіть цю картину, я намагався змусити AI створити це зображення, але зрозумів, що AI не може зрозуміти 'сховати')
Основний спосіб роботи фреймворка AI-агента
В даний час фреймворк AI-агента виконує роль клею, поєднуючи клієнти (Twitter, Discord, Telegram тощо) та різні плагіни (блокчейни тощо), а потім фреймворк надає базову бібліотеку (зберігання пам'яті, ізоляція сесій, генерація контексту) тощо, щоб підключити різні API платформ AI.
Як фреймворк AI-агента поєднується з додатками та бізнес-сценаріями
З моменту бурхливого зростання AI минулого року з'явилося безліч платформ і інструментів, найважливіше - вирішити одну проблему: як AI поєднується з додатками. Деякі платформи AI намагаються запропонувати плагіни, інші створюють моделі робочих процесів, також є традиційні додатки, які вбудовують AI. Але ключовими питаннями є: 1. Де точка взаємодії додатку? 2. Як AI може поєднуватися з існуючою бізнес-логікою.
Кожна AI-платформа надає користувачам точки взаємодії, які нагадують вікна чату, очевидно, що всі вважають, що взаємодія з AI-додатками повинна бути 'персоніфікованою'. У цьому сенсі розумність AI-агента полягає в тому, що він безпосередньо підключається до всіх відкритих IM і соціальних систем, що, очевидно, легше сприймається, ніж створювати нову.
Як AI може поєднуватися з існуючою бізнес-логікою. Рішення, запропоноване AI-агентом, полягає в тому, щоб розробники інтегрували рішення AI у бізнес-сценарії. Мови програмування вимагають визначеності, умови if можуть бути лише true або false, не можуть обробляти неясну бізнес-логіку. Однак через AI можна перетворити складну логіку на точні умови, які потім можна безшовно інтегрувати в бізнес-сценарії.
Наприклад, функція відповіді на повідомлення в групі, традиційним IM-ботам потрібно використовувати чіткі команди для активації, але з допомогою AI можна реалізувати метод shouldReplyMessage, дати йому контекст, і він поверне true або false.
Роль AI в бізнес-логічних сценаріях головним чином полягає в:
1. Виявлення 'намірів': за допомогою пояснень у підказках дати AI можливість виявити 'намір' користувача в текстових повідомленнях на основі контексту та відобразити намір на конкретний код.
2. Підтримка прийняття рішень: за допомогою AI перетворити неясні складні умови в визначені true/false або типи перерахування, а потім інтегрувати їх у бізнес-логіку.
Дивлячись на це, багато людей можуть розчаруватися в AI-агентах, багато хто вважає, що AI-агент - це просто навчити AI, і він все зможе. Насправді через обмеження контексту великих моделей неможливо (принаймні зараз) створити універсальний AI, який міг би виконувати будь-які завдання. Але хороша новина в тому, що програмісти не повинні боятися втратити роботу, оскільки AI все ще потребує багатьох програмістів, які зможуть створювати умови if else, але ключова різниця полягає в тому, що межі бізнесу, які може обробляти програма, розширюються.
Два типи AI-агентів
На заході я запитав Шава про питання, що ринок очікує від AI-агента дві речі: 1. AI-агент повинен виконувати роль з власним ID, брендом, надавати послуги користувачеві. 2. Користувач має особистого AI-агента, що є особистим помічником, який може допомогти користувачеві обробляти бізнес. Який з цих двох AI-агентів буде більш популярним? Він вважає, що обидва напрямки можуть бути успішними і, можливо, поєднаються.
Зараз на ринку основні дослідження все ще ведуться в першому напрямку. Цей напрямок схожий на сервіс AI-агентів, в майбутньому, можливо, не буде інтерфейсів додатків, оскільки всі додатки стануть AI-агентами, персоніфікованими. Другий напрямок - це агентові клієнтів додатків, в майбутньому клієнти додатків стануть плагінами помічників-агентів, локальні дані додатків стануть частиною пам'яті агента, а цей плагін також відповідатиме за зв'язок з агентом служби в хмарі. Це нова архітектурна модель застосування, яка змінить всю інфраструктуру.
Вимоги AI-агента до інфраструктури
1. Інфраструктура повинна забезпечити безперешкодний доступ (Permissionless), інакше AI-агент буде обмежений різними стратегіями захисту від атак, сервіси повинні захищатися від атак економічними витратами (Gas). У цьому аспекті платформи з низьким рівнем відкритості зіткнуться з великими труднощами, як у період бурхливого зростання відкритих платформ Web2.
2. AI-агенту потрібно бути в змозі управляти фінансами для оплати, щоб вирішити наведену вище проблему.
Інакше кажучи, у майбутньому сервіси, незалежно від того, базуються вони на блокчейні чи ні, повинні підтримувати автентифікацію на основі приватних ключів Crypto та платежі на основі Crypto.
Поєднання AI-агента та блокчейн-технологій
Крім вищезгаданих двох пунктів, як AI-агент може поєднуватися з блокчейном - це напрямок, який активно досліджується. На заході я спілкувався з Мікке про те, що він розробляє focEliza. Два типи AI-агентів, принаймні перший, вимагають середовища виконання або верифікації від блокчейну. Тому що якщо AI-агент надає послуги, виникає проблема довіри - роль, яку він виконує, насправді аналогічна смарт-контракту.
Що стосується назви 'смарт-контракт', то в минулому це викликало суперечки, адже це просто шматок коду, де тут 'розумність'? AI може зробити смарт-контракти дійсно розумними. Проблема в тому, як викликати API AI в середовищі смарт-контракту. Якщо говорити про те, щоб запустити великий модель у перевіреному середовищі, цей шлях ще досить далекий, але варіант з Oracle є більш практичним.
Навколо AI-агента виникне багато потреб, як AI-агенту отримати загальні знання? Як AI-агент може судити про факти? Як AI-агент може розпізнавати одного й того ж користувача на різних платформах? Як 'пам'ять' зберігається в смарт-контрактах? Якщо в мене є кілька пристроїв, на кожному з яких встановлений AI-агент, як вони можуть ділитися пам'яттю?
Ви зрозумієте, що те, що робилося в Web3, такі як 'дані на блокчейні', 'зв'язки на блокчейні', 'DID', 'P2P-мережі' тощо, набуває нового значення та нових сценаріїв.
Заключення
Повторюючи підсумок мого виступу про AI і блокчейн у 2021 році, інтернет, дружній до AI, також є інтернетом, дружнім до людства. Тоді це була лише ідея, але тепер майбутнє вже настало.