Автор: jolestar
На минулому тижні я трохи досліджував AI Agent, позавчора відвідав захід ai16z у Пекіні, хотів подивитися, що AI Agent насправді може робити зараз і подумати, що він може робити в майбутньому.
Стан AI Agent нагадує мені той мем, де в автоматі з продажу ховається людина. Уявлення про AI Agent почало мати самосвідомість, але насправді в AI Agent ховається розробник. (Тут уявіть собі картину, я намагався змусити AI створити це зображення, але виявив, що AI не розуміє "сховати")
Основний спосіб роботи фреймворку AI Agent
Фреймворк AI Agent наразі виконує роль клею, з'єднуючи клієнтів (Twitter, Discord, Telegram тощо) та різні плагіни (блокчейни тощо), а потім фреймворк надає базову бібліотеку (зберігання пам'яті, ізоляція сеансів, генерація контексту) і т.д., для підключення до різних інтерфейсів AI платформ.
Як фреймворк AI Agent інтегрується з застосунками та бізнес-сценаріями
З моменту буму AI минулого року, з'явилося безліч платформ і інструментів, найголовніше - вирішити одну проблему: як AI інтегрується з додатками. Деякі AI платформи намагаються надати плагіни, інші створюють моделі робочих процесів, а деякі традиційні застосунки вбудовують AI. Але тут ключове питання: 1. Де точка взаємодії додатка? 2. Як AI може інтегруватися з існуючою бізнес-логікою.
Всі AI платформи надають користувачам інтерфейси для взаємодії, які є схожими на вікна чату, очевидно, що всі вважають, що спосіб взаємодії з AI повинен бути "людяним". А в цьому сенсі AI Agent розумно тим, що він безпосередньо підключений до всіх відкритих IM та соціальних систем, що явно легше прийняти, ніж створювати щось нове.
Як AI може інтегруватися з існуючою бізнес-логікою. Пропозиція AI Agent полягає в тому, щоб дозволити розробникам інтегрувати рішення AI у бізнес-сценарії. Мова програмування вимагає визначеності, умови if можуть бути лише true або false, не можуть обробляти розмиту бізнес-логіку. А через AI можна перетворити складну логіку на точні умови, а потім безперешкодно інтегрувати їх у бізнес-сценарії.
Наприклад, функція відповіді на повідомлення в групі: традиційний IM Bot потребує чітких команд повідомлень для активації, а за допомогою AI можна реалізувати метод shouldReplyMessage, надавши йому контекст, він повертає true або false.
Роль AI у бізнес-логіці полягає в основному в тому, що:
1. Виявлення "намірів": через пояснення в підказках дати AI можливість виявляти "наміри" в текстових повідомленнях користувача на основі контексту і відображати наміри на конкретний код.
2. Допомога у прийнятті рішень: за допомогою AI перетворити розмиті складні умови на визначені true/false або типи переліку, а потім інтегрувати їх у бізнес-логіку.
Досліджуючи цю тему, багато людей можуть розчаруватися в AI Agent, оскільки багато хто думає, що AI Agent - це просто навчити AI, і він буде робити все. Насправді через обмеження контексту великих моделей неможливо (принаймні на даний момент) створити універсальний AI, який міг би виконувати будь-які завдання. Але хороша новина - програмісти не повинні турбуватися про безробіття, AI все ще потребує великої кількості програмістів, і все ще потрібні люди, які зможуть працювати з умовами if else, але ключова різниця полягає в тому, що межі бізнесу, які може обробляти програма, розширюються.
Два типи AI Agent
На заході я поставив shaw питання: ринок має дві очікування від AI Agent: 1. AI Agent виконує роль, має свій ID, бренд, надає послуги користувачам. 2. Користувач має особистого AI Agent, який є помічником для обробки деяких бізнес-операцій. Який з цих двох типів AI Agent буде більш популярним? Він вважає, що обидва напрямки будуть хорошими, і їх можливо об'єднати.
Наразі ринок переважно досліджує перший напрям. Цей напрям схожий на перетворення AI Agent у послуги, у майбутньому може не залишитися інтерфейсів додатків, всі додатки стануть AI Agent, перетворившись на людяні. А другий напрям - це агентизація клієнтських застосунків, майбутні клієнтські застосунки стануть плагіном для помічника-агента, локальні дані застосунків стануть частиною пам'яті агента, одночасно цей плагін також відповідатиме за зв'язок з агентами сервісу в хмарі. Це нова архітектурна модель застосунків, яка змінить всю інфраструктуру.
Вимоги AI Agent до інфраструктури
1. Інфраструктура повинна бути без бар'єрів для доступу (без дозволу), інакше AI Agent буде обмежений різними стратегіями захисту від атак, служби повинні використовувати економічні витрати (Gas) для захисту від атак. У цьому сенсі платформи з низьким рівнем відкритості зіткнуться з великим ударом, як це було на початку Web2, коли сплеск відкритих платформ знову загориться.
2. AI Agent потрібно мати можливість оперувати коштами, щоб вирішувати вищезгадані проблеми.
Тобто в майбутньому сервіси, незалежно від того, чи базуються вони на блокчейні, повинні підтримувати ідентифікацію на основі приватних ключів Crypto, а також платежі на основі Crypto.
Поєднання AI Agent та блокчейну
Окрім вищезгаданих двох пунктів, напрямок, в якому досліджується, як AI може інтегруватися з блокчейном, є предметом обговорення. На заході я розмовляв з Mikkke про його проект focEliza. Два згадані типи AI Agent, принаймні перший, потребують середовища виконання або верифікації, яке надає блокчейн. Оскільки, як тільки AI Agent надає послуги зовні, виникає проблема довіри, його роль фактично подібна до ролі смарт-контракту.
Щодо назви "смарт-контракт" колись виникала суперечка: це всього лише фрагмент коду, де тут "інтелект"? AI може зробити смарт-контракт дійсно розумним. Проблема в тому, як викликати AI інтерфейс у середовищі смарт-контрактів. Якщо говорити про запуск великої моделі в перевірюваному середовищі, то цей шлях ще досить далекий, більш практичний шлях - це рішення на зразок Oracle.
І навколо AI Agent виникне безліч вимог: як отримати загальні знання про AI Agent? Як AI Agent може оцінювати факти? Як AI Agent може ідентифікувати одного й того ж користувача на різних платформах? Як зберігати "пам'ять" у смарт-контрактах? Якщо в мене є кілька пристроїв, кожен з яких має AI Agent, як вони можуть ділитися пам'яттю?
Ви виявите, що те, що раніше відбувалося в Web3, такі як "дані на блокчейні", відносини на блокчейні, DID, P2P мережі тощо, отримують новий сенс і нові сценарії.
Заключення
Повторюючи мої слова з 21 року про AI та блокчейн, інтернет, дружній до AI, також є інтернетом, дружнім до людства. Тоді це було лише мрія, але тепер майбутнє вже тут.