Автор: 0XNATALIE
З початку цього року тема AI Agent продовжує набирати популярність. Спочатку AI чат-бот terminal of truths завдяки своїм гумористичним постам і відповідям на X (схожі на «Роберта» в Weibo) привернув велику увагу і отримав 50 тисяч доларів від засновника a16z Марка Андріссена. Натхненні його публікаціями, деякі створили токен GOAT, який за всього за 24 години зріс більш ніж на 10000%. Тема AI Agent відразу ж привернула увагу спільноти Web3. Пізніше з'явився перший децентралізований AI торговий фонд на базі Solana ai16z, який випустив платформу для розробки AI Agent Eliza, що викликало суперечку між великими та малими токенами. Однак спільнота досі не зовсім розуміє концепцію AI Agent: що насправді є його суттю? Чим він відрізняється від торгових ботів Telegram?
Принцип роботи: сприйняття, міркування та автономне прийняття рішень.
AI Agent - це система інтелектуального агента на основі великих мовних моделей (LLM), здатна сприймати навколишнє середовище, приймати рішення на основі міркувань та виконувати складні завдання через виклик інструментів або виконання дій. Робочий процес: модуль спостереження (отримання введення) → LLM (розуміння, міркування та планування) → виклик інструментів (виконання завдання) → зворотний зв'язок та оптимізація (перевірка та коригування).
Конкретно, AI Agent спочатку отримує дані з зовнішнього середовища через модуль спостереження (такі як текст, аудіо, зображення тощо) та перетворює їх на оброблювальну структуровану інформацію. LLM як основний компонент надає потужні можливості розуміння та генерації природної мови, виступаючи у ролі «мозку» системи. На основі введених даних та наявних знань, LLM проводить логічне міркування, генеруючи можливі рішення або розробляючи плани дій. Потім AI Agent виконує конкретні завдання, викликаючи зовнішні інструменти, плагіни або API, та перевіряє та коригує результати на основі зворотного зв'язку, формуючи замкнуту оптимізацію.
У сценаріях застосування Web3, чим AI Agent відрізняється від торгових ботів Telegram або автоматизованих скриптів? Наприклад, у випадку арбітражу, користувач хоче здійснити арбітражну угоду за умови, що прибуток перевищує 1%. У торгових ботах Telegram, що підтримують арбітраж, користувач встановлює стратегію торгівлі, коли прибуток перевищує 1%, бот починає виконувати. Однак, коли ринок часто коливається, можливості арбітражу постійно змінюються, ці боти не мають можливості оцінки ризиків, вони просто виконують арбітраж, якщо умова прибутку більше 1% виконується. На відміну від цього, AI Agent може автоматично коригувати стратегію. Наприклад, коли прибуток з якоїсь угоди перевищує 1%, але через аналіз даних оцінює, що ризик занадто високий, ринок може раптово змінитися, що призведе до збитків, він вирішить не виконувати цю угоду.
Отже, AI Agent має здатність до саморегуляції, його основна перевага полягає в можливості самостійного навчання та автономного прийняття рішень, завдяки взаємодії з оточенням (таким як ринок, поведінка користувачів тощо), коригуючи стратегії дій на основі сигналів зворотного зв'язку, постійно покращуючи ефективність виконання завдань. Він також може приймати рішення в реальному часі на основі зовнішніх даних і постійно оптимізувати стратегії прийняття рішень через посилене навчання.
Чи не нагадує це трохи рішення в рамках інтерпретації намірів? AI Agent сам по собі також є продуктом, заснованим на намірах, відмінність між ним та рішеннями в рамках інтерпретації намірів полягає в тому, що рішення спираються на точні алгоритми, мають математичну строгість, тоді як AI Agent приймає рішення на основі навчання даних, часто потребує постійного проб і помилок під час навчання, щоб наблизитися до оптимального рішення.
Основні фреймворки AI Agent
AI Agent є інфраструктурою для створення та управління інтелектуальними агентами. Наразі в Web3 досить популярні такі платформи, як Eliza від ai16z, ZerePy від zerebro та GAME від Virtuals.
Eliza є багатофункціональною платформою AI Agent, побудованою на TypeScript, яка підтримує роботу на кількох платформах (таких як Discord, Twitter, Telegram тощо) та завдяки складному управлінню пам'яттю здатна запам'ятовувати попередні розмови та контекст, зберігаючи стабільні й узгоджені риси особистості та знання у відповідях. Eliza використовує RAG (Retrieval Augmented Generation) систему, яка дозволяє отримувати доступ до зовнішніх баз даних або ресурсів для генерації більш точних відповідей. Крім того, Eliza інтегрує плагін TEE, що дозволяє розгортати в TEE з метою забезпечення безпеки та конфіденційності даних.
GAME - це фреймворк, що надає можливості та управляє AI Agent для автономного прийняття рішень та дій. Розробники можуть налаштовувати поведінку агентів відповідно до своїх потреб, розширювати їх функціональність і надавати налаштовані дії (такі як публікація в соціальних мережах, відповіді тощо). Різні функції у фреймворку, такі як позиція середовища агента та завдання тощо, розділені на кілька модулів, що полегшує розробникам налаштування та управління. Фреймворк GAME розділяє процес прийняття рішень AI Agent на два рівні: високий рівень планування (HLP) та низький рівень планування (LLP), які відповідають за різні рівні завдань і рішень. Високий рівень планування відповідає за встановлення загальних цілей агента і планування завдань, формуючи рішення на основі цілей, особистості, фонової інформації та стану середовища, визначаючи пріоритети завдань. Низький рівень планування зосереджується на виконанні, перетворюючи рішення високого рівня в конкретні операційні кроки, вибираючи відповідні функції та методи дій.
ZerePy - це відкритий Python фреймворк для розгортання AI Agent на X. Цей фреймворк інтегрує LLM, надані OpenAI та Anthropic, що дозволяє розробникам створювати та управляти соціальними медіа-агентами, автоматизуючи виконання таких дій, як публікація твітів, відповіді на твіти, лайки тощо. Кожне завдання може мати різні ваги відповідно до його важливості. ZerePy надає простий інтерфейс командного рядка (CLI), що дозволяє розробникам швидко запускати та управляти агентами. Крім того, фреймворк також надає шаблон Replit (онлайн-платформа для редагування та виконання коду), що дозволяє розробникам швидко почати працювати з ZerePy без складної локальної конфігурації.
Чому AI Agent стикається з FUD?
AI Agent, здавалося б, розумний, здатний знизити бар'єри входу та підвищити користувацький досвід, чому ж у спільноті виникає FUD? Причина в тому, що AI Agent в основному залишається інструментом, який поки що не може виконати весь робочий процес, він може лише підвищити ефективність і зекономити час на деяких етапах. І в поточному етапі розвитку роль AI Agent в основному зосереджена на допомозі користувачам в одноразовому випуску MeMe та управлінні обліковими записами в соціальних мережах. Спільнота жартує, що «активи належать розробникам, а зобов'язання - AI».
Проте цього тижня aiPool випустив AI Agent в рамках попереднього продажу токенів, використовуючи технологію TEE для досягнення деструктивності. Приватний ключ гаманця цього AI Agent динамічно генерується в середовищі TEE, що забезпечує безпеку. Користувачі можуть надсилати кошти (наприклад, SOL) на гаманець, контрольований AI Agent, який потім створює токени відповідно до встановлених правил та запускає ліквідний пул на DEX, одночасно розподіляючи токени серед кваліфікованих інвесторів. Увесь процес не потребує залучення жодних третіх сторін, повністю виконується AI Agent в середовищі TEE, що дозволяє уникнути звичайних ризиків rug pull у DeFi. Очевидно, AI Agent поступово розвивається. Я вважаю, що AI Agent може допомогти користувачам знизити бар'єри входу, підвищити досвід, навіть якщо це просто спростить частину процесу випуску активів, це вже має значення. Але з макро-інперської точки зору на Web3, AI Agent як продукт поза ланцюгом на даному етапі лише виконує роль інструменту для допомоги смарт-контрактам, тому не варто надто хвалити його можливості. Через відсутність значних наративів про багатство, окрім MeMe, в другій половині цього року, хайп навколо AI Agent, що розгортається навколо MeMe, також є нормальним. Однак лише MeMe не може підтримувати довгострокову цінність, тому якщо AI Agent зможе запропонувати більше інновацій у процесі торгівлі, надавши реальну цінність, він, можливо, розвине до загального інфраструктурного інструменту.