Автор: jolestar
На минулому тижні я трохи попрацював над AI Agent, позавчора я взяв участь у заході ai16z у Пекіні, щоб подивитися, що насправді може робити AI Agent і подумати про те, що він може зробити в майбутньому.
Стан AI Agent нагадав мені про той мем, де в автоматі з продажу ховається людина. Усі вже уявляють, що AI Agent починає мати самосвідомість, але насправді в AI Agent ховається розробник. (Тут уявіть картину, я намагався змусити AI створити це зображення, але виявилося, що AI не може зрозуміти 'сховати').
Основний спосіб роботи фрейму AI Agent
Фрейм AI Agent наразі виконує роль клею, поєднуючи клієнтів (Twitter, Discord, Telegram тощо) та різні плагіни (різні ланцюги тощо), а потім фрейм надає базову бібліотеку (зберігання пам'яті, ізоляція сеансів, генерація контексту) тощо, згодом підключаючи різні AI платформи.
Як фрейм AI Agent може поєднуватися з додатками та бізнес-сценаріями
З моменту буму AI минулого року з'явилося безліч платформ і інструментів, і найголовніше - вирішити одне питання: як AI поєднується з додатками. Деякі AI платформи намагаються надати плагіни, інші створюють моделі робочих процесів, а деякі традиційні додатки вбудовують AI в себе. Але тут ключове питання: 1. Де знаходиться точка взаємодії додатка? 2. Як AI поєднується з існуючою бізнес-логікою?
Всі AI платформи надають користувачам інтерфейс для взаємодії, схожий на вікно чату, і всі вважають, що взаємодія з AI додатками повинна бути «персоніфікованою». AI Agent в цьому відношенні розумний тим, що він безпосередньо підключається до всіх відкритих IM та соціальних систем, що, безумовно, легше прийняти, ніж створювати щось нове.
Як AI поєднується з існуючою бізнес-логікою. Рішення, яке пропонує AI Agent, полягає в тому, щоб дозволити розробникам інтегрувати рішення AI в бізнес-сценарії. Мова програмування вимагає детермінованості, умова if може бути лише true або false, і не може обробляти розмиту бізнес-логіку. Але за допомогою AI можна перетворити складну логіку на точні умови, які можна безперешкодно інтегрувати в бізнес-сценарії.
Наприклад, функція відповіді на повідомлення в групі: традиційний IM Bot повинен отримати чіткі команди для активації, тоді як AI може реалізувати метод shouldReplyMessage, надавши йому контекст, він повертає true або false.
Основна роль AI в бізнес-логічних сценаріях полягає в тому, що:
1. Виявлення 'інтенцій': через пояснення в підказках дати можливість AI виявити 'інтенцію' текстового повідомлення користувача на основі контексту та відобразити цю інтенцію на конкретному коді.
2. Допомога в прийнятті рішень: за допомогою AI перетворити розмиті складні умови на визначені true/false або типи переліку, а потім поєднати їх з бізнес-логікою.
Багато людей можуть розчаруватися в AI Agent, адже багато хто вважає, що AI Agent - це просто навчити AI, і він зможе робити все. Насправді, через обмеження контексту великої моделі, неможливо (принаймні наразі) створити універсальний AI, який міг би виконувати будь-які завдання. Але хороша новина в тому, що програмістам не варто турбуватися про безробіття; AI все ще потребує великої кількості програмістів, і комусь потрібно продовжувати писати if else, але ключова відмінність полягає в тому, що межі бізнесу, які можуть обробляти програми, розширюються.
Два типи AI Agent
На заході я запитав Шава одне питання: ринок має дві очікування від AI Agent: 1. AI Agent сам виконує роль, має свій ID, бренд і надає послуги користувачам. 2. Користувач має особистого AI Agent, що є своєрідним особистим помічником, який може допомогти користувачу обробляти різні бізнеси. Який з цих двох AI Agent буде більш популярним? Він вважає, що обидва напрямки будуть хорошими, також можливо, вони можуть об'єднатися.
На сьогоднішній день основні дослідження на ринку все ще зосереджені на першому напрямку. Цей напрямок подібний до сервісу AI Agent, у майбутньому, можливо, не буде інтерфейсу додатка, усі додатки будуть AI Agent, персоніфікованими. Другий напрямок - це агентизація клієнта програми, де майбутні клієнти програми будуть плагіном помічника-агента, а локальні дані програми стануть частиною пам'яті агента, одночасно цей плагін також відповідатиме за зв'язок з агентом у хмарі. І це нова архітектурна модель для додатків, яка змінить всю інфраструктуру.
Вимоги AI Agent до інфраструктури
1. Інфраструктура повинна реалізувати відсутність бар'єрів для доступу (Permissionless), інакше AI Agent буде обмежений різними стратегіями захисту від атак, послуги повинні бути захищені економічними витратами (Gas). У цьому відношенні платформи з низькою відкритістю зіткнуться з великим впливом, і сплеск відкритих платформ початку Web2 знову може спалахнути.
AI Agent повинен мати можливість проводити фінансові операції для вирішення вищезгаданої проблеми.
Тобто, майбутні послуги, незалежно від того, чи базуються вони на блокчейні, повинні підтримувати аутентифікацію особи за допомогою приватних ключів Crypto та платіж на основі Crypto.
Поєднання AI Agent і ланцюга
Окрім двох вищезгаданих пунктів, як AI Agent поєднується з ланцюгом є напрямком, який досліджують усі. На заході я спілкувався з Мікке про те, що він робить з focEliza. Два раніше згадані типи AI Agent, принаймні перший, потребують середовища виконання або перевірки, яке надає ланцюг. Оскільки, як тільки AI Agent починає надавати послуги, виникає проблема довіри; роль, яку він виконує, насправді аналогічна розумному контракту.
Щодо назви 'розумний контракт' колись існувала суперечка, адже це всього лише частина коду, де тут 'розумність'? AI може зробити розумний контракт по-справжньому розумним. Головне питання полягає в тому, як викликати AI інтерфейси в середовищі розумного контракту. Якщо говорити про запуск великої моделі в перевірюваному середовищі, це ще досить далека перспектива, тоді як рішення, подібне до Oracle, є більш реалістичним шляхом.
Оточуючи AI Agent, виникає безліч запитів: як отримати загальні знання про AI Agent? Як AI Agent може визначити факти? Як AI Agent може розпізнати одного й того ж користувача на різних платформах? Як 'пам'ять' у розумному контракті може зберігатися? Якщо в мене є кілька пристроїв, на кожному з яких встановлений AI Agent, як вони можуть ділитися пам'яттю?
Ви виявите, що те, що було зроблено у Web3, таке як «дані на ланцюзі», відносини на ланцюзі, DID, P2P мережі тощо, має нове значення та нові контексти.
Висновок
Повторюючи мій висновок з виступу про AI та блокчейн у 2021 році: Інтернет, більш дружній до AI, також є більш дружнім до людства. Тоді це був лише мозковий штурм, але тепер майбутнє вже настало.