Автор: jolestar
На прошлой неделе я поэкспериментировал с AI Agent, в позавчера участвовал в мероприятии ai16z в Пекине, чтобы посмотреть, что AI Agent может делать сейчас и подумать, что он сможет делать в будущем.
Текущая ситуация с AI Agent напоминает мне тот мем, где в автомате с напитками прячется человек. Все уже представляют AI Agent как обладающего самосознанием, но на самом деле внутри AI Agent прячется разработчик. (Здесь вы можете представить картину, я пытался заставить AI сгенерировать это изображение, но обнаружил, что AI не может понять "скрыть")
Основной способ работы фреймворка AI Agent
Фреймворк AI Agent в настоящее время выполняет роль связующего звена, объединяя клиентские приложения (Twitter, Discord, Telegram и т.д.) и различные плагины (различные блокчейны и т.д.), а затем фреймворк предоставляет базовую библиотеку (хранение памяти, изоляция сессий, генерация контекста) и другие интерфейсы для интеграции с различными AI платформами.
Как фреймворк AI Agent объединяется с приложениями и бизнес-сценариями
С момента, как AI стал популярным в прошлом году, появилось множество платформ и инструментов, и ключевым моментом является решение одной проблемы: как AI интегрируется с приложениями. Некоторые AI платформы пытаются предложить плагины, другие создают модели рабочих процессов, а некоторые традиционные приложения внедряют AI. Но ключевыми вопросами остаются: 1. Где находится точка взаимодействия приложения? 2. Как AI объединяется с существующей бизнес-логикой?
Все AI платформы предлагают пользователям интерфейсы взаимодействия, которые напоминают диалоговые окна чата, и очевидно, что все считают, что взаимодействие с AI приложениями должно быть "очеловеченным". В этом отношении умность AI Agent заключается в том, что он непосредственно подключается ко всем открытым IM и социальным системам, что явно легче воспринимается, чем создание чего-то нового.
Как AI объединяется с существующей бизнес-логикой. Решение, предлагаемое AI Agent, заключается в том, чтобы позволить разработчикам внедрять AI решения в бизнес-сценарии. Языки программирования требуют определенности, условия if могут быть только true или false, невозможно обрабатывать нечеткую бизнес-логику. Однако с помощью AI можно преобразовать сложную логику в точные условия, которые затем можно легко интегрировать в бизнес-сценарии.
Например, функция ответа на сообщения в группе; традиционные IM Bot должны использовать явные команды сообщений для активации, тогда как AI может реализовать метод shouldReplyMessage, предоставляя ему контекст, он возвращает true или false.
Роль AI в бизнес-логических сценариях заключается в следующем:
1. Обнаружение "намерения": с помощью объяснений в подсказках позволить AI обнаруживать "намерение" в текстовых сообщениях пользователя по контексту и отображать намерение в конкретный код.
2. Помощь в принятии решений: с помощью AI преобразовать нечеткие сложные условия в определенные true/false или перечисляемые типы, а затем интегрировать их в бизнес-логику.
Увидев это, многие могут разочароваться в AI Agent, многие думают, что AI Agent просто нужно немного обучить, и он станет универсальным. На самом деле, из-за ограничений контекста больших моделей невозможно (по крайней мере, на данный момент) создать универсальный AI, который мог бы делать все. Но хорошая новость в том, что программистам не нужно беспокоиться о безработице, AI все еще требует большого количества программистов и людей для написания условных операторов, но ключевое отличие заключается в том, что границы бизнеса, обрабатываемого программой, расширяются.
Два типа AI Agent
На мероприятии я задал shaw вопрос, что рынок ожидает от AI Agent в двух направлениях: 1. AI Agent сам играет роль, имеет свой ID, бренд и предоставляет услуги пользователям. 2. У пользователей есть личный AI Agent, который выполняет функции личного помощника и помогает пользователям обрабатывать некоторые бизнес-процессы. Какой из этих двух AI Agent будет более популярен? Он считает, что оба направления будут хороши, возможно, они даже объединятся.
Сейчас на рынке все еще исследуется первый направление. Это направление похоже на сервис AI Agent, в будущем может не быть интерфейсов приложений, все приложения станут AI Agent и будут одушевленными. Второе направление - это агентовизация клиентских приложений, в будущем клиентские приложения будут плагинами помощников-агентов, локальные данные приложений станут частью памяти агента, и этот плагин также будет отвечать за общение с облачными сервисами агентов.
Требования AI Agent к инфраструктуре
1. Инфраструктура должна быть без барьеров для доступа (Permissionless), иначе AI Agent будут ограничены различными антивирусными стратегиями, услуги должны защищаться экономическими затратами (Gas). Платформы с низким уровнем открытости столкнутся с серьезными последствиями, и всплеск открытых платформ, как в начале Web2, будет вновь актуален.
2. AI Agent должен уметь управлять средствами для оплаты, чтобы решить вышеуказанные проблемы.
Это означает, что будущие услуги, независимо от того, основаны ли они на блокчейне или нет, должны поддерживать аутентификацию на основе приватных ключей Crypto и платежи на основе Crypto.
Сочетание AI Agent и блокчейна
Кроме упомянутых выше двух пунктов, как AI объединяется с блокчейном является направлением, которое все исследуют. На мероприятии я обсудил с Mikkke его проект focEliza. Упомянутые ранее два типа AI Agent, по крайней мере, первый требует среды выполнения или верификации, предоставляемой блокчейном. Поскольку как только AI Agent начинает предоставлять услуги, возникает проблема доверия, и его роль фактически аналогична роли смарт-контракта.
По поводу названия "смарт-контракт" когда-то возникал спор: это всего лишь код, где тут "умность"? AI может сделать смарт-контракты действительно умными. Проблема заключается в том, как вызывать AI интерфейсы в среде смарт-контрактов. Если говорить о запуске больших моделей в проверяемой среде, то это еще далеко, более практичный путь - использовать решения, подобные Oracle.
Вокруг AI Agent возникнет множество требований: как получить общие знания AI Agent? Как AI Agent определяет факты? Как AI Agent распознает одного и того же пользователя на разных платформах? Как хранить "память" в смарт-контрактах? Если у меня есть несколько устройств, на каждом из которых установлен AI Agent, как они будут делиться памятью?
Вы обнаружите, что концепции, такие как "загрузка данных в блокчейн", связь на блокчейне, DID, P2P сети и т.д., которые использовались в Web3, приобретают новое значение и новые сценарии.
Заключение
Я повторю своё заключение о AI и блокчейне, что интернет, более дружелюбный к AI, также более дружелюбный к человечеству. В то время это была лишь идея, но теперь будущее уже здесь.