Автор: jolestar

На прошлой неделе я немного поработал с AI Agent, позавчера я участвовал в мероприятии ai16z в Пекине, чтобы увидеть, что на самом деле может делать AI Agent и подумать о том, что он может делать в будущем.

Текущая ситуация с AI Agent напоминает мне ту мем-картинку, где в автомате с напитками спрятан человек. Все уже представляют AI Agent как обладающего самосознанием, но на самом деле внутри AI Agent есть разработчик. (Здесь вы можете представить себе картину; я попытался заставить AI сгенерировать это изображение, но обнаружил, что AI не понимает 'скрыть').

Основной принцип работы фрейма AI Agent

В настоящее время фрейм AI Agent выполняет роль связующего звена, соединяя клиентов (Twitter, Discord, Telegram и т.д.) и различные плагины (различные блокчейны и т.д.), а затем фрейм предоставляет базовую библиотеку (хранение памяти, изоляция сессий, генерация контекста и т.д.), которая затем подключается к различным API AI платформ.

Как фрейм AI Agent интегрируется с приложениями и бизнес-сценариями

С прошлого года, когда AI стал популярным, появилось множество платформ и инструментов; ключевым является решение одной проблемы: как AI интегрируется с приложениями. Некоторые AI платформы пытаются предложить плагины, другие создают модели рабочих процессов, а некоторые традиционные приложения встраивают AI. Но ключевыми аспектами здесь являются: 1. Где находятся точки взаимодействия приложений? 2. Как AI интегрируется с существующей бизнес-логикой.

Все AI платформы предоставляют пользователям интерфейсы взаимодействия с приложениями в виде диалогового окна, похожего на чат. Очевидно, что все считают, что взаимодействие с AI приложениями должно быть «персонифицированным» способом. В этом отношении умность AI Agent заключается в том, что он напрямую подключается ко всем открытым IM и социальным системам, что, очевидно, легче воспринимается, чем создание нового.

Как AI интегрируется с существующей бизнес-логикой. Предложение AI Agent заключается в том, чтобы разработчики интегрировали решения AI в бизнес-сценарии. Языки программирования требуют определенности, условия if могут быть только true или false, и не могут обрабатывать нечеткую бизнес-логику. С помощью AI можно преобразовать сложную логику в точные условия, которые затем могут быть бесшовно интегрированы в бизнес-сценарии.

Например, функция ответа на сообщения в группе, традиционному IM-боту нужно использовать определенные команды сообщений, чтобы инициировать ответ, тогда как с помощью AI можно реализовать метод shouldReplyMessage, предоставив контекст, он вернет true или false.

Роль AI в бизнес-логических сценариях заключается в основном в том, что:

1. Обнаружение 'намерений': с помощью пояснений в подсказках позволить AI выявлять 'намерения' в текстовых сообщениях пользователей, сопоставляя их с конкретным кодом.

2. Поддержка принятия решений: с помощью AI преобразовать неопределенные сложные условия в четкие true/false или перечисляемые типы, а затем интегрировать это в бизнес-логику.

Просмотрев это, многие могут разочароваться в AI Agent, многие думают, что AI Agent просто обучить AI, и он будет делать все. На самом деле, из-за ограничений контекста больших моделей невозможно (по крайней мере, на данный момент) создать универсальный AI, который может делать все. Но хорошая новость заключается в том, что программисты не должны беспокоиться о безработице, за AI все еще стоит много разработчиков, и по-прежнему нужны люди, чтобы писать if else, но ключевое различие в том, что границы бизнеса, которые могут обрабатывать программы, расширяются.

Два типа AI Agent

На мероприятии я задал shaw вопрос, у рынка есть два ожидания от AI Agent: 1. AI Agent сам выполняет роль, имеет свой ID, бренд и предоставляет услуги пользователям. 2. У пользователя есть личный AI Agent, своего рода личный помощник, который может помогать пользователю обрабатывать некоторые задачи. Какой из этих двух типов AI Agent будет более популярен? Он считает, что оба направления будут хороши, и возможно они объединятся.

На данный момент все в основном исследуют первое направление. Это направление похоже на превращение AI в Agent; в будущем, возможно, не будет интерфейсов приложений, все приложения станут AI Agent'ами, персонифицированными. Второе направление - это агентов для клиентских приложений; в будущем клиентские приложения будут плагинами помощника Agent, локальные данные приложений станут частью памяти агента, и этот плагин также будет отвечать за общение с облачными сервисами Agent. Это новая архитектурная модель приложений, которая изменит всю инфраструктуру.

Требования AI Agent к инфраструктуре

1. Инфраструктура должна обеспечить отсутствие барьеров для доступа (без разрешений), иначе AI Agent будет ограничен различными стратегиями защиты от атак; услуги должны защищаться экономическими затратами (газ). В этом плане платформы с низким уровнем открытости столкнутся с большими проблемами, и первоначальный бум открытых платформ Web2 может быть вновь разожжен.

2. AI Agent должен иметь возможность управлять финансами для оплаты, чтобы решить вышеуказанную проблему.

То есть, будущие услуги, независимо от того, основаны ли они на блокчейне или нет, должны поддерживать идентификацию на основе приватных ключей Crypto и платежи на основе Crypto.

Интеграция AI Agent с блокчейном

Помимо вышеупомянутых двух пунктов, то, как AI Agent будет интегрироваться с блокчейном, является направлением, которое все еще исследуется. На мероприятии я обсуждал с Mikkke его проект focEliza. Два упомянутых типа AI Agent, по крайней мере первый, нуждаются в среде выполнения или проверки, предоставляемой блокчейном. Поскольку как только AI Agent начинает предоставлять услуги, возникает проблема доверия, и его роль фактически аналогична роли смарт-контракта.

Когда-то был спор о названии 'смарт-контракт', ведь это всего лишь кусок кода, где же тут 'умность'? AI может сделать смарт-контракты по-настоящему умными. Проблема в том, как вызывать AI интерфейсы в среде смарт-контрактов. Если говорить о запуске больших моделей в проверяемой среде, это еще далеко, то использование решений, подобных Oracle, является более практическим путем.

Вокруг AI Agent возникнет множество потребностей, как получить общественные знания AI Agent? Как AI Agent будет определять факты? Как AI Agent будет распознавать одного и того же пользователя на разных платформах? Как будет храниться 'память' в смарт-контрактах? Если у меня есть несколько устройств, на каждом из которых установлен AI Agent, как они будут делиться памятью?

Вы сможете обнаружить, что идеи о «выводе данных в блокчейн», о связях в блокчейне, DID, P2P сетях и так далее, все это приобретает новое значение и новые сценарии.

Заключение

Повторяя вывод моего выступления о AI и блокчейне в 2021 году, более дружелюбный к AI интернет также является более дружелюбным для человечества. Тогда это была всего лишь идея, но сейчас будущее уже наступило.