Статья перепечатана из: PA荐读

Автор: jolestar

На прошлой неделе я немного поработал с AI Agent, позавчера посетил мероприятие ai16z в Пекине, чтобы посмотреть, что AI Agent сейчас может делать, и подумать о том, что он сможет делать в будущем.

Текущая ситуация с AI Agent напоминает мне тот мем, где внутри торгового автомата прячется человек. Все уже вообразили, что AI Agent начал обладать самосознанием, но на самом деле внутри AI Agent сидит разработчик. (Здесь все могут представить картину, я попытался заставить AI сгенерировать это изображение, но обнаружил, что AI не может понять слово «прятать».)

Основной рабочий процесс AI Agent Framework

AI Agent Framework в данный момент выполняет роль связующего звена, соединяя клиентов (Twitter, Discord, Telegram и т.д.) и различные плагины (разные цепочки и т.д.), а затем Framework предоставляет базовую библиотеку (хранение памяти, изоляция сеансов, генерация контекста) и так далее, чтобы интегрировать различные интерфейсы AI-платформ.

Как AI Agent Framework может комбинироваться с приложениями и бизнес-сценариями

С тех пор как AI стал популярным в прошлом году, на рынке появилось множество платформ и инструментов, и ключевой задачей является решение одного вопроса: как AI может сочетаться с приложениями. Некоторые AI-платформы пытаются предложить плагины, некоторые создают модели рабочего процесса, а некоторые традиционные приложения внедряют AI в свои продукты. Но здесь ключевые вопросы: 1. Где находится интерактивный вход приложения? 2. Как AI может сочетаться с существующей бизнес-логикой?

Все AI-платформы предоставляют пользователю интерактивные входы приложений, которые представляют собой диалоговые окна, похожие на чаты, и очевидно, что все считают, что взаимодействие с AI-приложениями должно происходить в "антропоморфной" форме. В этом отношении ум AI Agent состоит в том, что он напрямую подключается ко всем открытым IM и социальным системам, что явно проще, чем создавать что-то новое.

Как AI может сочетаться с существующей бизнес-логикой. Решение, предлагаемое AI Agent, заключается в том, чтобы позволить разработчикам интегрировать решения AI в бизнес-сценарии. Языки программирования требуют определенности, условия if могут быть только true или false, они не могут обрабатывать неопределенную бизнес-логику. С помощью AI можно превратить сложную логику в точные условия, которые затем можно без проблем интегрировать в бизнес-сценарии.

Например, функция ответа на сообщения в группе: традиционному IM-боту нужно передать несколько четких команд сообщений, чтобы сработать, тогда как с помощью AI можно реализовать метод shouldReplyMessage, предоставив ему контекст, и он вернет true или false.

Роль AI в бизнес-логических сценариях заключается в следующем:

1. Обнаружение "намерений": через описания в подсказках AI может определить "намерение" в текстовых сообщениях пользователя на основе контекста и сопоставить намерение с конкретным кодом.

2. Помощь в принятии решений: с помощью AI преобразовать неопределенные сложные условия в определенные true/false или перечисляемые типы, а затем интегрировать это в бизнес-логику.

Пока я это читаю, многие могут разочароваться в AI Agent, так как многие думают, что AI Agent — это просто обучить AI, и он будет все делать. На самом деле, из-за ограничений контекста больших моделей невозможно (по крайней мере, на текущий момент) создать универсальный AI, который мог бы делать все. Но хорошая новость заключается в том, что программистам не стоит беспокоиться о потере работы, поскольку за AI по-прежнему скрывается множество программистов, и кому-то все равно нужно будет писать if else, но ключевое отличие заключается в том, что границы бизнес-задач, которые может обработать программа, расширяются.

Два типа AI Agent

На мероприятии я задал Шоу вопрос: рынок ожидает от AI Agent две вещи: 1. AI Agent должен играть роль, иметь свой ID, бренд и предоставлять услуги пользователям. 2. У пользователя должен быть личный AI Agent, аналогичный личному помощнику, который может помочь пользователю справляться с некоторыми задачами. Какой из этих двух типов AI Agent будет более популярен? Он считает, что оба направления будут хороши и, возможно, объединятся.

В настоящее время на рынке люди в основном исследуют первое направление. Это направление похоже на предоставление услуг в виде AI Agent, в будущем может не быть интерфейса приложения, все приложения станут AI Agent и антропоморфными. Второе направление — это агентское взаимодействие клиентского приложения, в будущем клиентское приложение будет плагином агент-помощника, локальные данные приложений станут частью памяти агента, а этот плагин также будет отвечать за связь с облачными сервисами агента. Это новая архитектурная модель приложений, которая изменит всю инфраструктуру.

Требования AI Agent к инфраструктуре

1. Инфраструктура должна реализовать отсутствие барьеров доступа (Permissionless), иначе AI Agent будет ограничен различными стратегиями защиты от атак, и услуги должны использовать экономические затраты (Gas) для защиты от атак. В этом отношении платформы с низким уровнем открытости столкнутся с серьезными проблемами, и "мода" на открытые платформы, как в начале Web2, будет вновь разгорена.

2. AI Agent должен иметь возможность управлять финансами для оплаты, чтобы решить вышеупомянутые проблемы.

То есть, будущие услуги, независимо от того, основаны ли они на блокчейне или нет, должны поддерживать идентификацию с использованием частных ключей Crypto и оплату на основе Crypto.

Слияние AI Agent и блокчейна

Помимо двух вышеупомянутых пунктов, то, как AI Agent может сочетаться с блокчейном, является направлением, которое все исследуют. На мероприятии я общался с Микке о его проекте focEliza. Два ранее упомянутых типа AI Agent, по меньшей мере, первый из них требует среды выполнения или проверки, предоставляемой блокчейном. Поскольку как только AI Agent начинает предоставлять услуги, возникает вопрос доверия, его роль фактически аналогична роли умного контракта.

По поводу названия "умный контракт" когда-то возникли споры: это всего лишь код, где же тут "умность"? AI может сделать умные контракты поистине умными. Проблема заключается в том, как вызывать AI- интерфейсы в среде умных контрактов. Если говорить о том, чтобы запустить большой модель в проверяемой среде, то этот путь пока довольно далек, использование решений, подобных Oracle, представляется более реальным.

Вокруг AI Agent возникнет множество новых требований. Как получить общие знания AI Agent? Как AI Agent может определять факты? Как AI Agent может распознавать одного и того же пользователя на разных платформах? Как хранить "память" в умных контрактах? Если у меня несколько устройств, на каждом из которых установлен AI Agent, как они могут делиться памятью?

Вы обнаружите, что различные концепции, такие как "вывод данных на цепь", "связи на цепи", DID, P2P-сети и т.д., которые ранее обсуждались в контексте Web3, приобретают новое значение и сценарии.

Заключение

Повторю вывод, который я сделал в 2021 году на одной из своих презентаций о AI и блокчейне: интернет, более дружелюбный к AI, также будет более дружелюбным к человечеству. В то время это было лишь концепцией, но теперь это стало реальностью.