Автор: Исследователь YBB Capital Zeke

Один, Начало увлечения вниманием

За последний год, из-за отсутствия нарратива на прикладном уровне, который не может соответствовать скорости роста инфраструктуры, криптообласть постепенно превратилась в игру за ресурсы внимания. От Silly Dragon до Goat, от Pump.fun до Clanker, постоянное желание новизны в внимании привело к тому, что эта борьба за внимание стала полностью внутренней. С самого банального начала, направленного на привлечение внимания, быстро перешли к модели единой платформы, где потребители и поставщики внимания объединены, затем кремниевые существа стали новыми поставщиками контента. В разнообразных формах Meme Coin наконец-то появилась сущность, которая может позволить розничным инвесторам и VC достичь консенсуса: AI Agent.

Внимание в конечном итоге является нулевой суммой игры, однако спекуляция действительно может способствовать диким ростам вещей. Мы в статье о UNI уже вспоминали о начале золотого века блокчейна, причиной резкого роста DeFi стало начало эпохи LP-майнинга, открытой Compound Finance, и входы и выходы из тысяч и даже десятков тысяч различных пулов на Apy стали самой примитивной игрой на цепочке того времени, хотя конечной ситуацией стало крах различных пулов. Но безумный наплыв золотых шахтеров действительно оставил блокчейну беспрецедентную ликвидность, и в конечном итоге DeFi вышел за рамки чистой спекуляции и сформировал зрелую дорожку, удовлетворяющую финансовые потребности пользователей в таких аспектах, как платежи, торговля, арбитраж, залог и так далее. AI Agent в настоящее время также проходит этот дикий этап, мы исследуем, как Crypto может лучше интегрироваться с AI и в конечном итоге способствовать подъему приложенческого уровня на новые высоты.

Два, Как интеллект действует самостоятельно

В предыдущей статье мы кратко представили происхождение AI Meme: Truth Terminal и перспективы AI Agent, в этой статье сначала сосредоточимся на самом AI Agent.

Сначала мы начнем с определения AI Agent, агент в области AI - это довольно старое, но неопределенное слово, которое подчеркивает автономность (Autonomous), то есть любой AI, который может воспринимать окружающую среду и реагировать, можно назвать агентом. В современном определении AI Agent ближе к интеллекту, то есть задается большая модель, имитирующая человеческие решения, эта система в научных кругах рассматривается как наиболее перспективный путь к AGI (обобщенному искусственному интеллекту).

В ранних версиях GPT мы явно могли почувствовать, что большие модели очень похожи на людей, но при ответах на многие сложные вопросы большие модели могли предоставить только некоторые расплывчатые ответы. Основная причина в том, что тогда большие модели базировались на вероятности, а не на причинности, и кроме того, им не хватало таких возможностей, как использование инструментов, память, планирование, которые есть у человека, в то время как AI Agent может восполнить эти недостатки. Таким образом, формула для обобщения будет следующей: AI Agent (интеллект) = LLM (большая модель) + Планирование + Память + Инструменты.

Большая модель, основанная на подсказках (Prompt), больше похожа на статического человека, она оживает только тогда, когда мы вводим. Цель интеллекта - быть более настоящим человеком. В настоящее время внутри сообщества интеллект в основном основан на микронастраиваемых моделях Meta с открытым исходным кодом Llama 70b или 405b (с разными параметрами), обладающих памятью и способностью использовать инструменты API, в других аспектах может потребоваться помощь или ввод от человека (включая взаимодействие и сотрудничество с другими интеллектами), поэтому мы можем видеть, что основные интеллекты сейчас все еще существуют в виде KOL в социальных сетях. Чтобы интеллект стал более похожим на человека, необходимо подключить планирование и действия, причем подзадача в планировании, цепочка мышления, особенно критична.

Три, Цепочка мышления (Chain of Thought, CoT)

Концепция цепочки мышления (Chain of Thought, CoT) впервые появилась в статье, опубликованной Google в 2022 году (Chain-of-Thought Prompting Elicits Reasoning in Large Language Models), в которой указывалось, что можно улучшить способности рассуждения модели, создавая ряд промежуточных шагов рассуждения, что помогает модели лучше понимать и решать сложные задачи.

Типичный CoT Prompt состоит из трех частей: четкое описание задачи, логические основания, поддерживающие решение задачи, теоретическая основа или принцип, конкретные решения, демонстрирующие такую структуру, и помогает модели понять требования задачи, постепенно приближаясь к ответу через логическое рассуждение, что повышает эффективность и точность решения проблемы. CoT особенно подходит для задач, требующих глубокого анализа и многопошагового рассуждения, таких как решение математических задач, написание отчетов по проектам и т. д. Для простых задач CoT может не принести очевидных преимуществ, но для сложных задач она может значительно повысить производительность модели, снижая процент ошибок благодаря пошаговым стратегиям.

При создании AI Agent CoT сыграла ключевую роль, AI Agent должен понимать полученную информацию и делать на ее основе разумные решения, CoT, предоставляя упорядоченный способ мышления, помогает агенту эффективно обрабатывать и анализировать входящую информацию, превращая результаты анализа в конкретные руководства по действиям. Этот метод не только усиливает надежность и эффективность решений агента, но и повышает прозрачность процесса принятия решений, что делает поведение агента более предсказуемым и отслеживаемым. CoT, разбивая задачи на несколько небольших шагов, помогает агенту детально обдумать каждую точку принятия решения, уменьшая вероятность ошибочных решений из-за избытка информации. CoT делает процесс принятия решений агента более прозрачным, пользователям проще понять основания решений агента. В процессе взаимодействия с окружающей средой CoT позволяет агенту постоянно обучаться новой информации и корректировать стратегии поведения.

CoT как эффективная стратегия не только улучшила способности рассуждения крупных языковых моделей, но и сыграла важную роль в создании более интеллектуальных и надежных AI Agent. Используя CoT, исследователи и разработчики могут создать более адаптивные к сложным условиям интеллектуальные системы с высокой степенью автономности. CoT продемонстрировала свои уникальные преимущества на практике, особенно при решении сложных задач, благодаря разбиению задач на ряд небольших шагов, что не только повысило точность решения задач, но и улучшило объяснимость и управляемость модели. Этот пошаговый подход к решению задач может значительно снизить вероятность ошибочных решений при столкновении с сложными задачами из-за избытка или чрезмерной сложности информации. В то же время, этот подход также повышает прослеживаемость и проверяемость всего решения.

Основная функция CoT заключается в том, чтобы объединить планирование, действия и наблюдения, закрывая разрыв между рассуждением и действиями. Эта мыслительная модель позволяет AI Agent разрабатывать эффективные стратегии при прогнозировании возможных отклонений, а также накапливать новую информацию, взаимодействуя с внешней средой, и проверять заранее установленные прогнозы, предоставляя новые основания для рассуждения. CoT является мощным двигателем точности и стабильности, который помогает AI Agent поддерживать высокую эффективность работы в сложных условиях.

Четыре, Правильный ложный спрос

С чем именно Crypto должно интегрироваться в стеке технологий AI? В статье прошлого года я считал, что децентрализация вычислений и данных является ключевым шагом для экономии затрат малых предприятий и индивидуальных разработчиков, а в этом году в детализированном сегменте Crypto x AI, собранном Coinbase, мы увидели более подробное разделение:

(1) Вычислительный уровень (это сеть, сосредоточенная на предоставлении ресурсов графического процессора (GPU) для разработчиков AI);

(2) Уровень данных (это сеть, поддерживающая децентрализованный доступ, организацию и проверку AI данных);

(3) Уровень посредника (это платформы или сети, поддерживающие разработку, развертывание и хостинг моделей AI или интеллектов);

(4) Приложенческий уровень (это продукты, ориентированные на пользователя, использующие механизмы AI на цепочке, независимо от того, B2B или B2C).

В этих четырех уровнях каждое направление имеет грандиозные цели, которые, в конечном счете, направлены на противостояние доминированию гигантов Кремниевой долины в следующую эпоху интернета. Как я говорил в прошлом году, действительно ли мы должны принять, что гиганты Кремниевой долины эксклюзивно контролируют вычислительные мощности и данные? Закрытые большие модели, находящиеся под их монополией, представляют собой черный ящик, и наука, как самая веруемая религия человечества, будет воспринимать каждое слово, произнесенное этими большими моделями, как истину, но как можно проверить эту истину? Согласно замыслу гигантов Кремниевой долины, права, которые в конечном итоге будут у интеллекта, превзойдут все ожидания, например, право на оплату из вашего кошелька, право на использование терминала и как можно гарантировать, что у человека не будет злых намерений?

Децентрализация - единственный ответ, но иногда нужно разумно рассмотреть, сколько плательщиков за эти грандиозные идеи существует? В прошлом мы могли не учитывать коммерческий замык, чтобы компенсировать ошибки, вызванные идеализацией через токены. Однако нынешняя ситуация очень серьезна, Crypto x AI требует дополнительно учитывать реальную ситуацию в дизайне, например, как сбалансировать обе стороны в условиях потерь производительности и нестабильности на уровне вычислений? Чтобы достичь конкурентоспособности централизованного облака. Сколько реальных пользователей будет у проектов на уровне данных, как проверить реальную эффективность предоставляемых данных, и какие клиенты нуждаются в этих данных? Остальные два уровня аналогичны, в эту эпоху нам не нужно столько, казалось бы, правильных ложных потребностей.

Пять, Meme вышел на SocialFi

Как я уже говорил в первом абзаце, Meme уже с невероятной скоростью вышел на соответствующую форму SocialFi в Web3. Friend.tech стал первым Dapp, который выстрелил в этом раунде социальных приложений, но, к сожалению, потерпел неудачу из-за поспешного дизайна токенов. Pump.fun подтвердил осуществимость чисто платформенной модели, не делая никаких токенов и не устанавливая никаких правил. Потребители и поставщики внимания объединены, вы можете размещать мемы, вести прямые трансляции, выпускать токены, оставлять комментарии, торговать - все свободно, Pump.fun взимает только плату за услуги. Это практически соответствует модели экономики внимания в современных социальных медиа, таких как YouTube, Ins, только целевая аудитория отличается, в плане игрового процесса Pump.fun в большей степени соответствует Web3.

Base Clanker является собирателем, благодаря интегрированной экосистеме, управляемой экосистемой, Base имеет собственный социальный Dapp в качестве вспомогательного средства, образуя полный внутренний замкнутый цикл. Интеллект Meme - это форма Meme Coin 2.0, человек всегда стремится к новизне, и Pump.fun сейчас находится на пике популярности, с точки зрения тренда мысли кремниевых существ вполне могут заменить банальные шутки углеродных существ, это лишь вопрос времени.

Я уже упоминал Base множество раз, просто каждый раз содержание упоминания разное, с точки зрения временной шкалы, Base никогда не был первым, но всегда был победителем.

六、智能ый агент может быть чем-то еще?

С практической точки зрения, в ближайшее время интеллекту невозможно будет децентрализовать, с точки зрения традиционной области AI, создание интеллекта не является простой задачей децентрализации и открытого исходного кода, это требует подключения различных API для доступа к контенту Web2, стоимость его работы очень высока, проектирование цепочки мышления и сотрудничество между многими интеллектами обычно по-прежнему зависит от человека в качестве посредника. Мы пройдем через длительный переходный период, прежде чем появится подходящая форма интеграции, возможно, как UNI. Но как и в предыдущей статье, я по-прежнему считаю, что интеллект окажет значительное влияние на нашу отрасль, так же как Cex в нашей отрасли, не совсем правильно, но очень важно.

Стэнфорд и Microsoft в прошлом месяце опубликовали обзор статьи (Обзор AI Agent), в которой подробно описаны применения интеллекта в медицине, интеллектуальных машинах и виртуальных мирах, а в приложении к этой статье уже есть множество примеров, где GPT-4V участвует в разработке топовых 3A игр.

Не стоит слишком настойчиво требовать, чтобы это сочетание с децентрализацией происходило быстро, я больше надеюсь, что первым пазлом, который интеллект должен заполнить, будут способности и скорость снизу вверх, у нас есть так много нарративных руин и пустого метавселенной, которые нужно заполнить, а на подходящем этапе мы подумаем о том, как сделать его следующим UNI.

Справочные материалы

Цепочка мышления (CoT), возникающая из большой модели, что это за способность? Автор: Нейроэкстремист

Как понять Agent, следующая остановка большой модели Автор: LinguaMind