著者:0XNATALIE
今年下半期以来、AIエージェントの話題の熱度が持続的に上昇しています。最初、AIチャットボットterminal of truthsは、X上でのユーモアのある投稿と返信(微博の「ロバート」に似ている)で注目を集め、a16zの創設者であるMarc Andreessenから5万ドルの資金提供を受けました。その投稿内容に触発されて、有人はGOATトークンを作成し、24時間以内に10000%以上の上昇を記録しました。AIエージェントの話題はすぐにWeb3コミュニティの注目を集めました。その後、Solanaに基づく最初の分散型AI取引基金ai16zが登場し、AIエージェント開発フレームワークElizaを発表し、大文字小文字トークンの争いを引き起こしました。しかし、コミュニティはAIエージェントの概念についてまだ明確ではありません:AIエージェントの核心は何ですか?テレグラム取引ボットと何が違いますか?
動作原理:感知、推論、自律的決定
AIエージェントは、大型言語モデル(LLM)に基づくインテリジェントエージェントシステムであり、環境を感知し、推論決定を行い、ツールを呼び出したり操作を実行することで複雑なタスクを完了します。作業フロー:感知モジュール(入力取得)→ LLM(理解、推論、計画)→ ツール呼び出し(タスク実行)→ フィードバックと最適化(検証と調整)。
具体的には、AIエージェントはまず、感知モジュールを通じて外部環境からデータ(テキスト、音声、画像など)を取得し、それを処理可能な構造化情報に変換します。LLMはコアコンポーネントとして、強力な自然言語理解と生成能力を提供し、システムの「脳」として機能します。入力データと既存の知識に基づいて、LLMは論理推論を行い、可能な解決策を生成したり、行動計画を策定します。その後、AIエージェントは外部ツール、プラグイン、またはAPIを呼び出して具体的なタスクを完了し、フィードバックに基づいて結果を検証・調整し、閉ループ最適化を形成します。
Web3のアプリケーションシナリオにおいて、AIエージェントはTelegram取引ボットや自動化スクリプトと何が違うのでしょうか?アービトラージの例を挙げると、ユーザーは利益が1%を超える条件でアービトラージ取引を行いたいと考えています。アービトラージをサポートするTelegram取引ボットでは、ユーザーが利益が1%を超える取引戦略を設定すると、ボットは実行を開始します。しかし、市場が頻繁に変動し、アービトラージの機会が絶えず変化する場合、これらのボットはリスク評価能力を欠いており、利益が1%を超える条件を満たす限りアービトラージを実行します。それに対して、AIエージェントは戦略を自動的に調整できます。たとえば、ある取引の利益が1%を超えたが、データ分析によってそのリスクが高すぎると評価された場合、市場が突然変化して損失をもたらす可能性があるため、そのアービトラージを実行しないことを決定します。
したがって、AIエージェントは自己適応性を備えており、その核心的な利点は自己学習と自律的決定ができることです。市場、ユーザー行動などの環境との相互作用を通じて、フィードバック信号に基づいて行動戦略を調整し、タスク実行の効果を向上させていきます。また、外部データに基づいてリアルタイムで決定を下し、強化学習を通じて決定戦略を常に最適化します。
そう言うと、意図フレームワークの下のソルバー(solver)に似ているのでしょうか?AIエージェント自体も意図に基づく産物であり、意図フレームワークの下のソルバーとの最大の違いは、ソルバーが精密なアルゴリズムに依存し、数学的に厳密であるのに対し、AIエージェントの決定はデータトレーニングに依存し、しばしばトレーニングプロセスで試行錯誤を通じて最適解に近づく必要があります。
AIエージェント主流フレームワーク
AIエージェントフレームワークは、インテリジェントエージェントを作成および管理するためのインフラストラクチャです。現在、Web3では、比較的人気のあるフレームワークにはai16zのEliza、zerebroのZerePy、VirtualsのGAMEがあります。
Elizaは、多機能のAIエージェントフレームワークであり、TypeScriptで構築され、複数のプラットフォーム(Discord、Twitter、Telegramなど)での実行をサポートし、複雑なメモリ管理を通じて、以前の会話や文脈を記憶し、安定した一貫した個性特性と知識回答を維持します。ElizaはRAG(Retrieval Augmented Generation)システムを採用しており、外部データベースやリソースにアクセスして、より正確な回答を生成することができます。さらに、ElizaはTEEプラグインを統合しており、TEE内にデプロイすることを可能にし、データの安全性とプライバシーを確保します。
GAMEは、AIエージェントに自主的な決定と行動を促すためのフレームワークです。開発者は自分のニーズに応じてエージェントの行動をカスタマイズし、その機能を拡張し、カスタマイズされた操作(ソーシャルメディア投稿、返信など)を提供できます。フレームワーク内のさまざまな機能、たとえばエージェントの環境位置やタスクなどは、複数のモジュールに分けられ、開発者が構成および管理しやすくなっています。GAMEフレームワークは、AIエージェントの決定プロセスを2つのレベルに分けます:高レベル計画(HLP)と低レベル計画(LLP)で、それぞれ異なるレベルのタスクと決定を担当します。高レベル計画は、エージェントの全体的な目標とタスク計画を設定し、目標、個性、背景情報、環境状態に基づいて決定を行い、タスクの優先順位を確定します。低レベル計画は、実行面に特化しており、高レベル計画の決定を具体的な操作手順に転換し、適切な機能と操作方法を選択します。
ZerePyは、X上にAIエージェントを展開するためのオープンソースのPythonフレームワークです。このフレームワークは、OpenAIとAnthropicが提供するLLMを統合しており、開発者がソーシャルメディアエージェントを構築および管理し、ツイートの投稿、ツイートへの返信、いいねなどの操作を自動化することを可能にします。各タスクは、その重要性に応じて異なる重みを設定できます。ZerePyは、開発者がエージェントを迅速に起動し、管理するためのシンプルなコマンドラインインターフェイス(CLI)を提供しています。同時に、フレームワークはReplit(オンラインコード編集および実行プラットフォーム)テンプレートも提供しており、開発者は複雑なローカル環境の設定なしにZerePyの使用を迅速に開始できます。
なぜAIエージェントはFUDに直面するのでしょうか?
AIエージェントは知的に見え、入門のハードルを下げ、ユーザーエクスペリエンスを向上させることができますが、なぜコミュニティにはFUDが存在するのでしょうか?その理由は、AIエージェントは本質的にはまだ単なるツールであり、現在は全体の作業フローを完了できず、特定のノードで効率を向上させ、時間を節約することしかできないからです。また、現在の発展段階では、AIエージェントの役割は主にユーザーがMeMeをワンクリックで発行し、ソーシャルメディアアカウントを運営するのを助けることに集中しています。コミュニティは「資産は開発者に、負債はAIに属する」と冗談を言っています。
しかし、今週、aiPoolがトークンのプレセールとしてAIエージェントを発表し、TEE技術を利用して信頼性をなくしました。このAIエージェントのウォレット秘密鍵はTEE環境内で動的に生成され、安全性が確保されています。ユーザーはAIエージェントが制御するウォレットに資金(例えばSOL)を送信でき、AIエージェントは設定されたルールに基づいてトークンを作成し、DEXで流動性プールを開始し、条件を満たす投資家にトークンを配布します。全体のプロセスは、いかなる第三者の仲介にも依存せず、完全にAIエージェントがTEE環境内で自律的に完了し、DeFiで一般的なラグプルのリスクを回避します。明らかに、AIエージェントは徐々に進化しています。私の考えでは、AIエージェントはユーザーがハードルを下げ、体験を向上させるのを助けることができます。たとえそれが一部の資産発行プロセスを簡素化するだけでも意味があります。しかし、マクロなWeb3の視点から見ると、AIエージェントはオフチェーンの産物として、現在の段階では補助的なスマートコントラクトのツールとしての役割を果たしているため、その能力を過度に誇張する必要はありません。今年の下半期にはMeMeを除いて顕著な富の効果の物語が欠けているため、AIエージェントに関するハイプがMeMeに集中しているのも正常です。MeMeだけでは長期的な価値を維持できないため、AIエージェントが取引プロセスの中でさらなる革新的なプレイを提供し、実際の地に足のついた価値をもたらすことができれば、それは普遍的なインフラツールに発展するかもしれません。