rounded

執筆:0XNATALIE

今年の下半期以来、AIエージェントの話題の熱度は持続的に上昇しています。初めにAIチャットボットterminal of truthsがX上でのユーモラスな投稿と返信(微博の「ロバート」に似ている)で注目を集め、a16zの創業者Marc Andreessenから5万ドルの支援を受けました。そのリリース内容からインスパイアを受けて、誰かがGOATトークンを作成し、24時間以内に10000%以上の上昇を達成しました。AIエージェントの話題はWeb3コミュニティの注目を集めました。その後、Solanaに基づく最初の分散型AI取引ファンドai16zが登場し、AIエージェント開発フレームワークElizaを発表し、大小トークンの争いを引き起こしました。しかし、コミュニティはAIエージェントの概念をまだ明確に理解していません:AIエージェントのコアは何なのか?Telegram取引ボットとは何が違うのか?

動作原理:感知、推論、自主的意思決定

AIエージェントは、大規模言語モデル(LLM)に基づくインテリジェントエージェントシステムであり、環境を認識し、推論と意思決定を行い、ツールを呼び出すことや操作を実行することで複雑なタスクを完了します。ワークフロー:感知モジュール(入力を取得)→ LLM(理解、推論、計画)→ ツール呼び出し(タスクを実行)→ フィードバックと最適化(検証と調整)。

具体的には、AIエージェントはまず感知モジュールを通じて外部環境からデータ(テキスト、音声、画像など)を取得し、それを処理可能な構造化情報に変換します。LLMはコアコンポーネントとして、強力な自然言語理解と生成能力を提供し、システムの「脳」として機能します。入力されたデータと既存の知識に基づいて、LLMは論理的推論を行い、可能な解決策を生成したり、行動計画を策定したりします。その後、AIエージェントは外部ツール、プラグイン、またはAPIを呼び出して具体的なタスクを完了し、フィードバックに基づいて結果を検証および調整し、閉ループの最適化を形成します。

Web3のアプリケーションシナリオにおいて、AIエージェントはTelegram取引ボットや自動化スクリプトと何が違うのでしょうか?アービトラージを例にとると、ユーザーは利益が1%以上の場合にアービトラージ取引を行いたいと考えています。アービトラージをサポートするTelegram取引ボットでは、ユーザーが利益が1%を超える取引戦略を設定すると、ボットは実行を始めます。しかし、市場が頻繁に変動し、アービトラージ機会が常に変わると、これらのボットはリスク評価能力に欠けており、利益が1%を超える条件を満たす限りアービトラージを実行します。それに対して、AIエージェントは自動的に戦略を調整することができます。たとえば、ある取引の利益が1%を超えたとしても、データ分析に基づくリスク評価が高すぎる場合、市場が突然変化して損失を引き起こす可能性があると判断した場合、そのアービトラージを実行しないことを決定します。

したがって、AIエージェントは自己適応性を持ち、そのコアの強みは自己学習と自主的な意思決定ができることにあります。市場やユーザー行動などの環境との相互作用を通じてフィードバック信号に基づいて行動戦略を調整し、タスクの実行効果を継続的に向上させます。また、外部データに基づいてリアルタイムで意思決定を行い、強化学習を通じて意思決定戦略を最適化し続けます。

そう言われると、意図フレームワークに基づくソルバーに似ていると思いますか?AIエージェント自体も意図に基づいた産物ですが、ソルバーとの最大の違いは、ソルバーが精密なアルゴリズムに依存し、数学的な厳密性を持つのに対し、AIエージェントの意思決定はデータトレーニングに依存し、最適解に近づくために試行錯誤を繰り返す必要があることです。

AIエージェント主流フレームワーク

AIエージェントフレームワークは、インテリジェントエージェントを作成および管理するためのインフラです。現在、Web3では、ai16zのEliza、zerebroのZerePy、VirtualsのGAMEなど、比較的一般的なフレームワークがあります。

Elizaは、多機能AIエージェントフレームワークで、TypeScriptで構築されており、Discord、Twitter、Telegramなどの複数のプラットフォームで実行できることをサポートしています。Elizaは複雑な記憶管理を通じて、以前の会話や文脈を覚え、安定した一貫性のある個性特性と知識の回答を維持します。ElizaはRAG(Retrieval Augmented Generation)システムを採用し、外部データベースやリソースにアクセスできるため、より正確な回答を生成します。さらに、ElizaはTEEプラグインを統合しており、TEE内での展開を可能にし、データの安全性とプライバシーを確保します。

GAMEは、AIエージェントに自主的な意思決定と行動を促すフレームワークです。開発者は自身のニーズに応じてエージェントの行動をカスタマイズし、その機能を拡張し、ソーシャルメディアの投稿や返信などのカスタマイズされた操作を提供できます。フレームワーク内のさまざまな機能(エージェントの環境位置やタスクなど)は複数のモジュールに分かれており、開発者が設定や管理を行いやすくなっています。GAMEフレームワークは、AIエージェントの意思決定プロセスを高レベル計画(HLP)と低レベル計画(LLP)の2つのレベルに分け、それぞれ異なるレベルのタスクと意思決定を担当します。高レベル計画は、エージェントの全体的な目標とタスク計画を設定し、目標、個性、背景情報、環境状態に基づいて意思決定を行い、タスクの優先順位を決定します。低レベル計画は、実行面に焦点を当て、高レベル計画の意思決定を具体的な操作手順に変換し、適切な機能と操作方法を選択します。

ZerePyは、AIエージェントをXに展開するためのオープンソースのPythonフレームワークです。このフレームワークは、OpenAIとAnthropicが提供するLLMを統合しており、開発者がソーシャルメディアエージェントを構築し、ツイートの投稿、ツイートへの返信、いいねなどの操作を自動化することを可能にします。各タスクは、その重要性に応じて異なる重みを設定できます。ZerePyは、開発者がエージェントを迅速に起動および管理できるように、シンプルなコマンドラインインターフェース(CLI)を提供しています。同時に、フレームワークはReplit(オンラインのコード編集および実行プラットフォーム)テンプレートも提供しており、開発者は複雑なローカル環境設定なしでZerePyを迅速に使用開始できます。

なぜAIエージェントはFUDに直面するのか?

AIエージェントは一見インテリジェントであり、参入障壁を下げ、ユーザー体験を向上させることができますが、なぜコミュニティにはFUDが存在するのでしょうか?その理由は、AIエージェントが本質的には依然としてツールであり、現在は全体の作業フローを完了できず、特定のノードでの効率を向上させ、時間を節約することしかできないからです。また、現在の発展段階では、AIエージェントの役割は、ユーザーがワンクリックでMeMeを発行し、ソーシャルメディアアカウントを運営するのを支援することに多くの焦点が当てられています。コミュニティでは「資産は開発者に、負債はAIに属する」と冗談を言っています。

しかし、今週、aiPoolがトークンのプレセールとしてAIエージェントを発表しました。このAIエージェントはTEE技術を利用して非信任化を実現しました。このAIエージェントのウォレットの秘密鍵はTEE環境内で動的に生成され、安全性が確保されています。ユーザーはAIエージェントが制御するウォレットに資金(例:SOL)を送信でき、AIエージェントは設定されたルールに基づいてトークンを作成し、DEXで流動性プールを立ち上げ、条件を満たす投資家にトークンを配布します。全プロセスは、いかなる第三者の仲介者にも依存せず、完全にAIエージェントがTEE環境下で自律的に完了し、DeFiで一般的なラグプルリスクを回避しました。AIエージェントは徐々に発展しています。私は、AIエージェントがユーザーの参入障壁を下げ、体験を向上させるのに役立つと考えています。たとえ資産発行プロセスの一部を簡略化するだけでも、それは意義があります。しかし、マクロなWeb3の視点から見ると、AIエージェントはオフチェーンの産物であり、現在の段階では補助的なスマートコントラクトのツールとしての役割を果たしているため、その能力を過度に誇張する必要はありません。今年の下半期はMeMe以外に顕著な富の効果の物語が欠けているため、AIエージェントのハイプはMeMeを中心に展開されたことも理解できます。MeMeだけでは長期的な価値を維持できないので、AIエージェントが取引プロセスにおいてさらに多くの革新的なプレイをもたらし、実際の落とし所の価値を提供できれば、普遍的なインフラストラクチャツールとして発展するかもしれません。