画像出典:(深潮 TechFlow)
ついにElizaは本日、技術ホワイトペーパーを発表しました。
Elizaがどのように自らを定義しているのかについて、技術的に詳細かつ真剣な説明が欠けているにもかかわらず、私たちは多くのAIエージェントがElizaのオープンソースアーキテクチャに基づいて構築されているのをよく耳にします。
このホワイトペーパーは、AIとWeb3の深い統合、モジュラーシステムアーキテクチャの設計、そしてオープンソースアーキテクチャとしての技術実現の詳細について、非常に良い回答を提供しています。
ホワイトペーパーはShaw、多くのEliza Labsメンバーおよび他の関連組織の技術者によって共同執筆されましたが、ホワイトペーパーには多くの技術的詳細と専門的概念が含まれているため、一般の読者にはあまり親切ではない可能性があります。
深潮 TechFlowはそれを簡略化し、要約しました。分かりやすい言葉で、皆さんにこのホワイトペーパーの内容を迅速に理解してもらうことを目指しています。
画像出典:(深潮 TechFlow)
なぜElizaを作るのか?
注意:編集者は、思考の前提は範囲を定義することだと考えています。つまり、暗号またはWeb3産業において、なぜElizaを作るのか、より広範な類似AIアーキテクチャと比較せずに。
この思考を踏まえ、技術ホワイトペーパーの紹介と背景部分は、実際にこの問題に対する良い回答を提供しました:
AIとWeb3の交差する産業には、Web3アプリを完璧に統合できるエージェントアーキテクチャの明らかな空白が存在しています。
画像出典:(深潮 TechFlow)
具体的には、ホワイトペーパーはWeb3産業が直面している3つの主要な課題を挙げています:
去中心化取引の複雑性 Ethereum、Solana、BASEなどのパブリックチェーンの急成長に伴い、異なるチェーンでの資産管理や取引実行がますます難しくなっています。市場にはいくつかの取引プラットフォームがありますが、カスタマイズされたニーズを持つ中高級ユーザーにとって、これらのプラットフォームの基本機能はしばしば不十分です。
チェーン上データの価値発掘 ブロックチェーンには膨大な価値ある情報が含まれており、基本的な保有アドレスの変化、トークン価格、市場価値などの指標から、より深い鯨アカウントの比率、マーケットメイカーのスタイルなどの高度な指標までさまざまです。これらの複雑なデータを効果的に価値ある洞察に変換することは、急務の解決すべき問題です。
ソーシャルメディア情報の断片化 Web3産業にとって、X、Discord、Farcasterなどのソーシャルプラットフォームは情報を得る重要なチャネルです。しかし、意見リーダー(KOL)の数が増えるにつれて、情報はますます断片化されており、情報の洪水の中で価値ある洞察を得ることは、すべてのトレーダーにとって一般的な課題となっています。
これらの現実的なニーズに基づいて、Elizaは誕生しました。初のオープンソースのWeb3フレンドリーなAIエージェントオペレーティングシステムとして、Elizaはモジュラー設計を採用し、開発者とユーザーが自分のニーズに基づいてカスタマイズされたソリューションを構築できるようにします。
Elizaは一般のユーザーが高度なAI機能を利用するための障壁を低くし、深いプログラミング経験がなくても自分のAIエージェントを構築できるようにしようとしています。
同時に、ホワイトペーパーは自らを他の一般的なAIアーキテクチャと比較し、次の表からはWeb3のサポートにおいてElizaが最適であると主張しています。これはホワイトペーパー全体が伝えようとしている重要なポイントでもあります。
画像出典:(深潮 TechFlow)
Elizaの設計理念と技術革新
3つのデザイン原則:シンプルだが単純ではない
Elizaの成功は偶然ではありません。設計の初期段階で、チームは3つのコア原則を確立しました:
1. Web3開発者優先 Web3が主にJavaScript/TypeScriptで開発されていることを考慮し、ElizaはTypeScriptを開発言語として選択しました。これにより、開発者は慣れ親しんだツールを使用でき、既存のウェブアプリにブロックチェーン機能を簡単に統合できます。要するに、Web3開発者が「すぐに使える」ようにしています。
2. モジュラー拡張アプリケーション設計 Elizaはシステムをコアランタイムと4つの重要なコンポーネントに分解します:
アダプター(Adapter)
キャラクター(代理個性)
クライアント(メッセージ相互作用)
プラグイン(汎用機能)
この設計により、開発者はコアランタイムの詳細を心配することなく、自分の拡張アプリケーション、クライアント、キャラクター、アダプターを自由に追加できます。これにより、ElizaはOpenAI、Llama、Qwenなどの最も広範なモデルプロバイダー、プラットフォーム統合(X、Discord、Telegramなど)、およびチェーン互換性(Solana、Ethereum、Tonなど)をサポートできるようになります。
3. 簡単さを重視する:
限られたエンジニアリングリソースの中で、内部実装をシンプルに保つことで、新機能の開発や新しいシーンへの適応に時間を節約し、AIとWeb3産業の急速な発展に追いつくことができます。
技術革新:内外兼修
具体的な実装において、Elizaの革新は内部強化と外部拡張機能の2つの次元に分かれています。
1. 内部強化 AIモデルの思考能力を向上させるために、Elizaは多くの最前線技術を統合しました:
思考の連鎖(Chain-of-Thoughts):
技術定義:ステップバイステップの説明を導入する
一般的な理解:数学の問題を解くために過程を書くように、AIも思考過程を段階的に記述し、直接的な答えを提供するのではなく、より正確な結果を得ることができるようにし、人間がAIがどのように結論を導いたかを理解できるようにします。
思考の木(Tree-of-Thoughts):
技術定義:分岐して複数の解決策を探ることを許可する
一般的な理解:チェスを指すときにさまざまな可能性のある手を考慮するように、AIも同時に複数の解決策を探り、最適なものを選択します。これは思考の木の中で最適な分岐を選ぶようなものです。
思考のグラフ(Graph-of-Thoughts):
技術定義:推論の経路を接続する
一般的な理解:問題をネットワークとして捉え、さまざまな考えが相互に接続される様子。複雑な問題を解決する際に、関連するさまざまな考えを結びつけてマインドマップを形成するようなものです。
思考の層(Layer-of-Thoughts):
技術定義:階層推論AI
一般的な理解:フィルターのように思考過程を異なる層に分けます。問題を解決する際、まず大まかな方向を考え、次に具体的な詳細に絞り込んでいくように、層を重ねて進めます。
2. 外部拡張機能 実際の問題解決能力を強化するために、Elizaは多様な外部能力を統合しています:
RAG(検索強化生成):
技術定義:検索を通じて生成能力を強化する
一般的な理解:学生が課題を解くときに教科書を参照するように、AIも質問に答える際に自分の「データベース」を参照し、より正確な答えを保証します。
ベクターデータベース:
技術定義:構造化データの保存と取得
一般的な理解:AIの「図書館」に相当し、類似したコンテンツを迅速に見つけることができます。例えば、「月に関する詩を探している」と言うと、関連するすべての詩を迅速に見つけることができます。
ネット検索:
技術定義:リアルタイムでネット情報を取得する
一般的な理解:AIが人間のように最新の情報をインターネットで検索できるようにし、固定された知識範囲に制限されないようにします。
テキストから画像、動画、3Dモデルへの変換:
技術定義:テキスト記述をマルチメディアコンテンツに変換する
一般的な理解:画家がテキスト記述に基づいて絵を描けるように、AIもあなたの説明に基づいて画像、動画、さらには3Dモデルを生成できます。
他のWeb3産業のアーキテクチャとの比較
現在のWeb3 AIエージェントアーキテクチャにおいて、Elizaは明らかな優位性を示しています。50人以上のAI研究者や上級ブロックチェーン開発者からのフィードバックによれば、Elizaは以下の重要な指標で他のアーキテクチャを上回っています。
モデルプロバイダーのサポート状況
チェーン互換性の状況
機能の完全性の状況
ソーシャルメディア統合の状況
画像出典:(深潮 TechFlow)
Eliza OS:精巧に設計されたWeb3 AIエコシステム
Elizaの設計理念を理解した後、このアーキテクチャがどのように機能するかを見てみましょう。Elizaは精巧に設計されたレゴブロックシステムのように思えます。各部分が完璧に連携しながら、非常に強い柔軟性を保っています。
コアコンポーネント:5つの重要な役割
Elizaの世界では、5つのコアコンポーネントが相互に連携し、完全な知的システムを構成しています。
1. エージェント(Agents):システムの主役
それらはまるで独立した「デジタルアシスタント」のように、さまざまな自律的対話を処理します。各エージェントは自分の「記憶」と「性格」を持ち、DiscordやXなど異なるチャネルを通じてユーザーと一貫した対話と相互作用を行います。
2. キャラクターファイル(役割設定):エージェントの「キャラクター」
これらのエージェントに個性を持たせるには、Character Files(キャラクターファイル)のサポートが必要です。これはエージェントの「個人履歴書」に相当し、そのアイデンティティや個性特性を定義するだけでなく、使用できるモデル(OpenAI、Anthropicなど)や実行できる操作(ブロックチェーン取引、NFT鋳造など)を規定します。精巧に設計されたキャラクターファイルを通じて、各エージェントは独自の専門的特長や行動様式を示すことができます。
3. プロバイダー(提供者):エージェントの「知覚システム」
外部と対話する際、エージェントはProviders(提供者)を「知覚システム」として必要とします。人間が感覚を使って世界を認識するように、提供者はエージェントに市場データ、ウォレットの詳細、感情分析などのリアルタイム情報を提供し、彼らが現在の環境や文脈をより良く理解できるように手助けします。
4. Actions(行動):エージェントの「スキルライブラリ」
具体的な行動が必要な場合、Actions(行動)がエージェントの「スキルライブラリ」となります。シンプルな売買注文から複雑なNFT生成まで、すべての操作は厳格な安全検証を経て、金融関連のタスクを処理する際に万全の状態を保証します。これらのスキルにより、エージェントはWeb3の世界で実際に機能を発揮することができます。
5. 評価者(Evaluators):エージェントの「意思決定システム」
最後に、Evaluators(評価者)はエージェントの「意思決定システム」として機能し、対話内容を評価し、重要な情報を抽出し、エージェントが長期記憶を構築するのを助けます。彼らは目標の進捗を追跡するだけでなく、全体の対話プロセスの一貫性を確保します。
知的相互作用:単なる対話ではない
インタラクションの面では、Elizaは多層的な理解システムを採用しています。これは経験豊富な翻訳者のように、文字通りの意味だけでなく、話す背景や意図を理解する必要があります。このシステムは、ユーザーの真のニーズを正確に理解し、各種通信プラットフォームで一貫した体験を維持し、文脈に応じて応答方法を柔軟に調整します。
画像出典:(深潮 TechFlow)
拡張アプリケーションシステム:無限の拡張機能の可能性
Elizaの拡張アプリケーションシステムは本質的にツールボックスであり、全体のアーキテクチャに強力な拡張機能をもたらします。この拡張機能は、マルチメディア生成、Web3統合、基盤インフラの3つの方向で実現されます:
マルチメディア生成の面では、画像、動画、3Dモデルを生成でき、NFTシリーズの自動生成をサポートし、画像の説明や分析機能も提供します。
Web3統合の面では、Ethereum、Solanaなどの複数のチェーン操作をサポートし、完全な取引機能のスイートを提供し、各種DeFi操作を統合します。
基盤インフラの面では、ブラウザサービス、文書処理、音声からテキストへの変換などの基礎能力を提供します。
このモジュール式設計により、Elizaはシステムの安定性を維持するだけでなく、開発者にほぼ無限の拡張機能の可能性を提供します。これにより、ElizaはWeb3の世界で新たに生まれるニーズやシーンに適応することができます。
Elizaの実力はどれほどか?データから真実を見抜く
新しい技術アーキテクチャが登場したとき、皆が最も関心を持つのはその実際のパフォーマンスです。Elizaはこの点で正直な答えを提供します。
GAIAベンチマークテスト(これはAIエージェントの実世界の問題解決能力を評価するためのテストプラットフォームです)で、Elizaは素晴らしい実力を示しました。このテストは単純なQ&A能力を評価するのではなく、AIエージェントが論理的推論、マルチモーダル処理、ウェブブラウジング、ツール使用などの複数のスキルを備えていることを要求します。
テストでは、Elizaのスコア(19.42%)は現在の最先端のソリューションとは一定の差があるものの、それがWeb3産業に特化したアーキテクチャであることを考慮すれば、この成績はすでにかなり優れています。特に基本的なタスクの処理(レベル1)では、Elizaは32.21%の完了率に達し、その基盤能力を示しています。
画像出典:(深潮 TechFlow)
Web3産業:画期的な標準制定者
さらに注目すべきは、ElizaがWeb3産業において「標準制定者」の役割を果たしていることです。Web3主導のAIシステムはまだ初期段階にあるため、Elizaは業界全体の発展方向を示す完全な評価基準体系を最初に提案しました。
この評価体系は3つのレベルに分かれており、ホワイトペーパーではこれをWeb3 AIバージョンの「チューリングテスト」と呼んでいます:
基礎能力:ウォレットの作成、トークン取引、スマートコントラクトの相互作用などの基本操作
進化した機能:最新のAI技術を統合し、テキストからビデオ/3D、RAGサポートなど
高度な特性:使用者の指示に基づいて自律的に計画し推論し、真の知的意思決定を実現できること
現在、Elizaは基礎レベルのすべての機能を成功裏に実現し、進化レベルに向けて進んでいます。チームは、今後数年以内に完全自律型AIエージェントシステムを実現できると確信しています。
画像出典:(深潮 TechFlow)
実際の応用:市場が真金で投票する
原ホワイトペーパーにはコードの展示に関するセクションがあり、現在のアーキテクチャで実現可能な実際のアプリケーションを説明しています。理解の難易度や技術的詳細を考慮してここでは省略し、より全体的な経済の実際の応用状況を示します。
ホワイトペーパーの記述によれば、2025年1月までに多くの重要なWeb3プロジェクトがElizaに基づいてAIエージェントシステムを構築し、これらのパートナーの総時価総額は200億ドルを超えています。
画像出典:(深潮 TechFlow)
この数値は、Elizaの技術力に対する市場の最高の裏付けであるかもしれません。
さらに重要なのは、Elizaチームが未来に対して自信を抱いていることです。彼らは、これらの「知的エージェント」の進化が続くにつれて、複数のAIユニットが協力して働く新しい時代を見ることになると考えています。AnthropicのCEOであるダリオ・アモデイが言った「天才データセンター」というビジョンのように、Elizaはその未来を切り開いています。
現存の制約と未来展望:誠実な自己分析
どんな技術アーキテクチャも完璧ではなく、Elizaチームはホワイトペーパーの中で現在のアーキテクチャの限界を率直に指摘しています。
解決すべき3つの主要な課題
ワークフローシステムの欠如:熟練したアシスタントが標準化されたワークフローを必要とするように、開発者がいくつかの定期的なタスク(たとえば、複数のソースからデータを定期的に集約する)を実行しようとする際、現在のElizaアーキテクチャでは即座に解決策を提供できません。このようなニーズには、DifyやCozeのようなグラフィカルインターフェースを持つワークフローシステムの利用が必要かもしれません。
複数エージェントシステムの性能問題。エージェントの数が増加するにつれて、システムが処理する必要がある文脈と記憶内容は指数関数的に増加します。特に大量の入出力タスクを処理する際に、計算コストと実行効率のバランスをどう取るかは、依然として解決すべき技術的課題です。
多言語サポートの拡張ニーズ。現在、Elizaは主にTypeScriptに基づいていますが、より多くの業界の開発者を引きつけるためには、Python、Rustなどの他のプログラミング言語のサポートを拡張する必要があります。
展望:去中心化AIの新時代を開く
これらの制約が存在するにもかかわらず、Elizaの意義は単なる技術アーキテクチャを超えています。それはAI技術とWeb3アプリケーションの深い融合の革新的な試みを象徴しています。
Elizaは各機能モジュールを標準のTypeScriptプログラムとして設計することにより、ユーザーがシステムに完全に制御権を持つことを保証しています。同時に、ブロックチェーンデータやスマートコントラクトとのシームレスな統合能力も提供しています。この設計は安全性を保証しつつ、強力な拡張機能性を維持しています。
ホワイトペーパーの結論にあるように、Elizaの可能性は使用者の想像力によってのみ制限されます。AIとWeb3技術の進化が続く中、Elizaも絶えず進化し、去中心化AIの発展方向をリードし続けます。
この記事は以下から許可を得て転載されたものです:(深潮 TechFlow)
原文著者:(深潮 TechFlow)
『複数のAIエージェントを採用!Elizaホワイトペーパー公表:3つの主要原則、5つのコアコンポーネントを詳解』この文章は最初に『暗号都市』に発表されました。