著者:YBB Capital Researcher Zeke

一、注意力の喜新厭旧

過去1年間、アプリケーション層の物語が断絶し、基盤となるインフラの爆発的な速度に追いつけなくなったため、暗号分野は徐々に注意資源を争奪するゲームになりました。Silly DragonからGoat、Pump.funからClankerまで、注意を引きたいという欲求の新旧がこの争奪戦を内輪もめにしています。最もありふれた注目を集める方法から始まり、すぐに注意を求める者と供給する者が統一されたプラットフォームモデルへと移行し、シリコン基盤の生物が新しいコンテンツ供給者になりました。Meme Coinの奇妙な媒体の中で、ついに一般投資家とVCが合意に達する存在が現れました:AIエージェント。

注意力は結局、ゼロサムゲームです。しかし、投機は確かに物事の野蛮な成長を促すことができます。私たちはUNIに関する記事の中で、ブロックチェーンの黄金時代の始まりを振り返りました。DeFiの急速な成長の原因は、Compound Financeが始めたLPマイニングの時代にさかのぼります。Apy上で千や万のさまざまなマイニングプールに出入りすることは、その時期のチェーン上で最も原始的なゲームの方法でしたが、最終的にはさまざまなマイニングプールが崩壊し、混乱が生じました。しかし、ゴールドマイナーの狂った流入は確かにブロックチェーンに前例のない流動性をもたらしました。DeFiは最終的に純粋な投機から脱却し、成熟したトラックを形成し、支払い、取引、アービトラージ、ステーキングなどのあらゆる面でユーザーの金融ニーズを満たしました。そしてAIエージェントも現在、この野蛮な段階を経験しており、私たちはCryptoがどのようにAIとより良く融合できるかを探求しています。そして最終的にアプリケーション層が新たな高みへと登ることを促します。

二、インテリジェントエージェントはどのように自律的であるか

前の記事でAI Memeの起源:Truth Terminalについて簡単に紹介しました。AIエージェントの未来に対する展望もあり、本稿はまずAIエージェント自体に焦点を当てています。

まずAIエージェントの定義から始めましょう。エージェントはAI分野で比較的古いが定義が不明確な用語であり、主に自律性(Autonomous)を強調します。すなわち、環境を感知し、反応することができるAIはすべてエージェントと見なされます。現在の定義では、AIエージェントはインテリジェントエージェントに近く、大モデルに人間の意思決定を模倣するためのシステムを設定します。学術界ではこのシステムはAGI(汎用人工知能)への最も有望な道と見なされています。

初期のGPTバージョンでは、大モデルが人間に非常に似ていることを明確に感じることができましたが、多くの複雑な問題に答える際、大モデルはどれも曖昧な答えしか出せませんでした。本質的な理由は、当時の大モデルが因果関係ではなく確率に基づいていたこと、次にそれが人間が持つ道具の使用、記憶、計画などの能力を欠いていたことです。そしてAIエージェントはこれらの欠点を補うことができます。したがって、公式で要約すると、AIエージェント(インテリジェントエージェント)=LLM(大モデル)+計画(Planning)+記憶(Memory)+ツール(Tools)です。

プロンプト(Prompt)に基づく大モデルは静的な人間のようであり、私たちが入力する時に初めて生命を持ちます。インテリジェントエージェントの目標は、よりリアルな人間になることです。現在、業界内のインテリジェントエージェントは主にMetaがオープンソースしたLlama 70bまたは405bバージョン(両者のパラメーターは異なる)に基づく微調整モデルであり、記憶やAPI接続ツールを使用する能力を持っています。他の面では、人間の助けや入力(他のインテリジェントエージェントとの相互協力を含む)が必要です。したがって、私たちは現在、業界内の主要なインテリジェントエージェントが依然としてKOLの形でソーシャルネットワーク上に存在しているのを見ることができます。インテリジェントエージェントをより人間に近づけるには、計画と行動能力を接続する必要があり、計画の中のサブ項目である思考チェーンが特に重要です。

三、思考チェーン(Chain of Thought, CoT)

思考チェーン(Chain of Thought, CoT)の概念は、2022年にGoogleが発表した論文(Chain-of-Thought Prompting Elicits Reasoning in Large Language Models)に最初に登場しました。この論文では、一連の中間推論ステップを生成することで、モデルの推論能力を強化し、モデルが複雑な問題をよりよく理解し解決できるようにすることができると指摘しています。

典型的なCoTプロンプトは3つの部分から成ります:指示が明確なタスクの説明、論理的な根拠、タスク解決を支える理論的な基盤または原理の例、具体的な解決策の提示。この構造化された方法は、モデルがタスク要件を理解するのに役立ち、論理的推論を通じて答えに徐々に近づくことを可能にし、問題解決の効率と正確性を向上させます。CoTは、深い分析と多段階の推論が必要なタスクに特に適しており、数学問題の解決やプロジェクト報告書の作成などの簡単なタスクでは明確な利点をもたらさないかもしれませんが、複雑なタスクに対しては、モデルのパフォーマンスを大幅に向上させ、段階的な解決戦略によって誤差率を減少させ、タスクの質を向上させます。

AIエージェントを構築する際、CoTは重要な役割を果たしました。AIエージェントは受け取った情報を理解し、それに基づいて合理的な意思決定を行う必要があります。CoTは体系的な思考方法を提供することで、エージェントが入力情報を効果的に処理・分析し、解析結果を具体的な行動ガイドに変換するのを助けます。この方法はエージェントの意思決定の信頼性と効率を向上させ、意思決定プロセスの透明性を高めます。これにより、エージェントの行動がより予測可能で追跡可能になります。CoTはタスクを複数の小さなステップに分解することによって、エージェントが各意思決定ポイントを詳細に考慮するのを助け、情報過多による誤った判断のリスクを減少させます。CoTにより、エージェントの意思決定プロセスはより透明になり、ユーザーはエージェントの意思決定根拠を理解しやすくなります。環境との相互作用の中で、CoTはエージェントが新しい情報を学び続け、行動戦略を調整することを可能にします。

CoTは効果的な戦略として、大型言語モデルの推論能力を向上させるだけでなく、よりインテリジェントで信頼性のあるAIエージェントの構築においても重要な役割を果たしています。CoTを利用することで、研究者や開発者は、複雑な環境に適応し、高度な自律性を持つインテリジェントシステムを創造することができます。CoTは実際の応用でその独自の利点を示し、特に複雑なタスクに対処する際に、タスクを一連の小さなステップに分解することで、タスク解決の正確性を高め、モデルの可解性と制御性を強化しました。この逐次的な問題解決方法は、複雑なタスクに直面する際に情報が多すぎたり複雑すぎたりして誤った判断を下すリスクを大幅に低減できます。同時に、この方法は全体的な解決策の追跡可能性と検証性を向上させます。

CoTの核心機能は、計画、行動、観察を相互に結びつけ、推論と行動の間のギャップを埋めることです。この思考モデルは、AIエージェントが予測される異常な状況に対して効果的な対策を立て、外部環境との相互作用の中で新しい情報を蓄積し、事前に設定された予測を検証し、新しい推論の根拠を提供することを可能にします。CoTは、高い精度と安定性を兼ね備えたエンジンのようなものであり、AIエージェントが複雑な環境で効率的に作業を続けるのを助けます。

四、正しい偽需要

Cryptoは果たしてAI技術スタックのどの側面と結びつくべきでしょうか?昨年の文章の中で、私は計算能力とデータの非中央集権化が小規模な企業や個人開発者がコストを削減するための重要なステップであると考えていました。今年、Coinbaseが整理したCrypto x AIの細分化されたトラックの中で、より詳細な分類を目にしました。

(1)計算層(AI開発者にGPUリソースを提供することに特化したネットワーク)。

(2)データ層(AIデータパイプラインの非中央集権的なアクセス、編成、検証をサポートするネットワーク)。

(3)ミドルウェア層(AIモデルまたはインテリジェントエージェントの開発、デプロイ、ホスティングをサポートするプラットフォームまたはネットワーク)。

(4)アプリケーション層(オンチェーンAIメカニズムを利用したユーザー向け製品、B2BまたはB2Cにかかわらず)。

この4つのレイヤーの中で、それぞれのレイヤーには壮大なビジョンがあり、目標をまとめると、シリコンバレーの巨人がインターネットを支配する次の時代に対抗することです。昨年私が言ったように、私たちは本当にシリコンバレーの巨人が計算能力やデータを独占的にコントロールすることを受け入れなければならないのでしょうか?彼らの独占下にあるクローズドソースの大モデルは、その内部がブラックボックスであり、科学は今日の人類が最も信じる宗教であり、未来の大モデルが答えるすべての言葉は、多くの人々によって真実と見なされるでしょうが、その真実はどのように検証されるべきでしょうか?シリコンバレーの巨人たちの想定によれば、インテリジェントエージェントが最終的に持つ権限は想像を超えるものであり、たとえばあなたの財布の支払い権、端末の使用権を持つことなどです。人間に悪意がないことをどのように保証するのでしょうか?

非中央集権化は唯一の答えですが、時にはこれらの壮大なビジョンの支払い者がどれほどいるかを合理的に考慮する必要があるのではないでしょうか?過去には商業的なクローズドループを考慮しないで、トークンを通じて理想化によるエラーを補うことができました。しかし、現在の状況は非常に厳しいです。Crypto x AIは現実の状況を考慮して設計する必要があります。たとえば、計算能力層は性能が損なわれ、不安定な状況で供給の両端をどのようにバランスさせるのか?中央集権的なクラウドとの競争力を実現するために。データ層のプロジェクトにはどれだけの実際のユーザーがいて、提供されるデータの真実性と有効性をどのように検証し、どのような顧客がこれらのデータを必要としているのでしょうか?残りの二つの層も同様です。この時代に私たちは、見かけ上正しい偽需要をそれほど必要としません。

五、MemeがSocialFiを生み出した

私が第一段落で言ったように、Memeは超高速の方法でWeb3に適合したSocialFiの形態を生み出しました。Friend.techはこのラウンドのソーシャルアプリケーションの最初の弾を発射したDappですが、急いで成功を求めたトークン設計に失敗しました。Pump.funは純粋なプラットフォームの実現可能性を証明しました。トークンを作らず、ルールも作らない。注意を求める者と供給する者が統一され、プラットフォーム上でミーム画像を投稿したり、ライブ配信したり、トークンを発行したり、メッセージを送信したり、取引したりすることができ、すべてが自由です。Pump.funはサービス料のみを徴収します。これは、現在のYouTubeやInsなどのソーシャルメディアの注意経済モデルに基本的に一致していますが、料金の対象が異なり、Pupm.funはよりWeb3的な遊び方をしています。

BaseのClankerは集大成者であり、エコシステムが自ら手がけた統合エコシステムのおかげで、Baseには補助的なソーシャルDappがあり、完全な内部クローズドループを形成しています。インテリジェントエージェントMemeはMeme Coinの2.0の形態であり、人間は常に新しいものを求めます。Pump.funは現在、ちょうど風口に立っており、トレンド的に見れば、シリコン基盤の生物の無責任な妄想が炭素基盤の生物の低俗なネタを置き換えるのは時間の問題です。

私はすでに無数にBaseについて言及しましたが、毎回言及する内容は異なります。タイムラインから見ると、Baseは決して先発者ではありませんが、常に勝者です。

六、インテリジェントエージェントは何になることができるか?

実用的な観点から見ると、インテリジェントエージェントは将来的な長い間、非中央集権化することは不可能です。従来のAI分野におけるインテリジェントエージェントの構築を見れば、単純な推論プロセスの非中央集権化とオープンソース化では解決できない問題です。それは、さまざまなAPIに接続してWeb2のコンテンツにアクセスする必要があり、その運用コストは非常に高価であり、思考チェーンの設計や多インテリジェントエージェントの協力は通常、人間を媒介として依存しています。私たちは非常に長い移行期間を経て、適切な融合形態が登場するまで待たなければなりません。おそらく、UNIのように。しかし、前の文章と同様に、私は依然としてインテリジェントエージェントが私たちの業界に大きな衝撃を与えると考えています。Cexが私たちの業界に存在するように、正しくはないが非常に重要です。

スタンフォード&マイクロソフトが先月発表した(AIエージェントの概要)の記事では、インテリジェントエージェントが医療業界、スマートマシン、仮想世界での応用について大量に説明されています。この論文の付録には、すでに非常に多くのGPT-4Vがインテリジェントエージェントとしてトップクラスの3Aゲーム開発に参加している実験事例が含まれています。

それが非中央集権化と結びつく速度を強く要求する必要はありません。私はむしろ、インテリジェントエージェントが最初に補完すべきピースは、ボトムアップの能力と速度であることを望んでいます。私たちには多くの物語の廃墟や空白のメタバースがあり、それを埋める必要があります。適切な段階で、私たちはそれを次のUNIにする方法を考慮します。

参考資料

大モデルの「出現」思考チェーンは、一体どのような能力なのでしょうか?著者:脳極体

エージェントを一文で理解する、大モデルの次のステップ著者:LinguaMind