記事転載元: PA薦読

著者:jolestar

先週、AIエージェントをいじり、前日には北京でのai16zのイベントに参加し、AIエージェントが実際に何ができるのかを見て、将来何ができるのかを考えました。

AIエージェントの現状は、誰かが隠れている自動販売機のミームを思い出させます。みんなが思い描いているAIエージェントはすでに自律的な意識を持ち始めていますが、実際のAIエージェントは実際には開発者が隠れているのです。(ここで皆さんはその光景を想像してください。私はAIにこの画像を生成させようとしましたが、AIは「隠れる」という概念を理解できませんでした。)

AIエージェントフレームワークの基本的な動作方式

AIエージェントフレームワークは現在、クライアント(Twitter、Discord、Telegramなど)とさまざまなプラグイン(各チェーンなど)をつなぐ接着剤の役割を果たしています。そして、フレームワークは基礎ライブラリ(メモリストレージ、セッションの隔離、コンテキスト生成など)を提供し、その後さまざまなAIプラットフォームインターフェースと接続します。

AIエージェントフレームワークがアプリケーションやビジネスシナリオとどのように結びつくか

昨年からAIが急増して以来、さまざまなプラットフォームやツールが登場し、最も重要なのは、AIがどのようにアプリケーションと結びつくかという問題を解決することです。AIプラットフォームはいくつかのプラグインの形式を提供し、ワークフローモデルを構築したり、従来のアプリケーションがアプリ内でAIを埋め込む方法もあります。しかし、ここでの重要な点は、1. アプリケーションのインタラクションの入り口はどこか?2. AIが既存のビジネスロジックとどのように結びつくかです。

各AIプラットフォームがユーザーに提供するアプリケーションのインタラクションの入り口は、明らかにチャットウィンドウのような対話ボックスです。みんながAIアプリケーションとのインタラクションの方法は「擬人化」されるべきだと考えています。この点で、AIエージェントの賢いところは、すべてのオープンIMおよびソーシャルシステムに直接接続されていることです。新しく作るよりも明らかに受け入れられやすいです。

AIが既存のビジネスロジックとどのように結びつくか。AIエージェントが提供する解決策は、開発者がAIの意思決定をビジネスシナリオに組み込むことを可能にするものです。プログラミング言語には決定性が必要で、ifの条件はtrueまたはfalseでなければならず、曖昧なビジネスロジックを処理できません。しかし、AIを使用することで複雑なロジックを正確な条件に変換し、それをビジネスシナリオにシームレスに統合することができます。

例えば、グループ内でメッセージに返信する機能は、従来のIMボットは明確なメッセージ命令を通じてのみトリガーされる必要がありますが、AIを使うことでshouldReplyMessageという方法を実現し、コンテキストを与えると、trueまたはfalseを返します。

AIがビジネスロジックシナリオで果たす役割は主に次のとおりです:

1.「意図」の発見:プロンプトの説明を通じて、AIがコンテキストに基づいてユーザーのテキストメッセージの「意図」を発見し、その意図を具体的なコードにマッピングします。

2. 決定支援:AIを通じてあいまいな複雑な条件を確定的なtrue/falseまたは列挙型に変換し、それをビジネスロジックに組み込みます。

ここまで来ると、多くの人がAIエージェントに失望するかもしれません。多くの人が思っているAIエージェントは、AIに教えれば何でもできると思っています。実際には、大規模モデルのコンテキスト制限の問題により、万能のAIを作ることはできません(少なくとも現時点では)。しかし、プログラマーは失業を心配する必要はありません。AIの背後にはまだ大量のプログラマーが隠れており、if elseを積み上げる必要がありますが、重要な違いは、プログラムが処理できるビジネスの境界が拡大していることです。

2種類のAIエージェント

イベントで、Shawに質問しました。市場はAIエージェントに対して2つの期待を持っています。1. AIエージェント自身が役割を果たし、独自のIDやブランドを持ち、ユーザーにサービスを提供すること。2. ユーザーが個人AIエージェントを持ち、それが個人アシスタントとして機能し、ユーザーがいくつかの業務を処理するのを支援すること。この2種類のAIエージェントのうち、どちらがより人気になるでしょうか?彼は両方の方向性が良いと考えており、組み合わせる可能性もあると言っています。

現在、市場で皆が主に探求しているのは最初の方向性です。この方向性は、AIエージェント化サービスに似ており、将来的にはアプリのインターフェースがなくなるかもしれません。アプリはすべてAIエージェント化され、擬人化されます。次の方向性はアプリクライアントのエージェント化であり、将来のアプリクライアントはアシスタントエージェントのプラグインとなり、アプリのローカルデータがエージェントのメモリライブラリの一部となります。そして、このプラグインはクラウドサービスエージェントと通信する役割も果たします。これは新しいアプリケーションアーキテクチャモデルであり、全体のインフラストラクチャを変えるでしょう。

AIエージェントのインフラストラクチャに対する要件

1. インフラストラクチャは無許可のアクセスを実現する必要があります。そうでなければ、AIエージェントはさまざまな攻撃対策に制限されます。サービスは経済的コストの方法(Gas)で攻撃を防ぐ必要があります。この点で、オープン度が低いプラットフォームは大きな衝撃を受けることになります。かつてのWeb2初期のオープンプラットフォーム熱が再び燃え上がるでしょう。

2. AIエージェントは資金を操作して支払いを行う必要があります。上記の問題を解決するために。

つまり、未来のサービスは、ブロックチェーンに基づいているかどうかにかかわらず、Cryptoの秘密鍵モードの認証と、Cryptoに基づく支払いをサポートする必要があります。

AIエージェントとブロックチェーンの結合

上記の2点に加えて、AIエージェントとブロックチェーンがどのように結びつくかは、みんなが探求している方向の一つです。イベントで、Mikkkeと彼が取り組んでいるfocElizaについて話しました。前述の2種類のAIエージェントは、少なくとも最初のものはブロックチェーンが提供する実行または検証環境が必要です。なぜなら、AIエージェントが外部にサービスを提供すると、信頼の問題が生じるからです。AIエージェントが果たす役割は実際にはスマートコントラクトと同じです。

「スマートコントラクト」という名前は当時議論がありました。それはただのコードで、どこが「スマート」なのか。AIによってスマートコントラクトは名実ともに実現可能になります。難題は、スマートコントラクト環境でAIインターフェースをどのように呼び出すかです。大規模なモデルを検証可能な環境で実行するのはまだ道のりが遠いですが、Oracleのようなソリューションはより実現可能な道です。

AIエージェントの周りには非常に多くのニーズが派生します。AIエージェントは公共の知識をどのように取得するのか?AIエージェントは事実をどのように判断するのか?AIエージェントは異なるプラットフォーム上の同一ユーザーをどのように識別するのか?スマートコントラクトの「記憶」はどのように保存されるのか?複数のデバイスがあり、それぞれにAIエージェントがインストールされている場合、それらはどのようにメモリを共有するのか?

Web3で行われた「データのブロックチェーンへの移行」、関係のブロックチェーンへの移行、DID、P2Pネットワークなどは、すべて新しい意味とシーンを持っています。

結論

私が21年に行ったAIとブロックチェーンに関するシェアの結論を再利用します。AIに優しいインターネットは、人類にも優しいインターネットです。その時はまだアイデアの段階でしたが、今や未来が訪れています。