Tác giả: accelxr, 1KX; Bản dịch: 0xjs@金财经

Mục đích chính của các mô hình tổng quát hiện tại là tạo nội dung và lọc thông tin. Tuy nhiên, nghiên cứu và thảo luận gần đây về các tác nhân AI (các tác nhân tự trị sử dụng các công cụ bên ngoài để hoàn thành các mục tiêu do người dùng xác định) cho thấy rằng AI có thể được mở khóa một cách đáng kể nếu nó được cung cấp quyền truy cập kinh tế tương tự như Internet của những năm 1990.

Để làm được điều này, các đại lý cần có đại lý đối với tài sản mà họ có thể kiểm soát vì hệ thống tài chính truyền thống không được thiết lập cho họ.

Đây là lúc tiền điện tử phát huy tác dụng: Tiền điện tử cung cấp lớp sở hữu và thanh toán kỹ thuật số với khả năng thanh toán nhanh, đặc biệt phù hợp để xây dựng các đại lý AI.

Trong bài viết này, tôi sẽ giới thiệu cho bạn các khái niệm về tác nhân và kiến ​​trúc tác nhân, các ví dụ từ nghiên cứu về cách tác nhân có các đặc tính mới nổi ngoài LLM truyền thống và các dự án xây dựng giải pháp hoặc sản phẩm xung quanh tác nhân dựa trên mật mã.

Đại lý là gì

Tác nhân AI là các thực thể được điều khiển bởi LLM có khả năng lập kế hoạch và thực hiện các hành động để đạt được mục tiêu qua nhiều lần lặp.

Kiến trúc tác tử bao gồm một hoặc nhiều tác tử làm việc cùng nhau để giải quyết vấn đề.

Thông thường, mỗi nhân viên có một cá tính riêng và có quyền truy cập vào nhiều công cụ khác nhau để giúp họ hoàn thành công việc một cách độc lập hoặc là thành viên của nhóm.

Kiến trúc tác nhân khác với cách chúng ta thường tương tác với LLM ngày nay:

Lời nhắc không bắn là cách hầu hết mọi người tương tác với các mô hình này: bạn nhập lời nhắc và LLM tạo ra phản hồi dựa trên kiến ​​thức có sẵn của nó.

Trong kiến ​​trúc tác tử, bạn khởi tạo một mục tiêu, LLM chia mục tiêu đó thành các nhiệm vụ phụ, sau đó nó sẽ nhắc đệ quy chính nó (hoặc các mô hình khác) hoàn thành từng nhiệm vụ phụ một cách tự động cho đến khi đạt được mục tiêu.

Kiến trúc tác nhân đơn và kiến ​​trúc đa tác nhân

Kiến trúc tác nhân đơn: Một mô hình ngôn ngữ tự thực hiện tất cả các lý luận, lập kế hoạch và thực thi công cụ. Không có cơ chế phản hồi từ các tác nhân khác, nhưng con người có thể chọn cung cấp phản hồi cho các tác nhân.

Kiến trúc đa tác nhân: Những kiến ​​trúc này bao gồm hai hoặc nhiều tác nhân, trong đó mỗi tác nhân có thể sử dụng cùng một mô hình ngôn ngữ hoặc một bộ mô hình ngôn ngữ khác nhau. Đại lý có thể sử dụng cùng một công cụ hoặc các công cụ khác nhau. Mỗi tác nhân thường có vai trò riêng.

  • Cấu trúc theo chiều dọc: Một tác nhân đóng vai trò là người lãnh đạo và các tác nhân khác báo cáo cho nó. Điều này giúp tổ chức đầu ra của nhóm.

  • Cấu trúc theo chiều ngang: một cuộc thảo luận nhóm lớn về một nhiệm vụ, trong đó mỗi tổng đài viên có thể xem các tin nhắn khác và tình nguyện hoàn thành nhiệm vụ hoặc gọi các công cụ.

Kiến trúc tác nhân: Tệp cấu hình

Các đại lý có hồ sơ hoặc tính cách xác định vai trò là tín hiệu ảnh hưởng đến hành vi và kỹ năng của LLM. Điều này phụ thuộc rất nhiều vào ứng dụng cụ thể.

Có lẽ nhiều người ngày nay đã sử dụng điều này như một kỹ thuật nhắc nhở: "Bạn là chuyên gia dinh dưỡng. Hãy cung cấp cho tôi thực đơn bữa ăn...". Điều thú vị là, việc cung cấp các vai trò cho LLM sẽ cải thiện sản lượng của nó so với đường cơ sở.

Các tập tin cấu hình có thể được tạo theo những cách sau:

  • Thủ công: Hồ sơ được con người tạo ra một cách thủ công; linh hoạt nhất nhưng cũng tốn thời gian.​

  • Tạo LLM: Sử dụng tệp cấu hình được tạo LLM có chứa một bộ quy tắc xung quanh thành phần và thuộc tính + (tùy chọn) một số lượng nhỏ ví dụ mẫu.

  • Căn chỉnh tập dữ liệu: Hồ sơ được tạo từ tập dữ liệu về người trong thế giới thực.

Kiến trúc tác nhân: Bộ nhớ

Bộ nhớ của tác nhân lưu trữ thông tin nhận được từ môi trường và sử dụng thông tin này để hình thành các kế hoạch hoặc hành động mới. Bộ nhớ cho phép một tác nhân tự phát triển và hành động dựa trên kinh nghiệm của nó.​

  • Trí nhớ thống nhất: Tương tự như trí nhớ ngắn hạn thông qua học tập theo ngữ cảnh/thông qua nhắc nhở liên tục. Tất cả các ký ức liên quan được chuyển đến tác nhân tại mỗi dấu nhắc. Chủ yếu bị giới hạn bởi kích thước của cửa sổ ngữ cảnh.​

  • Hỗn hợp: trí nhớ ngắn hạn + trí nhớ dài hạn. Bộ nhớ ngắn hạn là vùng đệm tạm thời của trạng thái hiện tại. Thông tin dài hạn phản ánh hoặc hữu ích được lưu trữ vĩnh viễn trong cơ sở dữ liệu. Có một số cách để thực hiện việc này, nhưng cách phổ biến nhất là sử dụng cơ sở dữ liệu vectơ (bộ nhớ được mã hóa dưới dạng nhúng và lưu trữ; thu hồi xuất phát từ tìm kiếm tương tự)

  • Định dạng: Ngôn ngữ tự nhiên, cơ sở dữ liệu (ví dụ: SQL được tinh chỉnh để hiểu các truy vấn SQL), danh sách có cấu trúc, nhúng

Kiến trúc tác nhân: Lập kế hoạch

Các nhiệm vụ phức tạp được phân tách thành các nhiệm vụ phụ đơn giản hơn để giải quyết riêng lẻ.

Không có kế hoạch phản hồi:

Theo cách tiếp cận này, sau khi tác nhân thực hiện một hành động, nó sẽ không nhận được phản hồi ảnh hưởng đến hành vi trong tương lai. Một ví dụ là Chuỗi suy nghĩ (CoT), trong đó LLM được khuyến khích thể hiện quá trình suy nghĩ của họ khi đưa ra câu trả lời.

  • Lý luận đường dẫn đơn (ví dụ: CoT không vượt qua)

  • Lý luận theo nhiều đường (ví dụ: CoT tự nhất quán, trong đó nhiều luồng CoT được tạo ra và câu trả lời có tần suất cao nhất được sử dụng)

  • Người lập kế hoạch bên ngoài (ví dụ: Ngôn ngữ định nghĩa miền lập kế hoạch)

Lập kế hoạch với phản hồi:

Tinh chỉnh lặp đi lặp lại các nhiệm vụ phụ dựa trên phản hồi bên ngoài

  • Phản hồi từ môi trường (chẳng hạn như tín hiệu hoàn thành nhiệm vụ trò chơi)

  • Phản hồi của con người (ví dụ: thu hút phản hồi từ người dùng)

  • Phản hồi về mô hình (ví dụ: thu hút phản hồi từ LLM khác - cung cấp dịch vụ cộng đồng)

Kiến trúc tác nhân: Hành động

Hành động có trách nhiệm chuyển việc ra quyết định của tác nhân thành kết quả cụ thể.

Mục tiêu hành vi có nhiều dạng khác nhau, chẳng hạn như:

  • Nhiệm vụ đã hoàn thành (ví dụ: chế tạo một cái cuốc sắt trong Minecraft)

  • Giao tiếp (ví dụ: chia sẻ thông tin với một đại lý hoặc con người khác)

  • Khám phá môi trường (ví dụ: tìm kiếm không gian hành vi của chính mình và tìm hiểu khả năng của một người).

Các hành vi thường phát sinh từ việc thu hồi bộ nhớ hoặc theo dõi kế hoạch và không gian hành vi bao gồm kiến ​​thức nội bộ, API, cơ sở dữ liệu/cơ sở kiến ​​thức và các mô hình bên ngoài về việc sử dụng nó.

Kiến trúc tác nhân: Mua lại năng lực

Để một tác nhân thực hiện các hành động một cách chính xác trong không gian hành động, nó phải có các khả năng dành riêng cho nhiệm vụ. Chủ yếu có hai cách để đạt được điều này:

  • Với khả năng tinh chỉnh: Đào tạo nhân viên hỗ trợ của bạn về tập dữ liệu hành vi mẫu do con người tạo ra, do LLM tạo hoặc trong thế giới thực.

  • Không cần tinh chỉnh: Khả năng bẩm sinh của LLM có thể được khai thác thông qua kỹ thuật cơ chế và/hoặc kỹ thuật cơ chế phức tạp hơn (tức là kết hợp phản hồi bên ngoài hoặc tích lũy kinh nghiệm trong khi tiến hành thử và sai).

Ví dụ về các tác nhân trong văn học

Tác nhân tạo: Mô phỏng tương tác hành vi con người: Việc khởi tạo các tác nhân tạo trong môi trường hộp cát ảo hiển thị các hệ thống đa tác nhân với hành vi xã hội mới nổi. Bắt đầu với một lời nhắc do người dùng chỉ định cho bữa tiệc Ngày lễ tình nhân sắp tới, nhân viên hỗ trợ dành hai ngày tiếp theo để tự động gửi lời mời, gặp gỡ những người mới, hẹn hò với nhau và điều phối tiệc tùng cùng nhau vào đúng thời điểm. Bạn có thể tự mình thử bằng cách triển khai a16z AI Town.

Mô tả Lựa chọn kế hoạch giải thích (DEPS): tác nhân đa nhiệm không cần bắn đầu tiên có thể hoàn thành hơn 70 nhiệm vụ Minecraft.

Du hành: Tác nhân điều khiển LLM đầu tiên của Minecraft thể hiện khả năng học tập suốt đời, nó có thể liên tục khám phá thế giới, thu được nhiều kỹ năng khác nhau và thực hiện những khám phá mới mà không cần sự can thiệp của con người. Liên tục cải thiện mã thực thi kỹ năng dựa trên phản hồi từ quá trình thử và sai.

CALYPSO: Một đặc vụ được thiết kế cho trò chơi "Dungeons and Dragons" có thể hỗ trợ Chủ ngục trong việc tạo và kể chuyện. Trí nhớ ngắn hạn của nó được xây dựng dựa trên các mô tả cảnh, thông tin về quái vật và các bản tóm tắt trước đó.

Ghost in Minecraft (GITM): Một đặc vụ có khả năng trung bình trong Minecraft, với tỷ lệ thành công là 67,5% khi lấy được kim cương và tỷ lệ hoàn thành 100% cho tất cả vật phẩm trong trò chơi.

SayPlan: Lập kế hoạch nhiệm vụ quy mô lớn dựa trên LLM cho robot, sử dụng biểu diễn biểu đồ cảnh 3d, thể hiện khả năng thực hiện lập kế hoạch nhiệm vụ dài hạn cho robot từ các hướng dẫn bằng ngôn ngữ tự nhiên và trừu tượng.

HuggingGPT: Sử dụng ChatGPT để lập kế hoạch nhiệm vụ dựa trên lời nhắc của người dùng, chọn mô hình dựa trên mô tả trên Ôm mặt và thực hiện tất cả các nhiệm vụ phụ, đạt được kết quả ấn tượng về ngôn ngữ, tầm nhìn, lời nói và các nhiệm vụ đầy thách thức khác.

MetaGPT: chấp nhận câu chuyện đầu vào và đầu ra của người dùng/phân tích/yêu cầu cạnh tranh/cấu trúc dữ liệu/API/tài liệu, v.v. Trong nội bộ, có nhiều đại lý tạo nên các chức năng khác nhau của một công ty phần mềm.

ChemCrow: Một tác nhân hóa học LLM được thiết kế để hoàn thành các nhiệm vụ như tổng hợp hữu cơ, khám phá thuốc và thiết kế vật liệu bằng 18 công cụ được thiết kế chuyên nghiệp. Lập kế hoạch và thực hiện độc lập việc tổng hợp chất chống côn trùng, ba chất xúc tác hữu cơ và chỉ đạo việc phát hiện ra một nhiễm sắc thể mới.

BabyAGI : Cơ sở hạ tầng có mục đích chung để tạo, ưu tiên và thực thi các tác vụ bằng cách sử dụng cơ sở dữ liệu OpenAI và vector như Chroma hoặc Weaviate.

AutoGPT: Một ví dụ khác về cơ sở hạ tầng có mục đích chung để khởi chạy các đại lý LLM.

Ví dụ về các đại lý trong Crypto

(Lưu ý: không phải tất cả các ví dụ đều dựa trên LLM + một số có thể dựa trên khái niệm tác nhân một cách lỏng lẻo hơn)

FrenRug từ Ritualnet: Dựa trên trò chơi Người bán thảm Thổ Nhĩ Kỳ GPT-4 { https://aiadventure.spiel.com/carpet }. Frenrug là một nhà môi giới mà bất kỳ ai cũng có thể cố gắng thuyết phục mua Friend.tech Key của họ. Mỗi tin nhắn của người dùng được gửi tới nhiều LLM chạy trên các nút Infernet khác nhau. Các nút này phản hồi trên chuỗi và LLM bỏ phiếu về việc liệu đại lý có nên mua Khóa được đề xuất hay không. Khi có đủ nút phản hồi, phiếu bầu sẽ được tổng hợp và mô hình phân loại được giám sát sẽ xác định hành động và đưa ra bằng chứng về tính hợp lệ trên chuỗi, cho phép xác minh việc thực thi ngoài chuỗi của trình phân loại đa thức.

Đại lý thị trường dự đoán sử dụng autonolas trên Gnosis: Robot AI về cơ bản là một trình bao bọc hợp đồng thông minh cho dịch vụ AI mà bất kỳ ai cũng có thể gọi bằng cách trả tiền và đặt câu hỏi. Dịch vụ giám sát yêu cầu, thực hiện các nhiệm vụ và trả về câu trả lời trên chuỗi. Cơ sở hạ tầng bot AI này đã được mở rộng sang các thị trường dự đoán thông qua Omen, trong đó ý tưởng cơ bản là các đại lý sẽ tích cực theo dõi và đặt cược vào các dự đoán từ phân tích tin tức, cuối cùng đưa ra các dự đoán tổng hợp gần với tỷ lệ thực tế hơn. Các đại lý tìm kiếm thị trường trên Omen, tự động trả tiền cho “bot” cho những dự đoán về chủ đề này và giao dịch bằng cách sử dụng thị trường.

ianDAOs GPT<>Bản demo an toàn: GPT sử dụng API đám mây giao dịch syndicateio để tự động quản lý USDC trong Ví đa chữ ký an toàn trên chuỗi Cơ sở của riêng mình. Bạn có thể nói chuyện với nó và đưa ra đề xuất về cách sử dụng vốn của nó một cách tốt nhất và nó có thể phân bổ vốn dựa trên đề xuất của bạn.

Tác nhân trò chơi: Có nhiều ý tưởng ở đây, nhưng tóm lại, tác nhân AI trong môi trường ảo vừa là bạn đồng hành (như các NPC AI trong Skyrim) vừa là đối thủ cạnh tranh (như một đàn chim cánh cụt mũm mĩm). Đại lý có thể tự động hóa chiến lược doanh thu, cung cấp hàng hóa và dịch vụ (ví dụ: chủ cửa hàng, thương nhân du lịch, nhà cung cấp nhiệm vụ sáng tạo phức tạp) hoặc dưới dạng nhân vật bán có thể chơi được trong Parallel Colony và Ai Arena.

Thiên thần hộ mệnh an toàn: Sử dụng một nhóm tác nhân AI để giám sát ví và chống lại các mối đe dọa tiềm ẩn nhằm bảo vệ tiền của người dùng và cải thiện bảo mật ví. Các tính năng bao gồm tự động thu hồi quyền hợp đồng và rút tiền trong trường hợp có sự bất thường hoặc bị hacker tấn công.

Botto: Mặc dù Botto là một ví dụ được xác định một cách lỏng lẻo về một đại lý trên chuỗi, nhưng nó thể hiện khái niệm về một nghệ sĩ trên chuỗi tự trị, tạo ra các tác phẩm được chủ sở hữu mã thông báo bình chọn và bán đấu giá trên SuperRare. Người ta có thể tưởng tượng ra nhiều phần mở rộng khác nhau sử dụng kiến ​​trúc tác nhân đa phương thức. ---

Một số dự án đại lý đáng chú ý

(Lưu ý: không phải tất cả các dự án đều dựa trên LLM + một số có thể dựa trên khái niệm đại lý một cách lỏng lẻo hơn)

AIWay Finder - Biểu đồ kiến ​​thức phi tập trung về các giao thức, hợp đồng, tiêu chuẩn hợp đồng, tài sản, chức năng, chức năng API, quy trình + đường dẫn (tức là lộ trình ảo của hệ sinh thái blockchain mà tác nhân tìm đường có thể điều hướng). Người dùng sẽ được khen thưởng khi xác định được các đường dẫn khả thi được đại lý sử dụng. Ngoài ra, bạn có thể tạo một shell (tức là một tác nhân) chứa thiết lập nhân vật và kích hoạt kỹ năng, sau đó có thể cắm vào Sơ đồ tri thức Pathfinder.

Ritualnet - Như được hiển thị trong ví dụ về frenrug ở trên, nút infernet Ritual có thể được sử dụng để thiết lập kiến ​​trúc đa tác nhân. Các nút lắng nghe các yêu cầu trên chuỗi hoặc ngoài chuỗi và cung cấp đầu ra với các bằng chứng tùy chọn.

Morpheus - Mạng ngang hàng gồm AI nói chung cá nhân có thể thay mặt người dùng thực hiện hợp đồng thông minh. Điều này có thể được sử dụng để quản lý mục đích tx và ví web3, phân tích dữ liệu thông qua giao diện chatbot, mô hình đề xuất cho dapp và hợp đồng, đồng thời mở rộng hoạt động của đại lý thông qua bộ nhớ dài hạn kết nối ứng dụng và dữ liệu người dùng.

Giao thức Dain - Khám phá nhiều trường hợp sử dụng để triển khai các tác nhân trên Solana. Gần đây đã chứng minh việc triển khai bot giao dịch tiền điện tử có thể trích xuất thông tin trên chuỗi và ngoài chuỗi để thực hiện thay mặt cho người dùng (ví dụ: bán BODEN nếu Biden thua)

Naptha - Giao thức điều phối tác nhân với thị trường nhiệm vụ trên chuỗi dành cho các tác nhân ký hợp đồng, các nút vận hành để điều phối các tác vụ, công cụ điều phối quy trình làm việc LLM hỗ trợ nhắn tin không đồng bộ giữa các nút khác nhau và hệ thống chứng thực quy trình làm việc để xác minh việc thực thi.

Myshell - Một nền tảng nhân vật AI tương tự như character.ai, nơi người sáng tạo có thể kiếm tiền từ hồ sơ và công cụ của đại lý. Cơ sở hạ tầng đa phương thức với một số tác nhân ví dụ thú vị bao gồm dịch thuật, giáo dục, đồng hành, mã hóa, v.v. Chứa tính năng tạo tác nhân không cần mã đơn giản và chế độ nhà phát triển nâng cao hơn để lắp ráp các tiện ích AI.

Đấu trường AI – Một trò chơi chiến đấu PvP mang tính cạnh tranh, nơi người chơi có thể mua, huấn luyện và cạnh tranh với các NFT hỗ trợ AI. Người chơi huấn luyện NFT đặc vụ của họ thông qua việc học bắt chước, trong đó AI học cách chơi trò chơi ở các bản đồ và kịch bản khác nhau bằng cách tìm hiểu các xác suất liên quan đến hành động của người chơi. Sau khi đào tạo, người chơi có thể cử đặc vụ của mình tham gia các trận chiến xếp hạng để kiếm phần thưởng mã thông báo. Không dựa trên LLM, nhưng vẫn là một ví dụ thú vị về khả năng chơi trò chơi của đại lý.

Giao thức ảo - Giao thức xây dựng và triển khai các tác nhân đa phương thức vào trò chơi và các không gian trực tuyến khác. Ba nguyên mẫu chính của thế giới ảo ngày nay bao gồm gương nhân vật IP, tác nhân có chức năng cụ thể và hình đại diện cá nhân. Những người đóng góp đóng góp dữ liệu và mô hình cho ảo và những người xác thực đóng vai trò là người gác cổng. Có một mức độ khuyến khích kinh tế để thúc đẩy phát triển và kiếm tiền.

Brianknows - Cung cấp cho người dùng giao diện người dùng để tương tác với các đại lý có thể thực hiện giao dịch, nghiên cứu thông tin cụ thể về tiền điện tử và triển khai hợp đồng thông minh một cách kịp thời. Hiện hỗ trợ hơn 10 hoạt động trong hơn 100 tích hợp. Một ví dụ gần đây là việc đại lý đặt cổ phần ETH vào Lido thay mặt cho người dùng sử dụng ngôn ngữ tự nhiên.

Autonolas - Cung cấp các tác nhân cục bộ và dựa trên đám mây nhẹ, các tác nhân phi tập trung được vận hành đồng thuận và một nền kinh tế đại lý chuyên nghiệp. Các ví dụ nổi bật bao gồm DeFi và các tác nhân dựa trên dự đoán, đại diện quản trị do AI điều khiển và thị trường công cụ giữa các đại lý. Cung cấp giao thức + ngăn xếp OLAS để điều phối và khuyến khích các hoạt động của đại lý, đây là một khung nguồn mở để các nhà phát triển xây dựng các đại lý thuộc sở hữu chung.

Creator.Bid - Cung cấp cho người dùng các tác nhân nhân vật trên mạng xã hội được kết nối với API thời gian thực X và Farcaster. Thương hiệu có thể triển khai các đại lý dựa trên kiến ​​thức để thực hiện nội dung phù hợp với thương hiệu trên nền tảng xã hội.

Polywrap - Cung cấp nhiều sản phẩm dựa trên tác nhân khác nhau như Indexer (một tác nhân truyền thông xã hội cho Farcaster), AutoTx (một tác nhân lập kế hoạch và thực hiện giao dịch được xây dựng bằng Morpheus và đàn.io), dự đoánprophet.ai (với tác nhân dự đoán Gnosis và Autonolas) và Fundpublicgoods .ai (một đại lý phân bổ nguồn tài trợ).

Xác minh – Vì các dòng chảy kinh tế sẽ được chỉ đạo bởi các tác nhân nên việc xác minh đầu ra sẽ rất quan trọng (sẽ nói thêm về vấn đề này trong một bài viết sau). Các phương pháp xác minh bao gồm zkML từ Ora Protocol, giải pháp lý thuyết trò chơi từ các nhóm như Modulus Labs + Giza + EZKL và các giải pháp dựa trên phần cứng như TEE.​

Một số suy nghĩ về các đại lý trên chuỗi

  • Các đại lý có thể sở hữu, có thể giao dịch, có mã thông báo có thể thực hiện nhiều loại chức năng khác nhau, từ đồng hành đến ứng dụng tài chính,

  • Một tác nhân có thể thay mặt bạn xác định, tìm hiểu và tham gia vào nền kinh tế trò chơi; hoặc một tác nhân tự trị có thể đóng vai trò là người chơi trong môi trường hợp tác, cạnh tranh hoặc mô phỏng đầy đủ.

  • Đại lý có thể mô phỏng hành vi thực của con người để có cơ hội kiếm tiền

  • Ví thông minh được quản lý bởi nhiều tác nhân có thể hoạt động như một người quản lý tài sản tự trị

  • Quản trị DAO do AI quản lý (ví dụ: ủy quyền mã thông báo, tạo hoặc quản lý đề xuất, cải tiến quy trình, v.v.)

  • Sử dụng cơ sở dữ liệu hoặc bộ lưu trữ web3 làm hệ thống nhúng vectơ có thể kết hợp cho trạng thái bộ nhớ được chia sẻ và liên tục

  • Các đại lý chạy cục bộ tham gia vào mạng đồng thuận toàn cầu và thực hiện các nhiệm vụ do người dùng xác định

  • Biểu đồ kiến ​​thức về các tương tác và API giao thức hiện có và mới

  • Mạng giám hộ tự động, bảo mật đa chữ ký, bảo mật hợp đồng thông minh và cải tiến chức năng

  • Một DAO đầu tư thực sự tự chủ (ví dụ: DAO nhà sưu tập sử dụng vai trò của nhà sử học nghệ thuật, nhà phân tích đầu tư, nhà phân tích dữ liệu và đại lý thoái hóa)

  • Mô phỏng và thử nghiệm kinh tế mã thông báo và bảo mật hợp đồng

  • Quản lý mục đích chung, đặc biệt là trong bối cảnh trải nghiệm người dùng tiền điện tử như bắc cầu hoặc DeFi

  • dự án nghệ thuật hoặc thử nghiệm

Thu hút hàng tỷ người dùng tiếp theo

Như Jesse Walden, người đồng sáng lập Quỹ Varint, gần đây đã nói, các tác nhân tự trị là một sự tiến hóa chứ không phải một cuộc cách mạng trong cách sử dụng blockchain: chúng ta đã có robot thực hiện giao thức, robot bắn tỉa, công cụ tìm kiếm MEV, bộ công cụ robot, v.v. Đại lý chỉ là một phần mở rộng của tất cả điều này.

Nhiều lĩnh vực tiền điện tử được xây dựng theo cách tạo điều kiện thuận lợi cho việc thực thi tác nhân, chẳng hạn như trò chơi hoàn toàn trên chuỗi và DeFi. Giả sử rằng chi phí LLM có xu hướng giảm so với hiệu suất nhiệm vụ + khả năng tiếp cận việc tạo và triển khai các tác nhân tăng lên, thật khó để tưởng tượng một thế giới mà các tác nhân AI không thống trị các tương tác trên chuỗi và trở thành một tỷ người dùng tiền điện tử tiếp theo.

Tài liệu đọc:

Các đại lý AI có thể tự gửi ngân hàng bằng cách sử dụng Blockchain

Nền kinh tế đại lý AI mới sẽ chạy trên Tài khoản thông minh

Khảo sát về các tác nhân tự trị dựa trên mô hình ngôn ngữ lớn (Tôi đã sử dụng điều này để xác định phân loại của các kiến ​​trúc tác nhân ở trên, rất khuyến khích) 

ReAct: Phối hợp lý luận và hành động trong các mô hình ngôn ngữ

Tác nhân sáng tạo: Mô phỏng tương tác về hành vi của con người

Phản xạ: Tác nhân ngôn ngữ với việc học tăng cường bằng lời nói

Toolformer: Các mô hình ngôn ngữ có thể tự dạy mình cách sử dụng các công cụ

Mô tả, giải thích, lập kế hoạch và lựa chọn: Lập kế hoạch tương tác với các mô hình ngôn ngữ lớn cho phép các tác nhân đa nhiệm trong thế giới mở 

Du hành: Một tác nhân thể hiện có kết thúc mở với các mô hình ngôn ngữ lớn

Giấy tờ đại lý LLM GitHub Repo

Liên kết gốc