Penulis: 0XNATALIE

Sejak paruh kedua tahun ini, topik AI Agent terus meningkat popularitasnya. Awalnya, chatbot AI terminal of truths menarik perhatian besar karena postingan dan balasannya yang humoris di X (mirip dengan 'Robert' di Weibo), dan mendapatkan dana sebesar 50.000 dolar dari pendiri a16z, Marc Andreessen. Terinspirasi oleh konten yang dipublikasikannya, seseorang menciptakan token GOAT, yang dalam waktu 24 jam mengalami kenaikan lebih dari 10.000%. Topik AI Agent segera menarik perhatian komunitas Web3. Kemudian, dana perdagangan AI terdesentralisasi pertama yang berbasis Solana, ai16z, diluncurkan, memperkenalkan kerangka pengembangan AI Agent Eliza, dan memicu persaingan token besar-kecil. Namun, pemahaman komunitas tentang konsep AI Agent masih belum jelas: Apa sebenarnya inti dari AI Agent? Apa bedanya dengan bot perdagangan Telegram?

Prinsip kerja: persepsi, analisis, dan pengambilan keputusan mandiri.

AI Agent adalah sistem agen cerdas berbasis model bahasa besar (LLM), yang mampu memahami lingkungan, mengambil keputusan, dan menyelesaikan tugas kompleks melalui pemanggilan alat atau pelaksanaan operasi. Alur kerja: modul persepsi (mengambil input) → LLM (memahami, menganalisis, dan merencanakan) → pemanggilan alat (menjalankan tugas) → umpan balik dan optimasi (verifikasi dan penyesuaian).

Secara spesifik, AI Agent terlebih dahulu mengumpulkan data dari lingkungan eksternal melalui modul persepsi (seperti teks, audio, gambar, dll.), dan mengubahnya menjadi informasi terstruktur yang dapat diproses. LLM sebagai komponen inti, menyediakan kemampuan pemahaman dan generasi bahasa alami yang kuat, berfungsi sebagai 'otak' sistem. Berdasarkan data input dan pengetahuan yang ada, LLM melakukan penalaran logis, menghasilkan solusi yang mungkin atau merumuskan rencana tindakan. Kemudian, AI Agent menyelesaikan tugas konkret melalui pemanggilan alat eksternal, plugin, atau API, dan memverifikasi serta menyesuaikan hasil berdasarkan umpan balik, membentuk optimasi siklus tertutup.

Dalam skenario aplikasi Web3, apa perbedaan antara AI Agent dan bot perdagangan Telegram atau skrip otomatis? Sebagai contoh arbitrase, pengguna ingin melakukan perdagangan arbitrase dengan kondisi keuntungan lebih dari 1%. Dalam bot perdagangan Telegram yang mendukung arbitrase, pengguna mengatur strategi perdagangan dengan keuntungan lebih dari 1%, dan Bot mulai menjalankan. Namun, ketika pasar berfluktuasi dengan frekuensi tinggi, peluang arbitrase terus berubah, bot-bot ini kurang memiliki kemampuan penilaian risiko, mereka hanya akan menjalankan arbitrase begitu memenuhi syarat keuntungan lebih dari 1%. Sebaliknya, AI Agent dapat secara otomatis menyesuaikan strategi. Misalnya, ketika profit dari suatu perdagangan melebihi 1%, tetapi melalui analisis data menilai risikonya terlalu tinggi, pasar mungkin tiba-tiba berubah menyebabkan kerugian, ia akan memutuskan untuk tidak melakukan arbitrase tersebut.

Oleh karena itu, AI Agent memiliki kemampuan untuk beradaptasi, keuntungan utamanya terletak pada kemampuannya untuk belajar secara mandiri dan mengambil keputusan secara independen, dengan berinteraksi dengan lingkungan (seperti pasar, perilaku pengguna, dll.), mengatur strategi perilakunya berdasarkan sinyal umpan balik, dan terus meningkatkan efektivitas pelaksanaan tugas. Ia juga dapat membuat keputusan secara real-time berdasarkan data eksternal, dan terus mengoptimalkan strategi pengambilan keputusan melalui pembelajaran penguatan.

Apakah ini terdengar sedikit seperti solver dalam kerangka niat? AI Agent sendiri juga merupakan produk berbasis niat, perbedaan terbesar dengan solver dalam kerangka niat adalah, solver bergantung pada algoritma yang tepat, memiliki ketelitian matematis, sementara pengambilan keputusan AI Agent bergantung pada pelatihan data, sering kali perlu mendekati solusi optimal melalui percobaan dan kesalahan selama proses pelatihan.

Kerangka AI Agent yang utama

Kerangka AI Agent adalah infrastruktur untuk membuat dan mengelola agen cerdas. Saat ini di Web3, beberapa kerangka yang cukup populer termasuk Eliza dari ai16z, ZerePy dari zerebro, dan GAME dari Virtuals.

Eliza adalah kerangka AI Agent multifungsi, dibangun menggunakan TypeScript, mendukung operasi di beberapa platform (seperti Discord, Twitter, Telegram, dll.) dan melalui manajemen memori yang kompleks, mampu mengingat percakapan dan konteks sebelumnya, menjaga karakteristik kepribadian dan jawaban pengetahuan yang konsisten. Eliza menggunakan sistem RAG (Retrieval Augmented Generation), memungkinkan akses ke database atau sumber eksternal, sehingga dapat menghasilkan jawaban yang lebih akurat. Selain itu, Eliza mengintegrasikan plugin TEE, memungkinkan penerapan di TEE, sehingga memastikan keamanan dan privasi data.

GAME adalah kerangka yang memberdayakan dan mendorong AI Agent untuk mengambil keputusan dan tindakan secara mandiri. Pengembang dapat menyesuaikan perilaku agen sesuai kebutuhan mereka, memperluas fungsinya, dan menyediakan operasi yang disesuaikan (seperti posting media sosial, membalas, dll.). Fitur-fitur berbeda dalam kerangka, seperti lokasi lingkungan agen dan tugas, dibagi menjadi beberapa modul, memudahkan pengembang untuk melakukan konfigurasi dan manajemen. Kerangka GAME membagi proses pengambilan keputusan AI Agent menjadi dua tingkat: perencanaan tingkat tinggi (HLP) dan perencanaan tingkat rendah (LLP), masing-masing bertanggung jawab atas tugas dan keputusan di tingkat yang berbeda. Perencanaan tingkat tinggi bertanggung jawab untuk menetapkan tujuan keseluruhan agen dan perencanaan tugas, membuat keputusan berdasarkan tujuan, kepribadian, informasi latar belakang, dan status lingkungan, serta menentukan prioritas tugas. Perencanaan tingkat rendah fokus pada aspek pelaksanaan, menerjemahkan keputusan perencanaan tingkat tinggi menjadi langkah-langkah operasional konkret, memilih fungsi dan metode operasi yang sesuai.

ZerePy adalah kerangka Python sumber terbuka, digunakan untuk menerapkan AI Agent di X. Kerangka ini mengintegrasikan LLM yang disediakan oleh OpenAI dan Anthropic, memungkinkan pengembang untuk membangun dan mengelola agen media sosial, secara otomatis melakukan operasi seperti memposting tweet, membalas tweet, menyukai, dan sebagainya. Setiap tugas dapat diatur bobot yang berbeda sesuai dengan pentingnya. ZerePy menyediakan antarmuka baris perintah (CLI) yang sederhana, memudahkan pengembang untuk memulai dan mengelola agen dengan cepat. Selain itu, kerangka ini juga menyediakan template Replit (platform pengeditan dan eksekusi kode online), pengembang dapat dengan cepat mulai menggunakan ZerePy tanpa perlu konfigurasi lingkungan lokal yang rumit.

Mengapa AI Agent menghadapi FUD?

AI Agent tampaknya cerdas, mampu mengurangi hambatan masuk dan meningkatkan pengalaman pengguna, mengapa komunitas mengalami FUD? Alasannya adalah, AI Agent pada dasarnya masih merupakan alat, saat ini belum dapat menyelesaikan seluruh alur kerja, hanya dapat meningkatkan efisiensi dan menghemat waktu di beberapa titik. Selain itu, pada tahap perkembangan ini, peran AI Agent lebih terfokus pada membantu pengguna menerbitkan MeMe dengan satu klik dan mengelola akun media sosial. Komunitas menyebutnya 'aset milik Dev, kewajiban milik AI'.

Namun, baru saja minggu ini, aiPool sebagai token presale AI Agent diluncurkan, memanfaatkan teknologi TEE untuk mencapai desentralisasi. Dompet pribadi AI Agent ini dihasilkan secara dinamis di lingkungan TEE, memastikan keamanan. Pengguna dapat mengirim dana (misalnya SOL) ke dompet yang dikendalikan oleh AI Agent, AI Agent kemudian membuat token berdasarkan aturan yang ditetapkan, dan meluncurkan kolam likuiditas di DEX, sekaligus mendistribusikan token kepada investor yang memenuhi syarat. Seluruh proses tidak bergantung pada pihak ketiga, sepenuhnya diselesaikan oleh AI Agent di lingkungan TEE, menghindari risiko rug pull yang umum dalam DeFi. Jelas, AI Agent sedang berkembang secara bertahap. Saya percaya, AI Agent dapat membantu pengguna mengurangi hambatan, meningkatkan pengalaman, bahkan jika hanya menyederhanakan sebagian proses penerbitan aset, ini sudah berarti. Namun, dari perspektif makro Web3, AI Agent sebagai produk off-chain, pada tahap saat ini hanya berfungsi sebagai alat pendukung kontrak pintar, sehingga tidak perlu terlalu membanggakan kemampuannya. Karena pada paruh kedua tahun ini, selain MeMe, tidak ada narasi efek kekayaan yang signifikan, hype AI Agent yang berkembang di sekitar MeMe juga merupakan hal yang wajar. Hanya dengan MeMe tidak dapat mempertahankan nilai jangka panjang, jadi jika AI Agent dapat membawa lebih banyak inovasi dalam proses perdagangan, memberikan nilai nyata, mungkin ia akan berkembang menjadi alat infra yang umum.