Ditulis oleh: 0XNATALIE
Sejak paruh kedua tahun ini, topik AI Agent terus meningkat. Awalnya, chatbot AI terminal of truths menarik perhatian karena postingan dan balasan humorisnya di X (mirip dengan 'Robert' di Weibo) dan mendapatkan dana sebesar 50.000 USD dari pendiri a16z, Marc Andreessen. Terinspirasi oleh konten yang dipublikasikannya, seseorang menciptakan token GOAT, yang dalam waktu 24 jam melonjak lebih dari 10000%. Topik AI Agent segera menarik perhatian komunitas Web3. Setelah itu, dana perdagangan AI terdesentralisasi pertama yang berbasis Solana ai16z diluncurkan, memperkenalkan kerangka pengembangan AI Agent Eliza, dan memicu persaingan token besar-kecil. Namun, pemahaman komunitas tentang konsep AI Agent masih belum jelas: Apa inti dari AI Agent? Apa bedanya dengan bot perdagangan Telegram?
Prinsip kerja: persepsi, inferensi, dan keputusan mandiri
AI Agent adalah sistem agen cerdas yang berbasis model bahasa besar (LLM), mampu merasakan lingkungan, melakukan keputusan inferensial, dan menyelesaikan tugas kompleks melalui pemanggilan alat atau eksekusi operasi. Alur kerja: modul persepsi (mengambil input) → LLM (memahami, melakukan inferensi, dan merencanakan) → pemanggilan alat (menyelesaikan tugas) → umpan balik dan optimasi (verifikasi dan penyesuaian).
Secara khusus, AI Agent pertama-tama mengambil data dari lingkungan eksternal melalui modul persepsi (seperti teks, audio, gambar, dll.) dan mengubahnya menjadi informasi terstruktur yang dapat diproses. LLM sebagai komponen inti, menyediakan kemampuan pemahaman dan generasi bahasa alami yang kuat, bertindak sebagai 'otak' sistem. Berdasarkan data input dan pengetahuan yang ada, LLM melakukan inferensi logis, menghasilkan kemungkinan solusi atau merencanakan langkah-langkah tindakan. Selanjutnya, AI Agent menyelesaikan tugas konkret dengan memanggil alat eksternal, plugin, atau API, dan memverifikasi serta menyesuaikan hasil berdasarkan umpan balik, membentuk optimasi lingkaran tertutup.
Dalam konteks aplikasi Web3, apa perbedaan antara AI Agent dan bot perdagangan Telegram atau skrip otomatis? Sebagai contoh arbitrase, pengguna ingin melakukan perdagangan arbitrase dengan kondisi keuntungan lebih dari 1%. Dalam bot perdagangan Telegram yang mendukung arbitrase, pengguna mengatur strategi perdagangan dengan keuntungan lebih dari 1%, dan bot mulai menjalankannya. Namun, ketika pasar berfluktuasi sering, dan peluang arbitrase terus berubah, bot-bot ini kekurangan kemampuan evaluasi risiko, selama memenuhi syarat keuntungan lebih dari 1%, mereka akan menjalankan arbitrase. Sebaliknya, AI Agent dapat secara otomatis menyesuaikan strategi. Misalnya, ketika keuntungan dari suatu transaksi melebihi 1%, tetapi analisis data menilai risikonya terlalu tinggi, dan pasar mungkin tiba-tiba berubah menyebabkan kerugian, ia akan memutuskan untuk tidak menjalankan arbitrase tersebut.
Oleh karena itu, AI Agent memiliki kemampuan adaptasi diri, dengan keunggulan inti pada kemampuan untuk belajar sendiri dan membuat keputusan secara mandiri. Melalui interaksi dengan lingkungan (seperti pasar, perilaku pengguna, dll.), AI Agent dapat menyesuaikan strategi perilaku berdasarkan sinyal umpan balik, terus-menerus meningkatkan efektivitas pelaksanaan tugas. Ia juga dapat membuat keputusan secara real-time berdasarkan data eksternal dan terus mengoptimalkan strategi keputusan melalui pembelajaran penguatan.
Apakah ini terdengar sedikit seperti solver dalam kerangka niat? AI Agent itu sendiri juga merupakan produk berbasis niat, perbedaan terbesar dengan solver dalam kerangka niat adalah bahwa solver bergantung pada algoritma yang tepat dan memiliki ketelitian matematis, sementara keputusan AI Agent bergantung pada pelatihan data, sering kali perlu mendekati solusi optimal melalui trial and error selama proses pelatihan.
Kerangka utama AI Agent
Kerangka AI Agent adalah infrastruktur untuk menciptakan dan mengelola agen cerdas. Saat ini di Web3, kerangka yang cukup populer termasuk Eliza dari ai16z, ZerePy dari zerebro, dan GAME dari Virtuals.
Eliza adalah kerangka AI Agent multifungsi yang dibangun menggunakan TypeScript, mendukung operasi di berbagai platform (seperti Discord, Twitter, Telegram, dll.) dan melalui manajemen memori yang kompleks, dapat mengingat percakapan dan konteks sebelumnya, menjaga karakteristik kepribadian dan jawaban pengetahuan yang konsisten. Eliza menggunakan sistem RAG (Retrieval Augmented Generation), yang dapat mengakses database atau sumber eksternal untuk menghasilkan jawaban yang lebih akurat. Selain itu, Eliza mengintegrasikan plugin TEE, memungkinkan penerapan di dalam TEE, sehingga memastikan keamanan dan privasi data.
GAME adalah kerangka yang memberdayakan dan menggerakkan AI Agent untuk membuat keputusan dan tindakan mandiri. Pengembang dapat menyesuaikan perilaku agen sesuai kebutuhan mereka, memperluas fungsinya, dan menyediakan operasi yang disesuaikan (seperti publikasi media sosial, balasan, dll.). Berbagai fungsi dalam kerangka, seperti lokasi lingkungan agen dan tugas, dibagi menjadi beberapa modul untuk memudahkan pengembang dalam konfigurasi dan manajemen. Kerangka GAME membagi proses keputusan AI Agent menjadi dua tingkat: perencanaan tingkat tinggi (HLP) dan perencanaan tingkat rendah (LLP), masing-masing bertanggung jawab atas tugas dan keputusan di tingkat yang berbeda. Perencanaan tingkat tinggi bertanggung jawab untuk menetapkan tujuan umum agen dan perencanaan tugas, membuat keputusan berdasarkan tujuan, kepribadian, informasi latar belakang, dan status lingkungan, serta menentukan prioritas tugas. Perencanaan tingkat rendah fokus pada aspek eksekusi, mengubah keputusan perencanaan tingkat tinggi menjadi langkah-langkah operasi konkret, memilih fungsi dan metode operasi yang tepat.
ZerePy adalah kerangka Python sumber terbuka yang digunakan untuk menerapkan AI Agent di X. Kerangka ini mengintegrasikan LLM yang disediakan oleh OpenAI dan Anthropic, memungkinkan pengembang untuk membangun dan mengelola agen media sosial, otomatisasi dalam melakukan tindakan seperti memposting tweet, membalas tweet, menyukai, dll. Setiap tugas dapat diatur dengan bobot yang berbeda berdasarkan kepentingannya. ZerePy menyediakan antarmuka baris perintah (CLI) yang sederhana, memudahkan pengembang untuk cepat memulai dan mengelola agen. Selain itu, kerangka ini juga menyediakan template Replit (sebuah platform pengeditan dan eksekusi kode online), sehingga pengembang dapat dengan cepat mulai menggunakan ZerePy tanpa perlu konfigurasi lingkungan lokal yang rumit.
Mengapa AI Agent menghadapi FUD?
AI Agent tampak cerdas, mampu menurunkan hambatan masuk dan meningkatkan pengalaman pengguna, mengapa komunitas memiliki FUD? Alasannya adalah bahwa AI Agent pada dasarnya masih hanya alat, saat ini belum dapat menyelesaikan seluruh alur kerja, hanya dapat meningkatkan efisiensi dan menghemat waktu pada beberapa titik. Selain itu, pada tahap perkembangan saat ini, peran AI Agent lebih banyak terfokus pada membantu pengguna menerbitkan MeMe dengan satu klik dan mengelola akun media sosial. Komunitas menyebutnya 'aset milik Dev, kewajiban milik AI'.
Namun, baru-baru ini aiPool merilis AI Agent sebagai penjualan token presale, menggunakan teknologi TEE untuk mencapai desentralisasi. Kunci pribadi dompet AI Agent ini dihasilkan secara dinamis di lingkungan TEE, memastikan keamanan. Pengguna dapat mengirim dana (misalnya SOL) ke dompet yang dikendalikan oleh AI Agent, dan AI Agent kemudian akan membuat token berdasarkan aturan yang ditetapkan dan meluncurkan kolam likuiditas di DEX, sambil mendistribusikan token ke investor yang memenuhi syarat. Seluruh proses tidak memerlukan ketergantungan pada pihak ketiga, sepenuhnya diselesaikan oleh AI Agent di lingkungan TEE, menghindari risiko rug pull yang umum di DeFi. Jelaslah, AI Agent sedang berkembang. Saya percaya, AI Agent dapat membantu pengguna menurunkan hambatan, meningkatkan pengalaman, bahkan jika hanya menyederhanakan sebagian proses penerbitan aset, itu sudah berarti. Namun, dari sudut pandang makro Web3, AI Agent sebagai produk off-chain, pada tahap ini hanya berfungsi sebagai alat pendukung kontrak pintar, sehingga tidak perlu membesar-besarkan kemampuannya. Karena pada paruh kedua tahun ini, selain MeMe, tidak ada narasi efek kekayaan yang signifikan, maka hype AI Agent yang berputar di sekitar MeMe adalah hal yang normal. Hanya bergantung pada MeMe tidak dapat mempertahankan nilai jangka panjang, jadi jika AI Agent dapat membawa lebih banyak inovasi dalam proses perdagangan, menyediakan nilai nyata yang dapat diterapkan, mungkin akan berkembang menjadi alat infra yang umum.