Penulis: 0XNATALIE
Sejak paruh kedua tahun ini, topik AI Agent terus meningkat. Awalnya, chatbot AI terminal of truths mendapat perhatian luas karena postingan dan balasan lucunya di X (mirip dengan 'Robert' di Weibo) dan mendapatkan dana sebesar 50.000 dolar dari pendiri a16z, Marc Andreessen. Terinspirasi oleh konten yang dipublikasikan, seseorang menciptakan token GOAT, yang dalam waktu 24 jam mengalami kenaikan lebih dari 10.000%. Topik AI Agent segera menarik perhatian komunitas Web3. Kemudian, dana perdagangan AI terdesentralisasi pertama berbasis Solana ai16z diluncurkan, memperkenalkan kerangka pengembangan AI Agent Eliza, yang memicu persaingan token kapitalisasi besar dan kecil. Namun, komunitas masih tidak jelas tentang konsep AI Agent: Apa inti dari AI Agent? Apa bedanya dengan bot perdagangan Telegram?
Prinsip kerja: persepsi, penalaran, dan keputusan mandiri.
AI Agent adalah sistem agen cerdas berbasis model bahasa besar (LLM) yang mampu merasakan lingkungan, melakukan keputusan penalaran, dan menyelesaikan tugas kompleks dengan memanggil alat atau menjalankan operasi. Alur kerja: modul persepsi (mengambil input) → LLM (memahami, menalar, dan merencanakan) → pemanggilan alat (melaksanakan tugas) → umpan balik dan optimasi (memverifikasi dan menyesuaikan).
Secara spesifik, AI Agent pertama-tama mendapatkan data dari lingkungan eksternal melalui modul persepsi (seperti teks, audio, gambar, dll.), dan mengubahnya menjadi informasi terstruktur yang dapat diproses. LLM sebagai komponen inti, menyediakan pemahaman dan kemampuan generasi bahasa alami yang kuat, berfungsi sebagai 'otak' sistem. Berdasarkan data yang dimasukkan dan pengetahuan yang ada, LLM melakukan penalaran logis, menghasilkan kemungkinan solusi atau merumuskan rencana aksi. Kemudian, AI Agent menyelesaikan tugas spesifik dengan memanggil alat eksternal, plugin, atau API, dan memverifikasi serta menyesuaikan hasil berdasarkan umpan balik, membentuk optimasi siklus tertutup.
Dalam skenario aplikasi Web3, apa perbedaan AI Agent dengan bot perdagangan Telegram atau skrip otomatis? Mengambil contoh arbitrase, pengguna ingin melakukan perdagangan arbitrase dengan kondisi keuntungan lebih dari 1%. Dalam bot perdagangan Telegram yang mendukung arbitrase, pengguna mengatur strategi perdagangan dengan keuntungan lebih dari 1%, bot kemudian mulai mengeksekusi. Namun, ketika pasar berfluktuasi secara frekuent, kesempatan arbitrase terus berubah, bot ini kekurangan kemampuan penilaian risiko, asalkan memenuhi syarat keuntungan lebih dari 1%, mereka akan mengeksekusi arbitrase. Sebaliknya, AI Agent dapat secara otomatis menyesuaikan strategi. Misalnya, ketika keuntungan dari suatu perdagangan melebihi 1%, tetapi melalui analisis data menilai risikonya terlalu tinggi, pasar mungkin tiba-tiba berubah menyebabkan kerugian, maka ia akan memutuskan untuk tidak mengeksekusi perdagangan arbitrase tersebut.
Oleh karena itu, AI Agent memiliki kemampuan untuk beradaptasi, keunggulan utamanya adalah mampu belajar sendiri dan mengambil keputusan secara mandiri, dengan berinteraksi dengan lingkungan (seperti pasar, perilaku pengguna, dll.), menyesuaikan strategi perilaku berdasarkan sinyal umpan balik, dan terus meningkatkan efektivitas pelaksanaan tugas. Ia juga dapat membuat keputusan secara real-time berdasarkan data eksternal dan terus mengoptimalkan strategi keputusan melalui pembelajaran yang diperkuat.
Apakah ini terdengar sedikit seperti solver di bawah kerangka niat? AI Agent sendiri juga merupakan produk berbasis niat, perbedaan terbesar dengan solver di bawah kerangka niat adalah, solver bergantung pada algoritma yang tepat, memiliki ketelitian matematis, sedangkan keputusan AI Agent bergantung pada pelatihan data, sering kali perlu mendekati solusi optimal dengan terus mencoba dan salah selama proses pelatihan.
Kerangka utama AI Agent
Kerangka AI Agent adalah infrastruktur untuk membuat dan mengelola agen cerdas. Saat ini di Web3, kerangka yang cukup populer termasuk Eliza dari ai16z, ZerePy dari zerebro, dan GAME dari Virtuals.
Eliza adalah kerangka kerja AI Agent yang multifungsi, dibangun menggunakan TypeScript, mendukung operasi di berbagai platform (seperti Discord, Twitter, Telegram, dll.) dan berkat manajemen memori yang kompleks, mampu mengingat percakapan dan konteks sebelumnya, serta mempertahankan karakteristik kepribadian dan jawaban pengetahuan yang stabil dan konsisten. Eliza menggunakan sistem RAG (Retrieval Augmented Generation) yang dapat mengakses database atau sumber daya eksternal untuk menghasilkan jawaban yang lebih akurat. Selain itu, Eliza mengintegrasikan plugin TEE, yang memungkinkan penyebaran di TEE untuk memastikan keamanan dan privasi data.
GAME adalah kerangka kerja yang memberdayakan dan mendorong AI Agent untuk mengambil keputusan dan tindakan secara mandiri. Pengembang dapat menyesuaikan perilaku agen sesuai kebutuhan mereka, memperluas fungsinya, dan memberikan operasi yang disesuaikan (seperti publikasi media sosial, balasan, dll.). Berbagai fungsi dalam kerangka, seperti lokasi lingkungan agen dan tugas, dibagi menjadi beberapa modul, memudahkan pengembang untuk mengkonfigurasi dan mengelola. Kerangka GAME membagi proses pengambilan keputusan AI Agent menjadi dua tingkat: perencanaan tingkat tinggi (HLP) dan perencanaan tingkat rendah (LLP), masing-masing bertanggung jawab untuk tugas dan keputusan pada tingkat yang berbeda. Perencanaan tingkat tinggi bertanggung jawab untuk menetapkan tujuan dan perencanaan tugas umum agen, membuat keputusan berdasarkan tujuan, kepribadian, informasi latar belakang, dan status lingkungan, serta menentukan prioritas tugas. Perencanaan tingkat rendah berfokus pada aspek pelaksanaan, mengubah keputusan perencanaan tingkat tinggi menjadi langkah-langkah operasi konkret, memilih fungsi dan metode operasi yang sesuai.
ZerePy adalah kerangka Python sumber terbuka untuk menyebarkan AI Agent di X. Kerangka ini mengintegrasikan LLM yang disediakan oleh OpenAI dan Anthropic, memungkinkan pengembang membangun dan mengelola agen media sosial, serta otomatisasi eksekusi operasi seperti memposting tweet, membalas tweet, menyukai, dan lainnya. Setiap tugas dapat diatur dengan bobot yang berbeda berdasarkan kepentingannya. ZerePy menyediakan antarmuka baris perintah (CLI) yang sederhana, memudahkan pengembang untuk memulai dan mengelola agen dengan cepat. Selain itu, kerangka ini juga menyediakan template Replit (sebuah platform pengeditan dan eksekusi kode online), sehingga pengembang dapat dengan cepat memulai menggunakan ZerePy tanpa memerlukan konfigurasi lingkungan lokal yang rumit.
Mengapa AI Agent menghadapi FUD?
AI Agent tampaknya cerdas, mampu menurunkan hambatan masuk dan meningkatkan pengalaman pengguna, mengapa komunitas memiliki FUD? Alasannya adalah, AI Agent pada dasarnya masih merupakan alat, saat ini belum dapat menyelesaikan seluruh alur kerja, hanya dapat meningkatkan efisiensi dan menghemat waktu di beberapa titik. Selain itu, tahap perkembangan saat ini, peran AI Agent lebih banyak terfokus pada membantu pengguna menerbitkan MeMe dengan satu klik dan mengelola akun media sosial. Komunitas menyebutnya 'aset milik Dev, kewajiban milik AI'.
Namun, pada minggu ini aiPool merilis AI Agent untuk penjualan token presale, memanfaatkan teknologi TEE untuk mencapai desentralisasi. Kunci pribadi dompet AI Agent dihasilkan secara dinamis di lingkungan TEE, memastikan keamanan. Pengguna dapat mengirim dana (misalnya SOL) ke dompet yang dikendalikan oleh AI Agent, kemudian AI Agent akan membuat token sesuai dengan aturan yang ditetapkan dan meluncurkan kumpulan likuiditas di DEX, sekaligus mendistribusikan token kepada investor yang memenuhi syarat. Seluruh proses tidak bergantung pada pihak ketiga, sepenuhnya dilakukan oleh AI Agent di lingkungan TEE, menghindari risiko rug pull yang umum di DeFi. Jelas bahwa AI Agent sedang berkembang secara bertahap. Saya percaya AI Agent dapat membantu pengguna menurunkan hambatan, meningkatkan pengalaman, bahkan jika hanya menyederhanakan sebagian proses penerbitan aset, itu sudah berarti. Namun, dari perspektif makro Web3, AI Agent sebagai produk off-chain saat ini hanya berfungsi sebagai alat pendukung kontrak pintar, sehingga tidak perlu membesar-besarkan kemampuannya. Karena di semester kedua tahun ini, selain MeMe, tidak ada narasi efek kekayaan yang signifikan, hype AI Agent yang berputar di sekitar MeMe juga normal. Mengandalkan MeMe saja tidak dapat mempertahankan nilai jangka panjang, jadi jika AI Agent dapat membawa lebih banyak inovasi dalam proses perdagangan dan memberikan nilai nyata, mungkin akan berkembang menjadi alat infra yang umum.