Penulis: 0XNATALIE

Sejak paruh kedua tahun ini, topik AI Agent terus meningkat. Awalnya, chatbot AI terminal of truths menarik perhatian luas karena posting dan balasannya yang lucu di X (mirip dengan 'Robert' di Weibo) dan mendapatkan dukungan $50.000 dari pendiri a16z, Marc Andreessen. Terinspirasi oleh konten yang dirilisnya, seseorang menciptakan token GOAT, yang dalam waktu 24 jam saja meningkat lebih dari 10.000%. Topik AI Agent segera menarik perhatian komunitas Web3. Setelah itu, dana perdagangan AI terdesentralisasi pertama yang berbasis Solana, ai16z, diluncurkan, memperkenalkan kerangka pengembangan AI Agent Eliza, dan memicu persaingan antara token besar dan kecil. Namun, komunitas masih belum jelas tentang konsep AI Agent: Apa inti dari AI Agent? Apa bedanya dengan bot perdagangan Telegram?

Prinsip kerja: persepsi, penalaran, dan pengambilan keputusan secara mandiri

AI Agent adalah sistem agen cerdas yang berbasis model bahasa besar (LLM), mampu merasakan lingkungan, membuat keputusan penalaran, dan menyelesaikan tugas kompleks dengan memanggil alat atau menjalankan operasi. Alur kerja: modul persepsi (mengambil input) → LLM (memahami, menganalisis, dan merencanakan) → pemanggilan alat (melaksanakan tugas) → umpan balik dan optimasi (verifikasi dan penyesuaian).

Secara spesifik, AI Agent pertama-tama mengumpulkan data dari lingkungan eksternal melalui modul persepsi (seperti teks, audio, gambar, dll.), dan mengubahnya menjadi informasi terstruktur yang dapat diproses. LLM sebagai komponen inti, menyediakan kemampuan pemahaman dan generasi bahasa alami yang kuat, berfungsi sebagai 'otak' sistem. Berdasarkan data input dan pengetahuan yang ada, LLM melakukan penalaran logis, menghasilkan solusi yang mungkin atau menyusun rencana tindakan. Selanjutnya, AI Agent menyelesaikan tugas konkret dengan memanggil alat eksternal, plugin, atau API, dan memverifikasi serta menyesuaikan hasil berdasarkan umpan balik, membentuk optimasi lingkar tertutup.

Dalam skenario aplikasi Web3, apa perbedaan antara AI Agent dan bot perdagangan Telegram atau skrip otomatis? Menggunakan arbitrase sebagai contoh, pengguna berharap untuk melakukan perdagangan arbitrase dalam kondisi di mana keuntungan lebih besar dari 1%. Dalam bot perdagangan Telegram yang mendukung arbitrase, pengguna mengatur strategi perdagangan dengan keuntungan lebih dari 1%, dan Bot mulai mengeksekusi. Namun, ketika pasar berfluktuasi secara frekuent, dan peluang arbitrase terus berubah, bot-bot ini kekurangan kemampuan evaluasi risiko, dan akan mengeksekusi arbitrase hanya berdasarkan syarat keuntungan lebih dari 1%. Sebaliknya, AI Agent dapat secara otomatis menyesuaikan strategi. Misalnya, ketika keuntungan dari suatu perdagangan melebihi 1%, tetapi melalui analisis data menilai risikonya terlalu tinggi, dan pasar mungkin tiba-tiba berubah menyebabkan kerugian, ia akan memutuskan untuk tidak melakukan arbitrase tersebut.

Oleh karena itu, AI Agent memiliki kemampuan untuk beradaptasi sendiri, dengan keunggulan inti dalam kemampuan untuk belajar sendiri dan membuat keputusan secara mandiri, melalui interaksi dengan lingkungan (seperti pasar, perilaku pengguna, dll.) dan menyesuaikan strategi perilaku berdasarkan sinyal umpan balik, terus meningkatkan efektivitas pelaksanaan tugas. Ia juga dapat membuat keputusan secara real-time berdasarkan data eksternal dan terus mengoptimalkan strategi keputusan melalui pembelajaran penguatan.

Apakah ini terdengar sedikit seperti penyelesai (solver) di bawah kerangka niat? AI Agent sendiri juga merupakan produk berbasis niat, dan perbedaan terbesar antara penyelesai di bawah kerangka niat adalah, penyelesai bergantung pada algoritma yang tepat, memiliki ketelitian matematis, sementara keputusan AI Agent bergantung pada pelatihan data, sering kali perlu mendekati solusi optimal melalui trial and error selama proses pelatihan.

Kerangka utama AI Agent

Kerangka AI Agent adalah infrastruktur untuk membuat dan mengelola agen cerdas. Saat ini di Web3, kerangka kerja yang cukup populer termasuk Eliza dari ai16z, ZerePy dari zerebro, dan GAME dari Virtuals.

Eliza adalah kerangka AI Agent multifungsi yang dibangun dengan TypeScript, mendukung berjalan di beberapa platform (seperti Discord, Twitter, Telegram, dll.) dan melalui manajemen memori yang kompleks, mampu mengingat percakapan dan konteks sebelumnya, menjaga karakteristik kepribadian dan jawaban pengetahuan yang stabil dan konsisten. Eliza menggunakan sistem RAG (Retrieval Augmented Generation), yang mampu mengakses database atau sumber eksternal untuk menghasilkan jawaban yang lebih akurat. Selain itu, Eliza mengintegrasikan plugin TEE, memungkinkan penerapan dalam TEE, sehingga memastikan keamanan dan privasi data.

GAME adalah kerangka kerja yang memberdayakan dan mendorong AI Agent untuk membuat keputusan dan bertindak secara mandiri. Pengembang dapat menyesuaikan perilaku agen sesuai kebutuhan mereka, memperluas fungsinya, dan menyediakan operasi yang disesuaikan (seperti publikasi media sosial, balasan, dll.). Fungsi yang berbeda dalam kerangka ini, seperti lokasi lingkungan dan tugas agen, dibagi menjadi beberapa modul, memudahkan pengembang untuk mengkonfigurasi dan mengelola. Kerangka GAME membagi proses pengambilan keputusan AI Agent menjadi dua tingkat: perencanaan tingkat tinggi (HLP) dan perencanaan tingkat rendah (LLP), masing-masing bertanggung jawab atas tugas dan keputusan pada tingkat yang berbeda. Perencanaan tingkat tinggi bertanggung jawab untuk menetapkan tujuan keseluruhan agen dan perencanaan tugas, membuat keputusan berdasarkan tujuan, kepribadian, informasi latar belakang, dan kondisi lingkungan, menentukan prioritas tugas. Perencanaan tingkat rendah lebih fokus pada aspek eksekusi, mengubah keputusan perencanaan tingkat tinggi menjadi langkah-langkah operasi konkret, memilih fungsi dan metode operasi yang sesuai.

ZerePy adalah kerangka kerja Python sumber terbuka untuk menerapkan AI Agent di X. Kerangka kerja ini mengintegrasikan LLM yang disediakan oleh OpenAI dan Anthropic, memungkinkan pengembang untuk membangun dan mengelola agen media sosial yang secara otomatis melakukan tindakan seperti memposting tweet, membalas tweet, menyukai, dan lain-lain. Setiap tugas dapat diberikan bobot yang berbeda berdasarkan pentingnya. ZerePy menyediakan antarmuka baris perintah (CLI) yang sederhana, memudahkan pengembang untuk memulai dan mengelola agen dengan cepat. Selain itu, kerangka ini juga menyediakan template Replit (sebuah platform pengeditan dan eksekusi kode online), sehingga pengembang dapat dengan cepat memulai menggunakan ZerePy tanpa konfigurasi lingkungan lokal yang rumit.

Mengapa AI Agent menghadapi FUD?

AI Agent tampak cerdas, mampu menurunkan hambatan masuk dan meningkatkan pengalaman pengguna, mengapa komunitas memiliki FUD? Alasannya adalah, AI Agent pada dasarnya masih merupakan alat, saat ini belum dapat menyelesaikan seluruh alur kerja, hanya dapat meningkatkan efisiensi dan menghemat waktu pada beberapa titik. Selain itu, pada tahap perkembangan saat ini, peran AI Agent banyak terfokus pada membantu pengguna menerbitkan MeMe dan mengelola akun media sosial. Komunitas menyebutnya 'aset milik Dev, kewajiban milik AI'.

Namun, minggu ini aiPool merilis AI Agent untuk pra-penjualan token, menggunakan teknologi TEE untuk mencapai desentralisasi. Kunci pribadi dompet AI Agent dihasilkan secara dinamis dalam lingkungan TEE, memastikan keamanan. Pengguna dapat mengirim dana (misalnya SOL) ke dompet yang dikendalikan oleh AI Agent, yang kemudian membuat token berdasarkan aturan yang ditetapkan dan meluncurkan kolam likuiditas di DEX, sambil mendistribusikan token kepada investor yang memenuhi syarat. Seluruh proses ini tidak bergantung pada perantara pihak ketiga, sepenuhnya diselesaikan oleh AI Agent di lingkungan TEE, menghindari risiko rug pull yang umum dalam DeFi. Jelas bahwa AI Agent sedang berkembang secara bertahap. Saya percaya bahwa AI Agent dapat membantu pengguna menurunkan hambatan, meningkatkan pengalaman, meskipun hanya menyederhanakan sebagian proses penerbitan aset, itu sudah berarti. Namun dari perspektif makro Web3, AI Agent sebagai produk off-chain saat ini hanya berfungsi sebagai alat pendukung kontrak pintar, sehingga tidak perlu melebih-lebihkan kemampuannya. Karena paruh kedua tahun ini kekurangan narasi efek kekayaan yang signifikan selain MeMe, hype AI Agent yang berputar di sekitar MeMe juga normal. Mengandalkan MeMe saja tidak dapat mempertahankan nilai jangka panjang, jadi jika AI Agent dapat membawa lebih banyak inovasi dalam proses transaksi, memberikan nilai yang nyata, mungkin akan berkembang menjadi alat infra yang umum.