Penulis: Peneliti YBB Capital Zeke
Pendahuluan
Dalam artikel sebelumnya, kami telah beberapa kali membahas pandangan tentang keadaan AI Meme dan perkembangan masa depan AI Agent. Namun, perkembangan narasi di jalur AI Agent ini sangat cepat dan dramatis, membuat banyak orang merasa kewalahan. Sejak "Terminal Kebenaran" membuka musim Agen, dalam waktu singkat dua bulan, narasi kombinasi AI dan Crypto hampir berubah setiap minggu. Baru-baru ini, perhatian pasar mulai berfokus pada proyek "kerangka" yang dipimpin oleh narasi teknologi. Segmen ini telah melahirkan banyak pelari kuda hitam dengan nilai pasar lebih dari satu miliar bahkan sepuluh miliar dalam beberapa minggu terakhir. Proyek semacam itu juga melahirkan paradigma penerbitan aset baru, di mana proyek menerbitkan token melalui repositori kode Github, dan Agen yang dibangun berdasarkan kerangka juga dapat menerbitkan token lagi. Dengan kerangka sebagai dasar, dan Agen di atas. Mirip dengan platform penerbitan aset, namun sebenarnya ini adalah model infrastruktur yang unik untuk era AI yang sedang muncul. Bagaimana kita harus melihat tren baru ini? Artikel ini akan dimulai dengan pengantar kerangka dan menggabungkan pemikiran pribadi untuk menginterpretasikan apa yang sebenarnya berarti kerangka AI bagi Crypto.
Satu, Apa itu kerangka?
Secara definisi, kerangka AI adalah alat atau platform pengembangan dasar yang mengintegrasikan seperangkat modul, pustaka, dan alat yang telah dibangun sebelumnya, menyederhanakan proses membangun model AI yang kompleks. Kerangka ini biasanya juga mencakup fungsi untuk memproses data, melatih model, dan melakukan prediksi. Singkatnya, Anda juga dapat memahami kerangka sebagai sistem operasi di era AI, seperti sistem operasi desktop Windows atau Linux, atau sistem mobile iOS dan Android. Setiap kerangka memiliki kelebihan dan kekurangan masing-masing, pengembang dapat memilih sesuai dengan kebutuhan spesifik.
Meskipun istilah "kerangka AI" masih merupakan konsep baru di bidang Crypto, dari asalnya, sejak diluncurkannya Theano pada tahun 2010, sejarah perkembangan kerangka AI telah mendekati 14 tahun. Di kalangan tradisional AI, baik di akademisi maupun industri, telah ada kerangka yang sangat matang untuk dipilih, seperti TensorFlow dari Google, Pytorch dari Meta, PaddlePaddle dari Baidu, dan MagicAnimate dari Byte, di mana setiap kerangka memiliki keunggulan masing-masing untuk berbagai skenario.
Proyek kerangka yang muncul saat ini dalam Crypto dibangun berdasarkan permintaan besar akan Agen yang muncul dari gelombang AI ini, dan kemudian meluas ke jalur Crypto lainnya, akhirnya membentuk kerangka AI di berbagai bidang yang tersegmentasi. Mari kita ambil beberapa kerangka utama di dalam lingkaran saat ini sebagai contoh untuk memperluas kalimat ini.
1.1 Eliza
Sebagai contoh, mari kita lihat Eliza dari ai16z. Kerangka ini adalah kerangka simulasi multi-Agen yang dirancang khusus untuk membuat, menerapkan, dan mengelola Agen AI mandiri. Dikembangkan dengan TypeScript sebagai bahasa pemrograman, keunggulannya adalah kompatibilitas yang lebih baik, lebih mudah diintegrasikan dengan API.
Menurut dokumen resmi, Eliza terutama menargetkan skenario media sosial, seperti dukungan integrasi multi-platform, kerangka ini menyediakan integrasi Discord yang lengkap dan mendukung saluran suara, akun otomatis di platform X/Twitter, integrasi Telegram, serta akses API langsung. Dalam pengolahan konten media, mendukung pembacaan dan analisis dokumen PDF, ekstraksi konten tautan dan ringkasan, transkripsi audio, pengolahan konten video, analisis dan deskripsi gambar, serta ringkasan dialog.
Kasus penggunaan yang didukung Eliza saat ini terutama terdiri dari empat kategori:
Aplikasi AI asisten: Agen dukungan pelanggan, administrator komunitas, asisten pribadi;
Peran media sosial: Pembuat konten otomatis, robot interaktif, perwakilan merek;
Pekerja pengetahuan: Asisten penelitian, analis konten, pemroses dokumen;
Peran interaktif: Karakter peran, pembimbing pendidikan, robot hiburan.
Model yang didukung Eliza saat ini:
Inferensi lokal model sumber terbuka: seperti Llama3, Qwen1.5, BERT;
Menggunakan API OpenAI untuk inferensi berbasis cloud;
Konfigurasi default adalah Nous Hermes Llama 3.1B;
Integrasi dengan Claude untuk melakukan query kompleks.
1.2 G.A.M.E
G.A.M.E (Generative Autonomous Multimodal Entities Framework) adalah kerangka AI multimodal yang dihasilkan dan dikelola secara otomatis yang diluncurkan oleh Virtual, dirancang khusus untuk NPC cerdas dalam permainan. Kerangka ini juga memiliki fitur khusus di mana pengguna dengan latar belakang low-code atau bahkan tanpa kode dapat menggunakannya, berdasarkan antarmuka percobaannya, pengguna hanya perlu mengubah parameter untuk berpartisipasi dalam desain Agen.
Dalam arsitektur proyek, desain inti G.A.M.E adalah desain modular yang memungkinkan beberapa subsistem bekerja sama, arsitektur rinci terlihat pada gambar di bawah ini.
Antarmuka Pemicu Agen: Antarmuka interaksi antara pengembang dan kerangka AI. Melalui antarmuka ini, pengembang dapat memulai sesi dan menentukan ID sesi, ID agen, ID pengguna, dan parameter lainnya;
Subsystem Persepsi: Subsystem persepsi bertanggung jawab untuk menerima informasi masukan dan menyusunnya sebelum mengirimkannya ke mesin perencanaan strategis. Ini juga menangani respons dari modul pemrosesan dialog;
Mesin Perencanaan Strategis: Mesin perencanaan strategis adalah bagian inti dari seluruh kerangka, dibagi menjadi perencana tingkat tinggi dan kebijakan tingkat rendah. Perencana tingkat tinggi bertanggung jawab untuk menetapkan tujuan dan rencana jangka panjang, sementara kebijakan tingkat rendah mengubah rencana tersebut menjadi langkah tindakan konkret;
Konteks Dunia: Konteks dunia mencakup informasi lingkungan, status dunia, dan status permainan, yang digunakan untuk membantu agen memahami situasi saat ini;
Modul Pemrosesan Dialog: Modul pemrosesan dialog bertanggung jawab untuk memproses pesan dan respons, dapat menghasilkan dialog atau reaksi sebagai output;
Operator Dompet On Chain: Operator dompet on-chain mungkin terlibat dalam aplikasi teknologi blockchain, fungsinya tidak jelas;
Modul Pembelajaran: Modul pembelajaran belajar dari umpan balik dan memperbarui basis pengetahuan agen;
Memori Kerja: Memori kerja menyimpan tindakan, hasil, dan rencana terbaru agen serta informasi jangka pendek lainnya;
Prosesor Memori Jangka Panjang: Prosesor memori jangka panjang bertanggung jawab untuk mengekstrak informasi penting tentang agen dan memori kerjanya, dan mengurutkannya berdasarkan faktor-faktor seperti skor penting, kebaruan, dan relevansi;
Repository Agen: Repository agen menyimpan atribut agen seperti tujuan, refleksi, pengalaman, dan kepribadian;
Perencana Aksi: Perencana aksi menghasilkan rencana tindakan konkret berdasarkan kebijakan tingkat rendah;
Eksekutor Rencana: Eksekutor rencana bertanggung jawab untuk melaksanakan rencana tindakan yang dihasilkan oleh perencana aksi.
Alur kerja: Pengembang memulai Agen melalui antarmuka pemicu Agen, subsystem persepsi menerima input dan meneruskannya ke mesin perencanaan strategis. Mesin perencanaan strategis menggunakan sistem memori, konteks dunia, dan informasi di repositori Agen untuk merumuskan dan melaksanakan rencana tindakan. Modul pembelajaran terus memantau hasil tindakan Agen dan menyesuaikan perilaku Agen berdasarkan hasil tersebut.
Skenario aplikasi: Dari keseluruhan arsitektur teknologi, kerangka ini terutama berfokus pada keputusan, umpan balik, persepsi, dan kepribadian Agen dalam lingkungan virtual. Selain permainan, kerangka ini juga cocok untuk Metaverse, dan di bawah daftar Virtual, Anda dapat melihat bahwa sudah ada banyak proyek yang menggunakan kerangka ini untuk membangun.
1.3 Rig
Rig adalah alat sumber terbuka yang ditulis dengan bahasa Rust, dirancang khusus untuk menyederhanakan pengembangan aplikasi model bahasa besar (LLM). Ini menyediakan antarmuka operasi yang seragam, memungkinkan pengembang untuk dengan mudah berinteraksi dengan banyak penyedia layanan LLM (seperti OpenAI dan Anthropic) serta berbagai basis data vektor (seperti MongoDB dan Neo4j).
Fitur inti:
Antarmuka yang seragam: Apapun penyedia LLM atau jenis penyimpanan vektor, Rig dapat memberikan cara akses yang konsisten, secara signifikan mengurangi kompleksitas pekerjaan integrasi;
Arsitektur modular: Di dalam kerangka, desain modular digunakan, mencakup bagian-bagian kunci seperti "lapisan abstraksi penyedia", "antarmuka penyimpanan vektor", dan "sistem agen cerdas", memastikan fleksibilitas dan skalabilitas sistem;
Keamanan tipe: Memanfaatkan fitur-fitur Rust untuk mencapai operasi penyematan yang aman, menjamin kualitas kode dan keamanan saat runtime;
Kinerja efisien: Mendukung mode pemrograman asinkron, mengoptimalkan kemampuan pemrosesan bersamaan; Fungsi pencatatan dan pemantauan yang terintegrasi membantu pemeliharaan dan pemecahan masalah.
Alur kerja: Ketika pengguna meminta untuk memasuki sistem Rig, mereka pertama-tama melewati "lapisan abstraksi penyedia", yang bertanggung jawab untuk menstandarkan perbedaan antara penyedia yang berbeda dan memastikan konsistensi penanganan kesalahan. Selanjutnya, di lapisan inti, agen cerdas dapat memanggil berbagai alat atau query penyimpanan vektor untuk mendapatkan informasi yang dibutuhkan. Akhirnya, melalui mekanisme canggih seperti pengambilan yang ditingkatkan dengan generasi (RAG), sistem dapat menggabungkan pencarian dokumen dan pemahaman konteks untuk menghasilkan respons yang tepat dan bermakna, kemudian mengembalikannya kepada pengguna.
Skenario aplikasi: Rig tidak hanya cocok untuk membangun sistem jawaban pertanyaan yang memerlukan jawaban cepat dan akurat, tetapi juga dapat digunakan untuk membuat alat pencarian dokumen yang efisien, chatbot atau asisten virtual yang memiliki kemampuan pemahaman konteks, bahkan mendukung pembuatan konten, secara otomatis menghasilkan teks atau bentuk konten lainnya berdasarkan pola data yang ada.
1.4 ZerePy
ZerePy adalah kerangka sumber terbuka berbasis Python yang bertujuan untuk menyederhanakan proses penerapan dan pengelolaan AI Agent di platform X (sebelumnya Twitter). Ini berasal dari proyek Zerebro, mewarisi fungsi intinya, tetapi dirancang dengan cara yang lebih modular dan lebih mudah diperluas. Tujuannya adalah untuk memungkinkan pengembang dengan mudah membuat Agen AI yang dipersonalisasi dan mengautomasi berbagai tugas dan pembuatan konten di X.
ZerePy menyediakan antarmuka baris perintah (CLI) yang memudahkan pengguna untuk mengelola dan mengontrol AI Agent yang mereka terapkan "1". Arsitektur inti didasarkan pada desain modular, memungkinkan pengembang untuk mengintegrasikan modul fungsi yang berbeda dengan fleksibel, seperti:
Integrasi LLM: ZerePy mendukung model bahasa besar (LLM) dari OpenAI dan Anthropic, pengembang dapat memilih model yang paling sesuai dengan skenario aplikasi mereka. Ini memungkinkan Agen untuk menghasilkan konten teks berkualitas tinggi;
Integrasi platform X: Kerangka ini langsung mengintegrasikan API platform X, memungkinkan Agen untuk melakukan posting, membalas, menyukai, dan membagikan;
Sistem koneksi modular: Sistem ini memungkinkan pengembang untuk dengan mudah menambahkan dukungan untuk platform sosial atau layanan lainnya, memperluas fungsionalitas kerangka;
Sistem memori (perencanaan masa depan): Meskipun versi saat ini mungkin belum sepenuhnya diimplementasikan, tujuan desain ZerePy mencakup integrasi sistem memori, memungkinkan Agen untuk mengingat interaksi dan informasi konteks sebelumnya, sehingga dapat menghasilkan konten yang lebih koheren dan dipersonalisasi.
Meskipun proyek Eliza dari ZerePy dan a16z berfokus pada pembangunan dan manajemen AI Agent, keduanya sedikit berbeda dalam arsitektur dan tujuan. Eliza lebih fokus pada simulasi multi-agen dan penelitian AI yang lebih luas, sementara ZerePy lebih menekankan pada penyederhanaan proses penyebaran AI Agent di platform sosial tertentu (X), lebih condong ke penyederhanaan dalam aplikasi praktis.
Dua, Versi ulang ekosistem BTC
Sebenarnya, dari segi jalur perkembangan, AI Agent memiliki banyak kesamaan dengan ekosistem BTC pada akhir tahun 23 dan awal tahun 24. Jalur perkembangan ekosistem BTC dapat disederhanakan menjadi: BRC20-Atomical/Rune dan banyak kompetisi protokol - BTC L2 - BTCFi dengan Babylon sebagai inti. Sementara itu, AI Agent berkembang lebih cepat di atas tumpukan teknologi AI tradisional yang matang, tetapi jalur perkembangan keseluruhannya memang memiliki banyak kesamaan dengan ekosistem BTC, saya akan menyederhanakannya sebagai berikut: Kompetisi kerangka Agen/AI Agen analitis jenis GOAT/ACT-Social. Dari segi tren, proyek infrastruktur yang berfokus pada desentralisasi dan keamanan di sekitar Agen kemungkinan besar juga akan menerima gelombang kerangka ini, menjadi melodi utama di tahap selanjutnya.
Apakah jalur ini akan menuju homogenisasi dan gelembung seperti ekosistem BTC? Saya rasa tidak, pertama, narasi AI Agent tidak bertujuan untuk mereproduksi sejarah rantai kontrak cerdas. Kedua, proyek kerangka AI yang ada, baik secara teknis benar-benar memiliki kekuatan atau terjebak dalam tahap PPT atau ctrl c + ctrl v, setidaknya mereka menawarkan ide baru untuk pengembangan infrastruktur. Banyak artikel membandingkan kerangka AI dengan platform penerbitan aset, dan Agen dengan aset. Sebenarnya, dibandingkan dengan Launchpad Memecoin dan protokol inskripsi, saya pribadi merasa kerangka AI lebih mirip dengan rantai publik di masa depan, dan Agen lebih mirip dengan Dapp di masa depan.
Saat ini, kita memiliki ribuan rantai publik dalam Crypto dan puluhan ribu Dapp. Dalam rantai umum, kita memiliki BTC, Ethereum, dan berbagai rantai heterogen, sedangkan bentuk rantai aplikasi lebih bervariasi, seperti rantai permainan, rantai penyimpanan, rantai Dex. Rantai publik dibandingkan dengan kerangka AI sebenarnya sangat mirip, dan Dapp juga dapat dengan baik berhubungan dengan Agen.
Dalam era AI, Crypto sangat mungkin akan bergerak menuju bentuk ini, perdebatan mendatang juga akan beralih dari perdebatan EVM dan rantai heterogen menjadi perdebatan kerangka. Pertanyaan sekarang lebih kepada bagaimana untuk mendesentralisasi atau mengatakan rantai? Saya pikir proyek infrastruktur AI berikutnya akan berkembang atas dasar ini, dan satu lagi adalah, apa arti melakukan ini di blockchain?
Tiga, Apa arti dari on-chain?
Blockchain, bagaimanapun juga, harus menghadapi satu masalah: Apakah ini berarti? Dalam artikel tahun lalu, saya mengkritik ketidakseimbangan GameFi, perkembangan infrastruktur yang terlalu cepat, dan dalam beberapa artikel terbaru tentang AI, saya juga menyatakan tidak optimis tentang kombinasi AI x Crypto di bidang praktis saat ini. Toh, daya dorong narasi untuk proyek tradisional semakin melemah, dan proyek tradisional yang memiliki performa harga yang baik tahun lalu umumnya harus memiliki kekuatan untuk mencocokkan atau melampaui harga koin. Apa kegunaan AI bagi Crypto? Sebelumnya, saya berpikir tentang Agen yang melakukan operasi untuk mewujudkan niat, Metaverse, Agen sebagai karyawan, dan ide-ide yang relatif umum tetapi memiliki permintaan. Namun, tidak ada kebutuhan tersebut yang sepenuhnya perlu di-chain, dari sudut pandang logika bisnis juga tidak dapat menutup lingkaran. Browser Agen yang disebutkan sebelumnya dapat mewujudkan niat, tetapi masih menghasilkan kebutuhan untuk penandaan data, daya komputasi, dan lain-lain, meskipun kombinasi keduanya masih tidak cukup erat dan bagian daya komputasi masih didominasi oleh daya komputasi yang terpusat.
Merefleksikan jalan menuju kesuksesan DeFi, DeFi mampu mendapatkan bagian dari keuangan tradisional karena memiliki aksesibilitas yang lebih tinggi, efisiensi yang lebih baik, dan biaya yang lebih rendah, serta keamanan yang tidak memerlukan pusat kepercayaan. Jika kita berpikir dengan cara ini, saya rasa ada beberapa alasan yang dapat mendukung rantai Agen.
1. Apakah rantai Agen dapat mencapai biaya penggunaan yang lebih rendah sehingga mencapai aksesibilitas dan pilihan yang lebih tinggi? Akhirnya memungkinkan AI "sewa hak" yang unik bagi perusahaan besar Web2 untuk dapat diakses oleh pengguna biasa;
2. Keamanan, berdasarkan definisi paling sederhana dari Agen, sebuah AI yang dapat disebut sebagai Agen seharusnya dapat berinteraksi dengan dunia nyata atau virtual. Jika Agen dapat terlibat dalam dunia nyata atau dompet virtual saya, maka solusi keamanan berbasis blockchain juga dianggap sebagai kebutuhan mendasar;
3. Dapatkah Agen mewujudkan satu set cara bermain keuangan yang unik untuk blockchain? Misalnya, LP dalam AMM, memungkinkan orang biasa untuk berpartisipasi dalam pasar otomatis, misalnya, Agen memerlukan daya komputasi, penandaan data, dan lain-lain, sementara pengguna yang optimis dapat berinvestasi dalam bentuk U ke dalam protokol. Atau bisa juga Agen yang dibentuk berdasarkan berbagai skenario aplikasi dapat menciptakan cara bermain keuangan baru;
4. DeFi saat ini tidak memiliki interoperabilitas yang sempurna, jika Agen yang menggabungkan blockchain dapat mewujudkan pemikiran yang transparan dan dapat dilacak, mungkin lebih menarik dibandingkan dengan browser agen yang disediakan oleh raksasa internet tradisional yang disebutkan dalam artikel sebelumnya.
Empat, Kreativitas?
Proyek kerangka di masa depan juga akan memberikan peluang kewirausahaan mirip dengan Toko GPT. Meskipun saat ini, menerbitkan Agen melalui kerangka masih sangat kompleks bagi pengguna biasa, saya percaya bahwa menyederhanakan proses pembuatan Agen dan menyediakan beberapa kombinasi fungsi kompleks dalam kerangka akan tetap mendominasi, sehingga akan terbentuk ekonomi kreatif Web3 yang lebih menarik dibandingkan dengan Toko GPT.
Toko GPT saat ini masih cenderung pada utilitas tradisional dan sebagian besar aplikasi populer diciptakan oleh perusahaan Web2 tradisional, dan pendapatannya juga dimiliki oleh pencipta. Menurut penjelasan resmi OpenAI, strategi ini hanya memberikan dukungan keuangan kepada beberapa pengembang luar biasa di daerah AS, memberikan subsidi dalam batas tertentu.
Dari segi permintaan, Web3 masih memiliki banyak aspek yang perlu diisi, dan dalam sistem ekonomi bisa membuat kebijakan tidak adil dari raksasa Web2 menjadi lebih adil. Selain itu, kita juga dapat memperkenalkan ekonomi komunitas untuk membuat Agen lebih sempurna. Ekonomi kreatif Agen akan menjadi kesempatan bagi orang biasa untuk berpartisipasi, dan AI Meme di masa depan akan jauh lebih cerdas dan menarik dibandingkan Agen yang diterbitkan di GOAT dan Clanker.
Referensi artikel:
1. Evolusi sejarah kerangka AI dan eksplorasi tren
2. Bybit: AI Rig Complex (ARC): Kerangka agen AI
3. Deep Value Memetics: Perbandingan horizontal empat kerangka Crypto×AI: kondisi adopsi, kelebihan dan kekurangan, potensi pertumbuhan
4. Dokumen resmi Eliza
5. Dokumen resmi Virtual