Penulis: Peneliti YBB Capital Zeke
Pendahuluan
Dalam artikel sebelumnya, kami telah membahas beberapa kali pandangan tentang keadaan Meme AI dan perkembangan masa depan Agen AI. Namun, perkembangan narasi di jalur Agen yang sangat cepat dan evolusi yang mendalam ini memang cukup mengesankan. Dalam dua bulan sejak 'terminal kebenaran' membuka musim panas Agen, narasi penggabungan AI dan Crypto hampir setiap minggu mengalami perubahan baru. Baru-baru ini, perhatian pasar mulai tertuju kembali pada proyek 'kerangka' yang dipimpin oleh narasi teknologi, jalur segmen ini telah melahirkan beberapa kuda hitam dengan nilai pasar di atas satu miliar bahkan sepuluh miliar hanya dalam beberapa minggu terakhir. Proyek semacam ini juga melahirkan paradigma penerbitan aset baru, di mana proyek menerbitkan token menggunakan repositori kode Github, dan Agen yang dibangun di atas kerangka juga dapat menerbitkan token lagi. Dengan kerangka sebagai dasar dan Agen sebagai lapisan atas. Terlihat seperti platform penerbitan aset, tetapi sebenarnya merupakan model infrastruktur yang unik untuk era AI yang sedang muncul. Bagaimana kita harus memandang tren baru ini? Artikel ini akan dimulai dari pengantar kerangka dan mengaitkannya dengan pemikiran pribadi untuk memahami apa arti kerangka AI bagi Crypto.
Satu, Apa itu kerangka?
Secara definisi, kerangka kerja AI adalah alat pengembangan atau platform dasar yang mengintegrasikan seperangkat modul, perpustakaan, dan alat yang sudah dibangun sebelumnya, menyederhanakan proses membangun model AI yang kompleks. Kerangka tersebut biasanya juga mencakup fungsi untuk memproses data, melatih model, dan melakukan prediksi. Singkatnya, Anda juga dapat memahami kerangka kerja sebagai sistem operasi di era AI, seperti sistem operasi desktop Windows, Linux, atau di perangkat mobile seperti iOS dan Android. Setiap kerangka memiliki kelebihan dan kekurangan masing-masing, pengembang dapat memilih sesuai dengan kebutuhan spesifik.
Meskipun istilah 'kerangka AI' masih merupakan konsep yang baru dalam bidang Crypto, namun dari asal-usulnya, perkembangan kerangka AI sebenarnya sudah mendekati 14 tahun sejak lahirnya Theano pada tahun 2010. Di kalangan AI tradisional, baik di akademisi maupun industri, sudah ada banyak kerangka yang matang untuk dipilih, seperti TensorFlow dari Google, Pytorch dari Meta, PaddlePaddle dari Baidu, dan MagicAnimate dari Byte, masing-masing memiliki keunggulan tersendiri untuk berbagai skenario.
Kerangka proyek yang muncul di Crypto saat ini adalah hasil dari banyak permintaan Agen yang dibangun berdasarkan gelombang panas AI ini, dan kemudian berkembang ke jalur Crypto lainnya, akhirnya membentuk kerangka AI di bawah berbagai segmen yang berbeda. Mari kita ambil beberapa kerangka utama saat ini di dalam lingkaran sebagai contoh untuk memperluas pernyataan ini.
1.1 Eliza
Pertama, sebagai contoh Eliza dari ai16z, kerangka ini adalah kerangka simulasi multi-Agen, dirancang khusus untuk membuat, menerapkan, dan mengelola Agen AI otonom. Berbasis TypeScript sebagai bahasa pemrograman, keuntungannya adalah kompatibilitas yang lebih baik, lebih mudah untuk integrasi API.
Menurut dokumen resmi, Eliza terutama menargetkan skenario media sosial, seperti dukungan integrasi multi-platform, kerangka ini menyediakan integrasi Discord yang lengkap dan mendukung saluran suara, akun otomatis di platform X/Twitter, integrasi Telegram, serta akses API langsung. Dalam hal pemrosesan konten media, mendukung pembacaan dan analisis dokumen PDF, ekstraksi dan ringkasan konten tautan, transkripsi audio, pemrosesan konten video, analisis dan deskripsi gambar, serta ringkasan dialog.
Kasus penggunaan yang didukung oleh Eliza saat ini terdiri dari empat kategori:
Aplikasi jenis asisten AI: agen dukungan pelanggan, administrator komunitas, asisten pribadi;
Peran media sosial: pencipta konten otomatis, bot interaktif, perwakilan merek;
Pekerja pengetahuan: asisten penelitian, analis konten, pemroses dokumen;
Peran interaktif: peran bermain, pendidik, robot hiburan.
Model yang didukung oleh Eliza saat ini:
Inferensi lokal model sumber terbuka: Misalnya Llama3, Qwen1.5, BERT;
Menggunakan API OpenAI untuk inferensi berbasis cloud;
Konfigurasi default adalah Nous Hermes Llama 3.1B;
Integrasi dengan Claude untuk menjalankan kueri kompleks.
1.2 G.A.M.E
G.A.M.E (Generative Autonomous Multimodal Entities Framework) adalah kerangka AI multimodal otomatis yang dikeluarkan oleh Virtual, yang dirancang untuk NPC cerdas dalam game, kerangka ini juga memiliki keistimewaan di mana pengguna dengan latar belakang tanpa kode bahkan dapat menggunakannya, berdasarkan antarmuka uji coba yang terlihat, pengguna hanya perlu mengubah parameter untuk dapat berpartisipasi dalam desain Agen.
Dalam arsitektur proyek, desain inti G.A.M.E adalah desain modular yang bekerja secara kolaboratif melalui beberapa subsistem, arsitektur rinci ditunjukkan pada gambar di bawah ini.
Antarmuka Prompt Agen: Antarmuka untuk interaksi antara pengembang dan kerangka AI. Melalui antarmuka ini, pengembang dapat memulai sesi dan menetapkan parameter seperti ID sesi, ID agen, dan ID pengguna;
Subsistem Persepsi: Subsistem persepsi bertanggung jawab untuk menerima informasi input, menyintesisnya, dan mengirimkannya ke mesin perencanaan strategis. Ini juga menangani respons dari modul pemrosesan dialog;
Mesin Perencanaan Strategis: Mesin perencanaan strategis adalah bagian inti dari seluruh kerangka, dibagi menjadi perencana tingkat tinggi (High Level Planner) dan strategi tingkat rendah (Low Level Policy). Perencana tingkat tinggi bertanggung jawab untuk menetapkan tujuan dan rencana jangka panjang, sementara strategi tingkat rendah mengubah rencana tersebut menjadi langkah-langkah tindakan yang konkret;
Konteks Dunia: Konteks dunia mencakup informasi lingkungan, status dunia, dan data status permainan, yang digunakan untuk membantu agen memahami situasi saat ini;
Modul Pemrosesan Dialog: Modul pemrosesan dialog bertanggung jawab untuk menangani pesan dan respons, dan dapat menghasilkan dialog atau reaksi sebagai output;
Operator Dompet Rantai: Operator dompet di atas rantai mungkin terlibat dalam aplikasi teknologi blockchain, tetapi fungsi spesifiknya tidak jelas;
Modul Pembelajaran: Modul pembelajaran belajar dari umpan balik dan memperbarui basis pengetahuan agen;
Memori Kerja: Memori kerja menyimpan tindakan, hasil, dan informasi jangka pendek lainnya yang baru-baru ini dilakukan oleh agen;
Prosesor Memori Jangka Panjang: Prosesor memori jangka panjang bertanggung jawab untuk mengekstrak informasi penting tentang agen dan memori kerjanya, serta mengurutkannya berdasarkan penilaian pentingnya, keterbaruan, dan relevansi;
Repositori Agen: Repositori agen menyimpan atribut seperti tujuan, refleksi, pengalaman, dan kepribadian agen;
Perencana Tindakan: Perencana tindakan menghasilkan rencana tindakan spesifik berdasarkan strategi tingkat rendah;
Eksekutor Rencana: Eksekutor rencana bertanggung jawab untuk melaksanakan rencana tindakan yang dihasilkan oleh perencana tindakan.
Alur kerja: Pengembang memulai Agen melalui antarmuka prompt Agen, subsistem persepsi menerima input dan mengirimkannya ke mesin perencanaan strategis. Mesin perencanaan strategis menggunakan sistem memori, konteks dunia, dan informasi dari repositori Agen untuk merumuskan dan melaksanakan rencana tindakan. Modul pembelajaran terus memantau hasil tindakan Agen dan menyesuaikan perilaku Agen berdasarkan hasil tersebut.
Skenario aplikasi: Dari seluruh arsitektur teknologi, kerangka ini terutama berfokus pada keputusan, umpan balik, persepsi, dan kepribadian Agen dalam lingkungan virtual; selain game, juga cocok untuk Metaverse, di daftar di bawah Virtual, Anda dapat melihat banyak proyek yang sudah menggunakan kerangka ini untuk dibangun.
1.3 Rig
Rig adalah alat sumber terbuka yang ditulis dalam bahasa Rust, dirancang untuk menyederhanakan pengembangan aplikasi model bahasa besar (LLM). Ini menyediakan antarmuka operasi yang seragam, memungkinkan pengembang untuk dengan mudah berinteraksi dengan beberapa penyedia layanan LLM (seperti OpenAI dan Anthropic) serta berbagai basis data vektor (seperti MongoDB dan Neo4j).
Fitur inti:
Antarmuka yang seragam: Tidak peduli penyedia LLM mana atau jenis penyimpanan vektor mana, Rig dapat menyediakan cara akses yang konsisten, sangat mengurangi kompleksitas pekerjaan integrasi;
Arsitektur Modul: Kerangka kerja menggunakan desain modular di dalamnya, mencakup 'Lapisan Abstraksi Penyedia', 'Antarmuka Penyimpanan Vektor', dan 'Sistem Agen Cerdas', memastikan fleksibilitas dan skalabilitas sistem;
Keamanan Tipe: Menggunakan fitur Rust untuk mencapai operasi penyemaian yang aman, menjamin kualitas kode dan keamanan waktu berjalan;
Kinerja yang efisien: mendukung mode pemrograman asinkron, mengoptimalkan kemampuan pemrosesan bersamaan; fitur pencatatan dan pemantauan yang terintegrasi membantu pemeliharaan dan pemecahan masalah.
Alur kerja: Ketika pengguna meminta untuk masuk ke sistem Rig, mereka terlebih dahulu akan melewati 'Lapisan Abstraksi Penyedia', yang bertanggung jawab untuk menstandarisasi perbedaan antara penyedia yang berbeda dan memastikan konsistensi penanganan kesalahan. Selanjutnya, di lapisan inti, agen cerdas dapat memanggil berbagai alat atau mengquery penyimpanan vektor untuk mendapatkan informasi yang dibutuhkan. Akhirnya, melalui mekanisme canggih seperti pemulihan yang ditingkatkan untuk menghasilkan (RAG), sistem dapat menggabungkan pencarian dokumen dan pemahaman konteks untuk menghasilkan respons yang tepat dan bermakna, kemudian mengembalikannya kepada pengguna.
Skenario aplikasi: Rig tidak hanya cocok untuk membangun sistem jawaban yang memerlukan jawaban cepat dan akurat, tetapi juga dapat digunakan untuk membuat alat pencarian dokumen yang efisien, chatbot atau asisten virtual dengan kemampuan pemahaman konteks, bahkan mendukung penciptaan konten dengan secara otomatis menghasilkan teks atau bentuk konten lain berdasarkan pola data yang sudah ada.
1.4 ZerePy
ZerePy adalah kerangka sumber terbuka berbasis Python, bertujuan untuk menyederhanakan proses penerapan dan pengelolaan Agen AI di platform X (sebelumnya Twitter). Ini merupakan turunan dari proyek Zerebro, mewarisi fungsi inti namun dirancang dengan cara yang lebih modular dan lebih mudah diperluas. Tujuannya adalah untuk memungkinkan pengembang dengan mudah membuat Agen AI yang dipersonalisasi dan melaksanakan berbagai tugas otomatis dan penciptaan konten di X.
ZerePy menyediakan antarmuka baris perintah (CLI), memudahkan pengguna untuk mengelola dan mengontrol Agen AI yang mereka terapkan '1'. Arsitektur intinya berbasis desain modular, memungkinkan pengembang untuk dengan fleksibel mengintegrasikan berbagai modul fungsional, seperti:
Integrasi LLM: ZerePy mendukung model bahasa besar (LLM) dari OpenAI dan Anthropic, pengembang dapat memilih model yang paling sesuai dengan skenario aplikasi mereka. Ini memungkinkan Agen untuk menghasilkan konten teks berkualitas tinggi;
Integrasi platform X: Kerangka kerja langsung mengintegrasikan API platform X, memungkinkan Agen untuk melakukan posting, membalas, menyukai, dan membagikan;
Sistem koneksi modular: Sistem ini memungkinkan pengembang untuk dengan mudah menambahkan dukungan untuk platform sosial atau layanan lain, memperluas fungsi kerangka;
Sistem memori (perencanaan masa depan): Meskipun versi saat ini mungkin belum sepenuhnya terimplementasi, tujuan desain ZerePy mencakup integrasi sistem memori, memungkinkan Agen untuk mengingat interaksi dan informasi konteks sebelumnya, sehingga dapat menghasilkan konten yang lebih koheren dan dipersonalisasi.
Meskipun ZerePy dan proyek Eliza dari a16z keduanya berupaya membangun dan mengelola Agen AI, keduanya memiliki sedikit perbedaan dalam arsitektur dan tujuan. Eliza lebih berfokus pada simulasi multi-agen dan penelitian AI yang lebih luas, sementara ZerePy lebih fokus pada menyederhanakan proses penerapan Agen AI di platform sosial tertentu (X), lebih condong ke aplikasi praktis.
Dua, Versi ekosistem BTC
Sebenarnya, dari segi jalur perkembangan, Agen AI memiliki banyak kesamaan dengan ekosistem BTC pada akhir 2023 dan awal 2024, jalur perkembangan ekosistem BTC dapat diringkas sederhana sebagai: BRC20-Atomical/Rune dan kompetisi multi-protokol-BTC L2-BTCFi yang berfokus pada Babylon. Sementara Agen AI berkembang lebih cepat di atas tumpukan teknologi AI tradisional yang matang, tetapi jalur perkembangan keseluruhannya memang memiliki banyak kesamaan dengan ekosistem BTC, saya meringkasnya sebagai berikut: GOAT/ACT-Agen Sosial/Agen AI analisis persaingan. Dari sisi tren, proyek infrastruktur yang berfokus pada desentralisasi dan keamanan Agen kemungkinan besar juga akan mengambil alih gelombang kerangka ini, menjadi melodi utama tahap berikutnya.
Jadi, apakah jalur ini akan menjadi homogen dan berbusa seperti ekosistem BTC? Saya percaya sebenarnya tidak, pertama, narasi Agen AI bukan untuk mengulangi sejarah rantai kontrak pintar, kedua, proyek kerangka AI yang ada secara teknis baik yang benar-benar memiliki kekuatan atau terhenti di tahap PPT atau ctrl c + ctrl v, setidaknya mereka menyediakan pemikiran baru tentang perkembangan infrastruktur. Banyak artikel membandingkan kerangka AI dengan platform penerbitan aset, Agen dengan aset; dibandingkan dengan Memecoin Launchpad dan protokol inskripsi, saya pribadi merasa kerangka AI lebih mirip rantai publik masa depan, dan Agen lebih mirip Dapp masa depan.
Saat ini di Crypto, kami memiliki ribuan rantai publik dan puluhan ribu Dapp. Dalam rantai umum, kami memiliki BTC, Ethereum, dan berbagai rantai heterogen, sedangkan bentuk rantai aplikasi lebih bervariasi, seperti rantai game, rantai penyimpanan, dan rantai Dex. Rantai publik dan kerangka kerja AI sebenarnya sangat mirip, dan Dapp juga dapat dengan baik sesuai dengan Agen.
Di Crypto pada era AI, sangat mungkin akan bergerak menuju bentuk ini, dan perdebatan masa depan juga akan beralih dari perdebatan EVM dan rantai heterogen ke persaingan kerangka. Sekarang, pertanyaan lebih kepada bagaimana mendesentralisasi atau mengalihkan? Saya rasa proyek infrastruktur AI yang akan datang akan berkembang berdasarkan hal ini, dan satu hal lagi adalah, apa arti melakukan ini di blockchain?
Tiga, Apa makna pengalihan?
Blockchain, tidak peduli dengan hal apa pun yang dikombinasikan, pada akhirnya harus menghadapi satu masalah: Apakah itu berarti? Dalam artikel tahun lalu, saya mengkritik kebalikan GameFi, perkembangan infrastruktur yang terlalu maju, dalam beberapa artikel sebelumnya tentang AI, saya juga menyatakan bahwa saya tidak optimis tentang kombinasi AI x Crypto di bidang praktis saat ini. Bagaimanapun, dorongan narasi untuk proyek tradisional semakin melemah, dan beberapa proyek tradisional yang memiliki kinerja harga yang baik tahun lalu umumnya harus memiliki kekuatan yang cocok atau melampaui harga token. Apa manfaat AI bagi Crypto? Sebelumnya, saya memikirkan ide-ide yang relatif biasa seperti Agen sebagai perwakilan untuk mencapai tujuan, Metaverse, Agen sebagai karyawan, dll. Namun, semua kebutuhan ini tidak sepenuhnya diperlukan untuk berada di blockchain, dari sudut pandang logika bisnis juga tidak dapat menutup lingkaran. Browser Agen yang disebutkan di artikel sebelumnya dapat mewujudkan tujuan, tetapi masih tidak cukup terhubung dan bagian daya komputasi secara keseluruhan masih didominasi oleh daya komputasi terpusat.
Merenungkan jalan sukses DeFi, DeFi dapat berbagi keuntungan dari keuangan tradisional karena memiliki aksesibilitas yang lebih tinggi, efisiensi yang lebih baik, dan biaya yang lebih rendah, tanpa memerlukan kepercayaan terhadap keamanan terpusat. Jika kita berpikir dengan pendekatan ini, saya rasa mungkin ada beberapa alasan yang mendukung pengalihan Agen.
1.Apakah pengalihan Agen dapat mewujudkan biaya penggunaan yang lebih rendah sehingga mencapai aksesibilitas dan pilihan yang lebih tinggi? Akhirnya memungkinkan 'hak sewa' AI yang eksklusif untuk perusahaan besar Web2 untuk dapat diakses oleh pengguna biasa;
2.Keamanan, menurut definisi paling sederhana dari Agen, seorang AI yang dapat disebut sebagai Agen seharusnya dapat berinteraksi dengan dunia virtual atau nyata; jika Agen dapat terlibat dalam dunia nyata atau dompet virtual saya, maka solusi keamanan berbasis blockchain juga menjadi kebutuhan mendasar;
3.Apakah Agen dapat mewujudkan satu set cara bermain finansial yang eksklusif untuk blockchain? Misalnya LP dalam AMM, memungkinkan orang biasa untuk berpartisipasi dalam pembuatan pasar otomatis, misalnya Agen memerlukan daya komputasi, penandaan data, dll., sementara pengguna dapat berinvestasi dalam bentuk U jika mereka optimis. Atau berdasarkan skenario aplikasi yang berbeda, Agen dapat membentuk cara bermain finansial baru;
4.DeFi saat ini tidak memiliki interoperabilitas yang sempurna, jika Agen yang terintegrasi dengan blockchain dapat mencapai inferensi yang transparan dan dapat dilacak, mungkin akan lebih menarik daripada browser agen yang disediakan oleh raksasa internet tradisional yang disebutkan di artikel sebelumnya.
Empat, Kreativitas?
Proyek kerangka juga akan menawarkan peluang kewirausahaan serupa dengan GPT Store di masa depan. Meskipun saat ini menerbitkan Agen melalui kerangka masih cukup kompleks bagi pengguna biasa, saya percaya menyederhanakan proses pembuatan Agen dan menyediakan kombinasi fungsi kompleks dalam kerangka kerja akan tetap mendominasi di masa depan, membentuk ekonomi kreatif Web3 yang lebih menarik dari GPT Store.
Saat ini, GPT Store masih cenderung pada fungsionalitas tradisional dan sebagian besar aplikasi populer dibuat oleh perusahaan Web2 tradisional, dan dalam hal pendapatan, juga didominasi oleh pencipta. Menurut penjelasan resmi OpenAI, strategi ini hanya memberikan dukungan keuangan kepada beberapa pengembang unggulan di wilayah AS, memberikan subsidi dalam jumlah tertentu.
Dari sisi kebutuhan, Web3 masih memiliki banyak aspek yang perlu diisi, dan dalam sistem ekonomi juga dapat membuat kebijakan tidak adil dari raksasa Web2 menjadi lebih adil; selain itu, kita juga dapat memasukkan ekonomi komunitas untuk membuat Agen lebih sempurna. Ekonomi kreatif Agen akan menjadi kesempatan bagi orang biasa untuk berpartisipasi, dan Meme AI di masa depan akan jauh lebih cerdas dan menarik dibandingkan Agen yang diterbitkan di GOAT, Clanker.
Referensi artikel:
1.Evolusi sejarah kerangka AI dan eksplorasi tren
2.Bybit: Kompleks AI Rig (ARC): Kerangka Agen AI
3.Deep Value Memetics: Perbandingan horizontal empat kerangka Crypto×AI: dengan menggunakan kondisi, kelebihan, kekurangan, dan potensi pertumbuhan
4.Dokumen resmi Eliza
5.Dokumen resmi Virtual