Mengurai Kerangka AI: Dari Agen Pintar hingga Eksplorasi Desentralisasi

Penulis asli: Peneliti YBB Capital Zeke
Pendahuluan
Dalam artikel sebelumnya, kami telah beberapa kali membahas pandangan tentang status AI Meme dan perkembangan masa depan AI Agent. Namun, perkembangan narasi di jalur AI Agent sangat cepat dan evolusinya sangat dramatis, sehingga cukup sulit dihadapi. Dalam dua bulan sejak 'terminal kebenaran' membuka Agent Summer, narasi penggabungan AI dan Crypto hampir setiap minggu mengalami perubahan baru. Baru-baru ini, perhatian pasar mulai tertuju pada proyek 'kerangka' yang didominasi oleh narasi teknis, dan jalur yang tersegmentasi ini hanya dalam beberapa minggu telah melahirkan banyak kuda hitam dengan nilai pasar lebih dari satu miliar atau bahkan lebih dari sepuluh miliar. Proyek semacam ini juga melahirkan paradigma penerbitan aset baru, yaitu proyek yang menerbitkan koin melalui repositori kode Github, dan Agent yang dibangun berdasarkan kerangka dapat menerbitkan koin lagi. Dengan kerangka sebagai dasar dan Agent di atas. Mirip dengan platform penerbitan aset, namun sebenarnya ini adalah model infrastruktur yang unik untuk era AI yang sedang muncul. Bagaimana kita harus memandang tren baru ini? Artikel ini akan mulai dari pengantar kerangka dan mengaitkan pemikiran pribadi untuk menginterpretasikan apa yang sebenarnya berarti kerangka AI bagi Crypto.
Satu, Apa itu kerangka?
Secara definisi, kerangka AI adalah alat atau platform pengembangan dasar yang mengintegrasikan serangkaian modul, pustaka, dan alat yang telah dibangun sebelumnya, menyederhanakan proses pembangunan model AI yang kompleks. Kerangka ini biasanya juga mencakup fungsi untuk memproses data, melatih model, dan melakukan prediksi. Singkatnya, Anda juga dapat memahami kerangka sebagai sistem operasi di era AI, seperti Windows, Linux di sistem operasi desktop, atau iOS dan Android di perangkat mobile. Setiap kerangka memiliki kelebihan dan kekurangan masing-masing, dan pengembang dapat memilih sesuai dengan kebutuhan spesifik.
Meskipun istilah 'kerangka AI' masih merupakan konsep baru di bidang Crypto, dari asal usulnya, perkembangan kerangka AI yang dimulai dari Theano yang lahir pada tahun 2010 telah mendekati 14 tahun. Dalam lingkaran AI tradisional, baik di akademia maupun industri, sudah ada kerangka yang sangat matang untuk dipilih, seperti TensorFlow dari Google, Pytorch dari Meta, PaddlePaddle dari Baidu, dan MagicAnimate dari Byte, masing-masing kerangka memiliki kelebihan tersendiri untuk berbagai skenario.
Saat ini, proyek kerangka yang muncul di Crypto adalah berdasarkan gelombang permintaan besar untuk Agent yang muncul di bawah gelombang tren AI ini, dan kemudian berkembang ke jalur Crypto lainnya, akhirnya membentuk kerangka AI di berbagai bidang yang tersegmentasi. Kami mengambil beberapa kerangka utama di dalam lingkaran saat ini sebagai contoh untuk memperluas pernyataan ini.
1.1 Eliza
Pertama, dengan mengambil Eliza dari ai16z sebagai contoh, kerangka ini adalah kerangka simulasi multi-Agent yang dirancang khusus untuk membuat, menerapkan, dan mengelola AI Agent otonom. Dikembangkan dengan TypeScript sebagai bahasa pemrograman, keuntungannya adalah kompatibilitas yang lebih baik dan lebih mudah untuk integrasi API.
Menurut dokumentasi resmi, Eliza terutama ditujukan untuk skenario media sosial, seperti dukungan integrasi multi-platform, kerangka ini menyediakan integrasi Discord yang lengkap dan mendukung saluran suara, akun otomatis di X/Twitter, integrasi Telegram, dan akses API langsung. Dalam hal pemrosesan konten media, mendukung pembacaan dan analisis dokumen PDF, ekstraksi dan ringkasan konten tautan, transkripsi audio, pemrosesan konten video, analisis dan deskripsi gambar, serta ringkasan dialog.
Kasus penggunaan yang didukung Eliza saat ini terutama terdiri dari empat kategori:
Aplikasi jenis AI Assistant: agen dukungan pelanggan, administrator komunitas, asisten pribadi;
Peran media sosial: pembuat konten otomatis, robot interaktif, perwakilan merek;
Pekerja pengetahuan: asisten penelitian, analis konten, pemroses dokumen;
Peran interaktif: karakter peran, pengajar, robot hiburan.
Model yang didukung Eliza saat ini:
Inferensi lokal model sumber terbuka: seperti Llama 3, Qwen 1.5, BERT;
Menggunakan API OpenAI untuk inferensi berbasis cloud;
Konfigurasi default adalah Nous Hermes Llama 3.1 B;
Integrasi dengan Claude untuk melakukan query kompleks.
1.2 G.A.M.E
G.A.M.E (Generative Autonomous Multimodal Entities Framework) adalah kerangka AI multimodal yang secara otomatis menghasilkan dan mengelola yang diluncurkan oleh Virtual, yang ditujukan terutama untuk desain NPC cerdas dalam game, kerangka ini juga memiliki keunikan lain yaitu pengguna tanpa kode dasar bahkan dapat menggunakan, berdasarkan antarmuka percobaannya pengguna hanya perlu mengubah parameter untuk berpartisipasi dalam desain Agent.
Dalam arsitektur proyek, desain inti G.A.M.E adalah desain modular yang bekerja secara kolaboratif melalui beberapa subsistem, arsitektur rinci ditunjukkan di bawah ini.
Antarmuka Prompt Agent: Antarmuka untuk interaksi antara pengembang dan kerangka AI. Melalui antarmuka ini, pengembang dapat memulai sesi dan menentukan ID sesi, ID agen, ID pengguna, dan parameter lainnya;
Subsistem Persepsi: Subsistem persepsi bertanggung jawab untuk menerima informasi input, menyusunnya, dan mengirimkannya ke mesin perencanaan strategis. Ini juga menangani respons dari modul pemrosesan dialog;
Mesin Perencanaan Strategis: Mesin perencanaan strategis adalah bagian inti dari seluruh kerangka, dibagi menjadi perencana tingkat tinggi (High Level Planner) dan kebijakan tingkat rendah (Low Level Policy). Perencana tingkat tinggi bertanggung jawab untuk menetapkan tujuan dan rencana jangka panjang, sementara kebijakan tingkat rendah mengubah rencana tersebut menjadi langkah-langkah tindakan konkret;
Konteks Dunia: Konteks dunia mencakup informasi lingkungan, status dunia dan status permainan, informasi ini digunakan untuk membantu agen memahami situasi saat ini;
Modul Pemrosesan Dialog: Modul pemrosesan dialog bertanggung jawab untuk menangani pesan dan respons, dapat menghasilkan dialog atau reaksi sebagai output;
Operator Dompet On Chain: Operator dompet di blockchain mungkin terlibat dalam aplikasi teknologi blockchain, fungsi spesifiknya tidak jelas;
Modul Pembelajaran: Modul pembelajaran belajar dari umpan balik dan memperbarui basis pengetahuan agen;
Memori Kerja: Memori kerja menyimpan tindakan, hasil, dan rencana jangka pendek terbaru agen;
Pengolah Memori Jangka Panjang: Pengolah memori jangka panjang bertanggung jawab untuk mengekstrak informasi penting tentang agen dan memori kerjanya, dan mengurutkannya berdasarkan faktor-faktor seperti skor penting, kedekatan dan relevansi;
Repositori Agent: Repositori agent menyimpan atribut tujuan, refleksi, pengalaman, dan kepribadian agen;
Perencana Aksi: Perencana aksi menghasilkan rencana tindakan konkret berdasarkan kebijakan tingkat rendah;
Eksekutor Rencana: Eksekutor rencana bertanggung jawab untuk melaksanakan rencana tindakan yang dihasilkan oleh perencana aksi.
Alur kerja: Pengembang memulai Agent melalui antarmuka prompt Agent, subsistem persepsi menerima input dan meneruskan ke mesin perencanaan strategis. Mesin perencanaan strategis menggunakan sistem memori, konteks dunia, dan informasi dari perpustakaan Agent untuk merumuskan dan melaksanakan rencana tindakan. Modul pembelajaran terus memantau hasil tindakan Agent dan menyesuaikan perilaku Agent berdasarkan hasil.
Aplikasi: Dari keseluruhan arsitektur teknis, kerangka ini terutama fokus pada keputusan, umpan balik, persepsi, dan kepribadian Agent di lingkungan virtual, dalam hal kasus penggunaan, selain game juga berlaku untuk Metaverse, dalam daftar di bawah Virtual dapat dilihat bahwa sudah ada banyak proyek yang menggunakan kerangka ini untuk dibangun.
1.3 Rig
Rig adalah alat sumber terbuka yang ditulis dalam bahasa Rust, dirancang khusus untuk menyederhanakan pengembangan aplikasi model bahasa besar (LLM). Ini menyediakan antarmuka operasi yang seragam, memungkinkan pengembang untuk dengan mudah berinteraksi dengan banyak penyedia layanan LLM (seperti OpenAI dan Anthropic) serta berbagai basis data vektor (seperti MongoDB dan Neo 4 j).
Fitur Inti:
Antarmuka yang seragam: Terlepas dari penyedia LLM mana atau jenis penyimpanan vektor mana, Rig dapat memberikan cara akses yang konsisten, secara signifikan mengurangi kompleksitas pekerjaan integrasi;
Arsitektur modular: Di dalam kerangka, desain modular mencakup 'lapisan abstraksi penyedia', 'antarmuka penyimpanan vektor' dan 'sistem agen pintar' serta bagian kunci lainnya, memastikan fleksibilitas dan skalabilitas sistem;
Keamanan tipe: Memanfaatkan fitur Rust untuk mewujudkan operasi tertanam yang aman tipe, menjamin kualitas kode dan keamanan runtime;
Kinerja efisien: Mendukung mode pemrograman asinkron, mengoptimalkan kemampuan pemrosesan bersamaan; fitur pencatatan dan pemantauan yang terintegrasi membantu dalam pemeliharaan dan pemecahan masalah.
Alur kerja: Ketika pengguna meminta untuk memasuki sistem Rig, mereka akan terlebih dahulu melalui 'lapisan abstraksi penyedia', yang bertanggung jawab untuk menstandarisasi perbedaan antara penyedia yang berbeda dan memastikan konsistensi penanganan kesalahan. Selanjutnya, di lapisan inti, agen pintar dapat memanggil berbagai alat atau melakukan pencarian untuk mendapatkan informasi yang dibutuhkan. Akhirnya, melalui mekanisme lanjutan seperti pengambilan yang ditingkatkan (RAG), sistem dapat menggabungkan pencarian dokumen dan pemahaman konteks, menghasilkan respons yang tepat dan bermakna, dan mengembalikannya kepada pengguna.
Aplikasi: Rig tidak hanya cocok untuk membangun sistem tanya jawab yang memerlukan respon cepat dan akurat, tetapi juga dapat digunakan untuk membuat alat pencarian dokumen yang efisien, chatbot atau asisten virtual yang sensitif terhadap konteks, bahkan mendukung pembuatan konten, secara otomatis menghasilkan teks atau bentuk konten lainnya berdasarkan pola data yang ada.
1.4 ZerePy
ZerePy adalah kerangka sumber terbuka berbasis Python yang bertujuan untuk menyederhanakan proses penerapan dan pengelolaan AI Agent di platform X (dulu Twitter). Ini berasal dari proyek Zerebro, mewarisi fungsionalitas inti, tetapi dirancang dengan cara yang lebih modular dan lebih mudah diperluas. Tujuannya adalah untuk memungkinkan pengembang dengan mudah membuat AI Agent yang dipersonalisasi dan menjalankan berbagai tugas otomatisasi dan pembuatan konten di X.
ZerePy menyediakan antarmuka baris perintah (CLI) untuk memudahkan pengguna mengelola dan mengendalikan AI Agent yang mereka terapkan '1'. Arsitektur intinya didasarkan pada desain modular, memungkinkan pengembang untuk secara fleksibel mengintegrasikan berbagai modul fungsional, seperti:
Integrasi LLM: ZerePy mendukung model bahasa besar (LLM) dari OpenAI dan Anthropic, pengembang dapat memilih model yang paling sesuai untuk skenario aplikasi mereka. Ini memungkinkan Agent untuk menghasilkan konten teks berkualitas tinggi;
Integrasi platform X: Kerangka ini mengintegrasikan API platform X secara langsung, memungkinkan Agent untuk melakukan posting, membalas, menyukai, dan me-retweet;
Sistem koneksi modular: Sistem ini memungkinkan pengembang untuk dengan mudah menambahkan dukungan untuk platform sosial atau layanan lain, memperluas fungsionalitas kerangka;
Sistem memori (perencanaan masa depan): Meskipun versi saat ini mungkin belum sepenuhnya terimplementasi, tujuan desain ZerePy mencakup integrasi sistem memori, memungkinkan Agent untuk mengingat interaksi dan informasi konteks sebelumnya, sehingga menghasilkan konten yang lebih koheren dan dipersonalisasi.
Meskipun ZerePy dan proyek Eliza dari a16z sama-sama berkomitmen untuk membangun dan mengelola AI Agent, keduanya memiliki sedikit perbedaan dalam arsitektur dan tujuan. Eliza lebih fokus pada simulasi multi-agen dan penelitian AI yang lebih luas, sementara ZerePy lebih fokus pada penyederhanaan proses penerapan AI Agent di platform sosial tertentu (X), lebih cenderung pada aplikasi praktis.
二、Replikasi Ekosistem BTC
Sebenarnya dari segi jalur pengembangan, AI Agent memiliki banyak kesamaan dengan ekosistem BTC di akhir tahun 23 dan awal 24, jalur pengembangan ekosistem BTC dapat disimpulkan secara sederhana sebagai: BRC 20-Atomical/Rune dan kompetisi multi-protokol-BTC L2-BTCFi yang berfokus pada Babylon. Sementara AI Agent berkembang lebih cepat di atas tumpukan teknologi AI tradisional yang matang, namun jalur pengembangan keseluruhannya memang memiliki banyak kesamaan dengan ekosistem BTC, saya menyimpulkannya secara sederhana sebagai kompetisi kerangka Agent/AI Agent analitis jenis GOAT/ACT-Social. Dari segi tren, proyek infrastruktur yang berfokus pada desentralisasi Agent dan keamanan besar kemungkinan akan meneruskan gelombang kerangka ini, menjadi melodi utama tahap selanjutnya.
Apakah jalur ini akan menuju homogenitas dan gelembung seperti ekosistem BTC? Saya rasa tidak, pertama, narasi AI Agent tidak bertujuan untuk mereproduksi sejarah rantai kontrak pintar, dan kedua, proyek kerangka AI yang ada secara teknis baik yang benar-benar kuat maupun yang terhenti pada tahap PPT atau ctrl c+ctrl v, setidaknya mereka menawarkan cara baru untuk pengembangan infrastruktur. Banyak artikel membandingkan kerangka AI dengan platform penerbitan aset, Agent dibandingkan dengan aset, sebenarnya dibandingkan dengan Memecoin Launchpad dan protokol inskripsi, saya pribadi merasa kerangka AI lebih mirip dengan blockchain publik di masa depan, Agent lebih mirip dengan Dapp di masa depan.
Saat ini di Crypto, kami memiliki ribuan blockchain publik dan puluhan ribu Dapp. Di antara blockchain umum, kami memiliki BTC, Ethereum, dan berbagai blockchain heterogen, sementara bentuk blockchain aplikasi jauh lebih beragam, seperti blockchain game, blockchain penyimpanan, dan blockchain Dex. Blockchain publik sangat mirip dengan kerangka AI, dan Dapp juga dapat dengan baik sesuai dengan Agent.
Di era AI, Crypto sangat mungkin menuju bentuk ini, perdebatan di masa depan juga akan beralih dari perdebatan EVM dan blockchain heterogen ke perdebatan kerangka, sekarang pertanyaannya lebih kepada bagaimana mendecentralisasi atau mengubahnya menjadi rantai? Saya ingin proyek infrastruktur AI di masa depan akan mengembangkan ini, dan satu lagi, apa makna melakukan ini di blockchain?
Tiga, Apa arti naik ke blockchain?
Blockchain, terlepas dari apa pun yang digabungkan, pada akhirnya harus menghadapi satu pertanyaan: Apakah itu berarti? Dalam artikel tahun lalu saya mengkritik kebalikan GameFi, transisi perkembangan Infra yang terlalu maju, dalam beberapa edisi sebelumnya tentang AI saya juga menyatakan bahwa saya tidak optimis tentang kombinasi AI x Crypto di bidang praktis saat ini. Bagaimanapun, dorongan narasi untuk proyek tradisional semakin lemah, dan beberapa proyek tradisional yang memiliki performa harga yang baik tahun lalu pada dasarnya juga harus memenuhi kekuatan yang sesuai atau melampaui harga koin. Apa yang dapat dilakukan AI untuk Crypto? Saya sebelumnya berpikir tentang Agent yang mewakili keinginan, Metaverse, Agent sebagai karyawan, dan gagasan-gagasan lain yang relatif lebih umum tetapi memiliki permintaan. Namun, semua permintaan ini tidak sepenuhnya perlu di-on chain, dan dari sudut pandang logika bisnis juga tidak dapat membentuk siklus tertutup. Browser Agent yang disebutkan sebelumnya yang mewujudkan keinginan, memang dapat menghasilkan permintaan untuk pelabelan data, daya komputasi, dan lain-lain, tetapi keduanya masih tidak cukup erat dan bagian daya komputasi tetap didominasi oleh daya komputasi terpusat.
Memikirkan kembali jalan menuju kesuksesan DeFi, DeFi mampu mendapatkan bagian dari finansial tradisional karena memiliki aksesibilitas yang lebih tinggi, efisiensi yang lebih baik, dan biaya yang lebih rendah, serta keamanan tanpa kepercayaan terpusat. Jika kita berpikir dengan cara ini, saya rasa alasan untuk mendukung rantai Agent mungkin masih ada beberapa.
1. Apakah rantai Agent dapat mewujudkan biaya penggunaan yang lebih rendah untuk mencapai aksesibilitas dan pilihan yang lebih tinggi? Akhirnya memungkinkan 'hak sewa' AI yang unik untuk perusahaan besar Web2 untuk memberikan kesempatan bagi pengguna biasa untuk berpartisipasi;
2. Keamanan, berdasarkan definisi paling sederhana dari Agent, sebuah AI yang dapat disebut Agent seharusnya dapat berinteraksi dengan dunia virtual atau nyata, jika Agent dapat campur tangan dalam dunia nyata atau dompet virtual saya, maka solusi keamanan berbasis blockchain juga merupakan kebutuhan mendesak;
3. Dapatkah Agent mewujudkan seperangkat permainan keuangan yang unik untuk blockchain? Misalnya, LP dalam AMM, memungkinkan orang biasa untuk berpartisipasi dalam pembuatan pasar otomatis, misalnya Agent memerlukan daya komputasi, pelabelan data, dll., sementara pengguna melakukan investasi dalam bentuk U jika mereka optimis. Atau Agent yang berbasis pada berbagai skenario aplikasi dapat membentuk permainan keuangan baru;
4. DeFi saat ini tidak memiliki interoperabilitas yang sempurna, menggabungkan Agent blockchain yang dapat merealisasikan inferensi yang transparan dan dapat dilacak mungkin lebih menarik dibandingkan dengan browser agent yang disediakan oleh raksasa internet tradisional yang disebutkan di artikel sebelumnya.
Empat, Kreativitas?
Proyek kelas kerangka di masa depan juga akan menawarkan kesempatan kewirausahaan serupa dengan GPT Store. Meskipun saat ini merilis Agent melalui kerangka masih sangat kompleks untuk pengguna biasa, saya percaya menyederhanakan proses pembangunan Agent dan menyediakan beberapa kombinasi fungsi yang kompleks dalam kerangka, di masa depan akan menguasai pasar, membentuk ekonomi kreatif Web3 yang lebih menarik dibandingkan GPT Store.
Saat ini, GPT Store masih cenderung pada kegunaan di bidang tradisional dan sebagian besar aplikasi populer dibuat oleh perusahaan Web2 tradisional, dan dalam hal pendapatan, juga dikuasai oleh pencipta. Menurut penjelasan resmi dari OpenAI, strategi ini hanya memberikan dukungan dana kepada beberapa pengembang luar biasa di kawasan Amerika, memberikan subsidi dalam jumlah tertentu.
Dari segi permintaan, Web3 masih memiliki banyak aspek yang perlu diisi, dan dalam sistem ekonomi dapat membuat kebijakan tidak adil dari raksasa Web2 menjadi lebih adil, selain itu, kita juga dapat memperkenalkan ekonomi komunitas untuk membuat Agent lebih sempurna. Ekonomi kreatif Agent akan menjadi kesempatan bagi orang biasa untuk berpartisipasi, dan meme AI di masa depan akan jauh lebih cerdas dan menarik dibandingkan Agent yang diterbitkan di GOAT atau Clanker.
Artikel referensi:
1. Evolusi sejarah kerangka AI dan eksplorasi tren
2. Bybit: Kompleks AI Rig (ARC): Kerangka AI Agent
3. Deep Value Memetics: Perbandingan horizontal empat kerangka Crypto×AI: menggunakan kondisi, kelebihan dan kekurangan, potensi pertumbuhan
4. Dokumentasi resmi Eliza
5. Dokumentasi resmi Virtual
Mengurai Kerangka AI: Dari Agen Pintar hingga Eksplorasi Desentralisasi

Jelajahi Konten Lainnya dari Kreator

Berita Terbaru