Judul asli: (Era Agen: Perlawanan dan Simbiosis AI dan Crypto)
Penulis asli: YBB Capital Research
Satu, Dimulai dari perhatian yang mudah bosan
Dalam setahun terakhir, karena narasi lapisan aplikasi terputus, tidak dapat menyamai kecepatan ledakan infrastruktur, bidang crypto secara bertahap berubah menjadi permainan perebutan sumber daya perhatian. Dari Silly Dragon hingga Goat, dari Pump.fun hingga Clanker, kebosanan perhatian telah membuat persaingan ini semakin sengit. Dimulai dengan cara yang paling klise untuk menarik perhatian dan menghasilkan uang, dengan cepat beralih ke model platform di mana permintaan dan penawaran perhatian bersatu, kemudian silikon berbasis biologi menjadi penyedia konten baru. Di antara berbagai bentuk Meme Coin, akhirnya muncul suatu keberadaan yang dapat mencapai konsensus antara investor kecil dan VC: AI Agent.
Perhatian pada akhirnya adalah permainan zero-sum, tetapi spekulasi juga dapat mendorong pertumbuhan liar. Dalam artikel kami tentang UNI, kami pernah mengulas awal era keemasan blockchain sebelumnya, pertumbuhan cepat DeFi berasal dari era penambangan LP yang dimulai oleh Compound Finance, keluar masuk berbagai kolam dengan Apy yang mencapai ribuan bahkan puluhan ribu adalah cara permainan paling primitif di blockchain saat itu, meskipun akhirnya situasinya adalah kehancuran berbagai kolam. Namun, lonjakan masuknya penambang emas benar-benar memberikan likuiditas yang belum pernah terjadi sebelumnya pada blockchain, DeFi akhirnya juga keluar dari spekulasi murni dan membentuk jalur yang matang, memenuhi kebutuhan finansial pengguna dalam berbagai aspek seperti pembayaran, perdagangan, arbitrase, dan staking. Sementara itu, AI Agent juga sedang mengalami fase liar ini, kita sedang mencari tahu bagaimana Crypto dapat lebih baik mengintegrasikan AI, dan akhirnya mendorong lapisan aplikasi ke puncak baru.
Dua, bagaimana agen beroperasi secara mandiri
Kami telah memperkenalkan secara singkat asal AI Meme dalam artikel sebelumnya: Truth Terminal, serta prospek masa depan AI Agent, artikel ini berfokus pada AI Agent itu sendiri.
Mari kita mulai dengan mendefinisikan AI Agent, Agen dalam bidang AI adalah istilah yang cukup tua tetapi tidak memiliki definisi yang jelas, yang utama adalah menekankan Otonomi, yaitu setiap AI yang dapat merasakan lingkungan dan membuat refleksi dapat disebut sebagai Agen. Dalam definisi saat ini, AI Agent lebih dekat dengan agen, yaitu menetapkan seperangkat sistem yang meniru keputusan manusia pada model besar, di kalangan akademis, sistem ini dianggap sebagai cara paling menjanjikan menuju AGI (Kecerdasan Buatan Umum).
Dalam versi awal GPT, kita jelas merasakan bahwa model besar sangat mirip dengan manusia, tetapi ketika menjawab banyak pertanyaan kompleks, model besar hanya dapat memberikan beberapa jawaban yang samar. Penyebab utamanya adalah bahwa model besar saat itu didasarkan pada probabilitas dan bukan kausalitas, dan kedua, ia kekurangan kemampuan yang dimiliki manusia seperti penggunaan alat, memori, perencanaan, dan lain-lain, sementara AI Agent dapat mengisi kekurangan ini. Jadi, untuk merangkum dengan satu rumus, AI Agent (agen) = LLM (model besar) + Perencanaan + Memori + Alat.
Model besar yang 'muncul' berdasarkan kata kunci (Prompt) lebih mirip dengan manusia statis, hanya saat kita memasukkannya, ia memiliki kehidupan, tujuan agen adalah menjadi manusia yang lebih nyata. Saat ini, agen di dalam lingkaran sebagian besar berbasis model fine-tuning Llama 70b atau 405b yang open-source dari Meta (dengan parameter yang berbeda), memiliki kemampuan memori dan akses alat API, di aspek lain mungkin memerlukan bantuan atau masukan manusia (termasuk interaksi dan kolaborasi dengan agen lain), sehingga kita dapat melihat bahwa agen utama di dalam lingkaran saat ini masih ada dalam bentuk KOL di jejaring sosial. Untuk membuat agen lebih mirip manusia, diperlukan kemampuan perencanaan dan tindakan, dan sub-item dalam perencanaan, rantai pemikiran, sangat penting.
Tiga, Rantai Pemikiran (Chain of Thought, CoT)
Konsep rantai pemikiran (Chain of Thought, CoT) pertama kali muncul dalam makalah yang diterbitkan oleh Google pada tahun 2022 (Chain-of-Thought Prompting Elicits Reasoning in Large Language Models), makalah tersebut menunjukkan bahwa kemampuan penalaran model dapat ditingkatkan dengan menghasilkan serangkaian langkah penalaran menengah, membantu model lebih baik memahami dan menyelesaikan masalah kompleks.
Sebuah Prompt CoT yang khas terdiri dari tiga bagian: deskripsi tugas yang jelas, dasar logika yang mendukung penyelesaian tugas, dan contoh solusi konkret yang menunjukkan. Struktur terstruktur ini membantu model memahami persyaratan tugas, mendekati jawaban melalui penalaran logis, sehingga meningkatkan efisiensi dan akurasi penyelesaian masalah. CoT sangat cocok untuk tugas yang memerlukan analisis mendalam dan penalaran multi-langkah, seperti pemecahan masalah matematika, penulisan laporan proyek, dan dalam tugas sederhana, CoT mungkin tidak memberikan keunggulan yang jelas, tetapi untuk tugas yang kompleks, itu dapat secara signifikan meningkatkan kinerja model, mengurangi tingkat kesalahan melalui strategi penyelesaian bertahap, dan meningkatkan kualitas penyelesaian tugas.
Dalam membangun AI Agent, CoT memainkan peran kunci, AI Agent perlu memahami informasi yang diterima dan membuat keputusan yang tepat berdasarkan informasi tersebut, CoT dengan menyediakan cara berpikir yang teratur, membantu Agen untuk memproses dan menganalisis informasi input secara efektif, mengubah hasil analisis menjadi panduan tindakan konkret. Metode ini tidak hanya meningkatkan keandalan dan efisiensi keputusan Agen, tetapi juga meningkatkan transparansi proses pengambilan keputusan, membuat perilaku Agen lebih dapat diprediksi dan dilacak. CoT dengan membagi tugas menjadi beberapa langkah kecil, membantu Agen mempertimbangkan secara detail setiap titik keputusan, mengurangi kesalahan keputusan akibat kelebihan informasi, CoT membuat proses pengambilan keputusan Agen lebih transparan, sehingga pengguna lebih mudah memahami dasar keputusan Agen. Dalam interaksi dengan lingkungan, CoT memungkinkan Agen untuk terus belajar informasi baru dan menyesuaikan strategi perilakunya.
CoT sebagai strategi yang efektif, tidak hanya meningkatkan kemampuan penalaran model bahasa besar, tetapi juga memainkan peran penting dalam membangun Agen AI yang lebih cerdas dan dapat diandalkan. Dengan memanfaatkan CoT, peneliti dan pengembang dapat menciptakan sistem cerdas yang lebih adaptif terhadap lingkungan yang kompleks dan memiliki otonomi tinggi. CoT menunjukkan keunggulan uniknya dalam aplikasi praktis, terutama dalam menangani tugas yang kompleks, dengan membagi tugas menjadi serangkaian langkah kecil, tidak hanya meningkatkan akurasi penyelesaian tugas, tetapi juga meningkatkan interpretabilitas dan kontrol model. Metode penyelesaian masalah secara bertahap ini dapat secara signifikan mengurangi kesalahan keputusan ketika menghadapi tugas yang kompleks karena informasi yang terlalu banyak atau terlalu rumit. Pada saat yang sama, metode ini juga meningkatkan keterlacakan dan verifikasi keseluruhan solusi.
Fungsi inti CoT adalah menggabungkan perencanaan, tindakan, dan pengamatan, mengisi kesenjangan antara penalaran dan tindakan. Pola pikir ini memungkinkan AI Agent untuk merumuskan strategi yang efektif saat memprediksi kemungkinan situasi abnormal, serta mengumpulkan informasi baru dan memverifikasi prediksi yang telah ditetapkan sebelumnya sambil berinteraksi dengan lingkungan eksternal, menyediakan dasar penalaran baru. CoT seperti mesin presisi dan stabilitas yang kuat, membantu AI Agent mempertahankan efisiensi kerja yang tinggi di lingkungan yang kompleks.
Empat, Permintaan palsu yang benar
Apa sebenarnya yang harus digabungkan Crypto dengan aspek tumpukan teknologi AI? Dalam artikel tahun lalu, saya percaya bahwa desentralisasi daya komputasi dan data adalah langkah kunci untuk membantu bisnis kecil dan pengembang individu menghemat biaya, dan tahun ini dalam jalur Crypto x AI yang disusun oleh Coinbase, kami melihat pembagian yang lebih rinci:
(1)Lapisan komputasi(merujuk pada jaringan yang fokus untuk menyediakan sumber daya unit pemrosesan grafis (GPU) bagi pengembang AI);
(2)Lapisan data(merujuk pada jaringan yang mendukung akses, pengaturan, dan verifikasi data AI secara terdesentralisasi);
(3)Lapisan middleware(merujuk pada platform atau jaringan yang mendukung pengembangan, penyebaran, dan pengelolaan model atau agen AI);
(4)Lapisan aplikasi(merujuk pada produk yang ditujukan untuk pengguna yang memanfaatkan mekanisme AI di blockchain, baik itu B2B maupun B2C)。
Dalam empat lapisan pembagian ini, setiap lapisan memiliki visi besar, tujuan mereka dapat diringkas untuk melawan dominasi raksasa Silicon Valley di era internet berikutnya. Seperti yang saya katakan tahun lalu, apakah kita benar-benar harus menerima kendali eksklusif Silicon Valley atas daya komputasi dan data? Dalam model besar closed-source yang dimonopoli oleh mereka, di dalamnya adalah kotak hitam, ilmu pengetahuan sebagai agama yang paling diyakini oleh umat manusia saat ini, setiap kalimat yang dijawab oleh model besar di masa depan akan dianggap sebagai kebenaran oleh sebagian besar orang, tetapi bagaimana kebenaran ini dapat diverifikasi? Sesuai dengan pemikiran raksasa Silicon Valley, hak akses yang dimiliki oleh agen pada akhirnya akan melampaui imajinasi, misalnya, hak pembayaran untuk dompet Anda, hak menggunakan terminal, bagaimana memastikan bahwa orang tidak memiliki niat jahat?
Desentralisasi adalah satu-satunya jawaban, tetapi terkadang kita perlu mempertimbangkan dengan bijak, berapa banyak pihak yang akan membayar untuk visi besar ini? Di masa lalu, kita dapat mengabaikan siklus bisnis dan memperbaiki kesalahan yang dihasilkan dari idealisme melalui Token. Namun, situasi saat ini sangat sulit, Crypto x AI perlu dirancang dengan mempertimbangkan situasi nyata, misalnya, bagaimana menyeimbangkan dua sisi pasokan pada lapisan komputasi ketika ada kerugian kinerja dan ketidakstabilan? Untuk mencapai daya saing cloud terpusat. Berapa banyak pengguna nyata yang akan ada di proyek lapisan data, bagaimana memverifikasi keaslian dan efektivitas data yang disediakan, dan klien seperti apa yang membutuhkan data ini? Dua lapisan lainnya sama prinsipnya, di era ini kita tidak memerlukan banyak permintaan palsu yang tampak benar.
Lima, Meme telah keluar dari SocialFi
Seperti yang saya katakan di paragraf pertama, Meme telah keluar dengan cara super cepat, menciptakan bentuk SocialFi yang sesuai dengan Web3. Friend.tech adalah Dapp yang memulai serangan pertama dalam aplikasi sosial kali ini, tetapi sayangnya gagal karena desain Token yang terburu-buru. Pump.fun telah membuktikan kelayakan murni platform, tanpa melakukan Token, tanpa aturan apa pun. Permintaan dan penawaran perhatian bersatu, Anda dapat mengirim meme, melakukan livestream, mengeluarkan token, meninggalkan pesan, bertransaksi, semuanya bebas, Pump.fun hanya mengenakan biaya layanan. Ini sangat mirip dengan model ekonomi perhatian dari media sosial saat ini seperti YouTube, Ins, hanya saja objek biaya berbeda, dalam hal cara bermain, Pump.fun lebih sesuai dengan Web3.
Clanker Base adalah pengumpul, berkat ekosistem yang terintegrasi secara langsung, Base memiliki Dapp sosial sendiri sebagai pendukung, membentuk siklus internal yang lengkap. Agen Meme adalah bentuk 2.0 dari Meme Coin, orang selalu mencari yang baru, dan Pump.fun saat ini berada di puncak perhatian, dari tren dapat dilihat bahwa imajinasi berbasis silikon akan menggantikan lelucon kasar berbasis karbon hanyalah masalah waktu.
Saya sudah menyebutkan Base berkali-kali, hanya saja setiap kali isi yang disebutkan berbeda, jika dilihat dari garis waktu Base tidak pernah menjadi pelopor, tetapi selalu menjadi pemenang.
Enam, Apa lagi yang bisa menjadi agen?
Dari sudut pandang pragmatis, agen tidak mungkin terdesentralisasi dalam waktu dekat, berdasarkan pembangunan agen di bidang AI tradisional, itu bukan masalah sederhana desentralisasi dan open-source dari proses penalaran, itu memerlukan akses ke berbagai API untuk mengakses konten Web2, biayanya sangat mahal, desain rantai pemikiran dan kolaborasi multi-agen biasanya masih bergantung pada satu manusia sebagai perantara. Kita akan mengalami periode transisi yang panjang, sampai muncul bentuk integrasi yang tepat, mungkin seperti UNI. Namun, sama seperti artikel sebelumnya, saya tetap percaya bahwa agen akan memberikan dampak besar pada industri kita, sama seperti keberadaan Cex dalam industri kita, tidak benar tetapi sangat penting.
Artikel yang diterbitkan oleh Stanford & Microsoft bulan lalu (Tinjauan Agen AI) banyak menggambarkan aplikasi agen dalam industri medis, mesin pintar, dan dunia virtual, dan dalam lampiran artikel ini sudah ada banyak contoh eksperimen dengan GPT-4V sebagai agen yang terlibat dalam pengembangan permainan 3A teratas.
Tidak perlu terlalu memaksakan kecepatan penggabungan dengan desentralisasi, saya lebih berharap bahwa teka-teki yang perlu dilengkapi oleh agen terlebih dahulu adalah kemampuan dan kecepatan dari bawah ke atas, kita memiliki begitu banyak puing naratif dan kekosongan metaverse yang perlu diisi, pada tahap yang tepat kita akan mempertimbangkan bagaimana menjadikannya sebagai UNI berikutnya.
Referensi:
Rantai pemikiran yang 'muncul' dari model besar, sebenarnya adalah kemampuan apa? Penulis: Naojiti
Sebuah artikel untuk memahami Agen, stasiun berikutnya dari model besar Penulis: LinguaMind
Artikel ini berasal dari kontribusi, tidak mewakili pandangan BlockBeats.