Penulis: Peneliti YBB Capital Zeke
Satu, Dimulai dengan Ketertarikan Baru dan Usang
Dalam setahun terakhir, karena narasi lapisan aplikasi terputus, tidak dapat menyamai kecepatan infrastruktur yang berkembang, bidang kripto secara bertahap berubah menjadi permainan perebutan sumber daya perhatian. Dari Silly Dragon hingga Goat, dari Pump.fun hingga Clanker, ketidakpuasan terhadap perhatian membuat perebutan ini terus berlanjut. Dimulai dengan cara yang sangat klise untuk menarik perhatian, dengan cepat beralih ke model platform yang menyatukan permintaan dan penawaran perhatian, kemudian ke biologi silikon menjadi penyedia konten baru. Dalam berbagai bentuk Meme Coin yang aneh, akhirnya muncul sesuatu yang dapat menjembatani kesepakatan antara investor ritel dan VC: AI Agent.
Perhatian pada akhirnya adalah permainan zero-sum, meskipun spekulasi memang dapat mendorong pertumbuhan liar. Dalam artikel tentang UNI, kami telah meninjau awal dari era keemasan blockchain sebelumnya, pertumbuhan cepat DeFi berasal dari era pertambangan LP yang dimulai oleh Compound Finance. Keluar masuk dari berbagai kolam pertambangan yang memiliki APY ribuan bahkan puluhan ribu adalah cara permainan paling primitif di rantai pada waktu itu, meskipun pada akhirnya situasi berakhir dengan berbagai kolam yang runtuh menjadi kekacauan. Namun, masuknya para penambang emas yang gila memang meninggalkan likuiditas yang belum pernah terjadi sebelumnya di blockchain, dan DeFi akhirnya melampaui spekulasi murni untuk membentuk jalur yang matang, memenuhi kebutuhan finansial pengguna dalam berbagai aspek seperti pembayaran, perdagangan, arbitrasi, dan staking. Dan AI Agent saat ini juga sedang mengalami fase liar ini, kita sedang mengeksplorasi bagaimana Crypto dapat lebih baik berintegrasi dengan AI, dan akhirnya mendorong lapisan aplikasi ke puncak baru.
Dua, Bagaimana Agen Beroperasi Secara Mandiri
Dalam artikel sebelumnya, kami telah memperkenalkan asal-usul AI Meme: Truth Terminal, serta pandangan ke depan tentang masa depan AI Agent. Artikel ini berfokus pada AI Agent itu sendiri terlebih dahulu.
Kami pertama-tama membahas definisi AI Agent, di mana kata Agent dalam bidang AI adalah istilah yang cukup tua tetapi tidak memiliki definisi yang jelas. Istilah ini terutama menekankan pada otonomi, yaitu setiap AI yang dapat merasakan lingkungan dan bereaksi dapat disebut sebagai Agen. Dalam definisi saat ini, AI Agent lebih mendekati istilah 'smart agent', yaitu menetapkan satu set sistem yang meniru keputusan manusia pada model besar. Dalam akademisi, sistem ini dianggap sebagai cara yang paling menjanjikan untuk menuju AGI (Kecerdasan Buatan Umum).
Dalam versi awal GPT, kita jelas dapat merasakan bahwa model besar sangat mirip dengan manusia, tetapi saat menjawab banyak pertanyaan kompleks, model besar hanya dapat memberikan beberapa jawaban yang tampak benar. Alasan utama adalah bahwa model besar saat itu didasarkan pada probabilitas dan bukan kausalitas, dan kedua, ia kekurangan kemampuan yang dimiliki manusia seperti penggunaan alat, memori, dan perencanaan. AI Agent dapat mengisi kekurangan ini. Jadi, untuk merangkum dengan satu rumus, AI Agent (Agen) = LLM (Model Besar) + Perencanaan + Memori + Alat.
Model besar berbasis prompt lebih mirip manusia statis, hanya hidup saat kita memasukkan input, tujuan agen adalah menjadi manusia yang lebih nyata. Saat ini, agen dalam lingkaran sebagian besar adalah model fine-tuned berbasis versi Llama 70b atau 405b yang open-source oleh Meta (keduanya memiliki parameter berbeda), yang memiliki kemampuan memori dan menggunakan alat API, tetapi dalam aspek lain mungkin memerlukan bantuan atau input manusia (termasuk interaksi dan kolaborasi dengan agen lainnya), sehingga kita dapat melihat bahwa agen utama di lingkaran saat ini masih ada dalam bentuk KOL di jejaring sosial. Untuk membuat agen lebih mirip manusia, diperlukan integrasi kemampuan perencanaan dan tindakan, di mana sub-item dalam perencanaan, yaitu rantai pemikiran, sangat penting.
Tiga, Rantai Pemikiran (Chain of Thought, CoT)
Konsep rantai pemikiran (Chain of Thought, CoT) pertama kali muncul dalam makalah yang diterbitkan oleh Google pada tahun 2022 (Chain-of-Thought Prompting Elicits Reasoning in Large Language Models), makalah tersebut menunjukkan bahwa kemampuan penalaran model dapat ditingkatkan dengan menghasilkan serangkaian langkah penalaran antara, yang membantu model memahami dan memecahkan masalah yang kompleks dengan lebih baik.
Sebuah Prompt CoT yang khas terdiri dari tiga bagian: instruksi yang jelas, deskripsi tugas, logika yang mendasari teori atau prinsip yang mendukung penyelesaian tugas, serta contoh solusi yang spesifik. Menampilkan struktur ini membantu model memahami persyaratan tugas, mendekati jawaban secara bertahap melalui penalaran logis, sehingga meningkatkan efisiensi dan akurasi dalam menyelesaikan masalah. CoT sangat cocok untuk tugas yang memerlukan analisis mendalam dan penalaran multi-langkah, seperti penyelesaian masalah matematika, penulisan laporan proyek, dll. Pada tugas sederhana, CoT mungkin tidak memberikan keuntungan yang jelas, tetapi pada tugas kompleks, ia dapat secara signifikan meningkatkan kinerja model dengan mengurangi tingkat kesalahan melalui strategi penyelesaian langkah demi langkah dan meningkatkan kualitas penyelesaian tugas.
Dalam membangun AI Agent, CoT memainkan peran kunci, AI Agent perlu memahami informasi yang diterima dan membuat keputusan yang rasional berdasarkan informasi tersebut. CoT dengan menyediakan cara berpikir yang teratur, membantu Agen dalam menangani dan menganalisis informasi yang masuk, mengubah hasil analisis menjadi panduan tindakan yang konkret. Metode ini tidak hanya meningkatkan keandalan dan efisiensi keputusan Agen, tetapi juga meningkatkan transparansi proses keputusan, sehingga perilaku Agen menjadi lebih dapat diprediksi dan ditelusuri. CoT dengan membagi tugas menjadi beberapa langkah kecil membantu Agen mempertimbangkan setiap titik keputusan dengan lebih detail dan mengurangi keputusan yang salah yang disebabkan oleh kelebihan informasi. CoT membuat proses pengambilan keputusan Agen menjadi lebih transparan, sehingga pengguna lebih mudah memahami dasar keputusan Agen. Dalam interaksi dengan lingkungan, CoT memungkinkan Agen terus belajar informasi baru dan menyesuaikan strategi perilaku.
CoT sebagai strategi yang efektif tidak hanya meningkatkan kemampuan penalaran model bahasa besar, tetapi juga memainkan peran penting dalam membangun AI Agent yang lebih cerdas dan dapat diandalkan. Dengan memanfaatkan CoT, peneliti dan pengembang dapat menciptakan sistem cerdas yang lebih adaptif terhadap lingkungan yang kompleks dan memiliki otonomi tinggi. CoT menunjukkan keunggulannya yang unik dalam aplikasi praktis, terutama dalam menangani tugas kompleks dengan membagi tugas menjadi serangkaian langkah kecil, yang tidak hanya meningkatkan akurasi penyelesaian tugas, tetapi juga meningkatkan keterjelasan dan kontrol model. Metode penyelesaian masalah secara bertahap ini dapat secara signifikan mengurangi keputusan yang salah yang diakibatkan oleh terlalu banyak atau terlalu rumit informasi ketika menghadapi tugas yang kompleks. Pada saat yang sama, metode ini juga meningkatkan keterlacakan dan verifikasi dari keseluruhan solusi.
Fungsi inti CoT adalah menggabungkan perencanaan, tindakan, dan observasi, menjembatani kesenjangan antara penalaran dan tindakan. Pola pikir ini memungkinkan AI Agent untuk merumuskan strategi yang efektif saat memprediksi kemungkinan situasi abnormal, serta mengumpulkan informasi baru selama interaksi dengan lingkungan eksternal, memverifikasi prediksi yang telah ditetapkan sebelumnya, dan menyediakan dasar penalaran baru. CoT seperti mesin presisi dan stabilitas yang kuat, membantu AI Agent menjaga efisiensi kerja yang tinggi di lingkungan yang kompleks.
Empat, Permintaan Palsu yang Tepat
Aspek mana dari tumpukan teknologi AI yang harus digabungkan dengan Crypto? Dalam artikel tahun lalu, saya percaya bahwa desentralisasi kekuatan komputasi dan data adalah langkah kunci untuk membantu perusahaan kecil dan pengembang individu menghemat biaya, dan tahun ini dalam sektor Crypto x AI yang dirangkum oleh Coinbase, kami melihat pembagian yang lebih terperinci:
(1) Lapisan komputasi (merujuk pada jaringan yang fokus menyediakan sumber daya unit pemrosesan grafis (GPU) untuk pengembang AI);
(2) Lapisan data (merujuk pada jaringan yang mendukung akses terdesentralisasi, pengaturan, dan verifikasi saluran data AI);
(3) Lapisan middleware (merujuk pada platform atau jaringan yang mendukung pengembangan, penerapan, dan hosting model AI atau agen);
(4) Lapisan aplikasi (merujuk pada produk berbasis AI yang menghadapi pengguna, baik B2B maupun B2C).
Dalam empat lapisan ini, setiap lapisan memiliki visi besar, yang tujuannya secara ringkas adalah untuk melawan dominasi raksasa Silicon Valley di era internet berikutnya. Seperti yang saya katakan tahun lalu, apakah kita benar-benar harus menerima bahwa raksasa Silicon Valley mengontrol secara eksklusif kekuatan komputasi dan data? Dalam model besar yang tertutup di bawah monopoli mereka, di dalamnya adalah kotak hitam. Sains sebagai agama yang paling diyakini oleh umat manusia saat ini, setiap kata yang dijawab oleh model besar di masa depan akan dianggap sebagai kebenaran oleh sebagian besar orang, tetapi bagaimana kita memverifikasi kebenaran ini? Sesuai dengan visi raksasa Silicon Valley, hak akses yang dimiliki oleh agen pada akhirnya akan melampaui imajinasi, seperti hak untuk melakukan pembayaran dari dompet Anda, hak untuk menggunakan terminal, bagaimana kita bisa memastikan bahwa manusia tidak memiliki niat jahat?
Desentralisasi adalah satu-satunya jawaban, tetapi kadang-kadang apakah kita perlu dengan bijaksana mempertimbangkan, berapa banyak pembeli visi besar ini? Dulu kita bisa tidak mempertimbangkan siklus bisnis, dengan menggunakan Token untuk mengatasi kesalahan yang dihasilkan dari idealisasi. Namun situasinya kini sangat serius, Crypto x AI perlu menggabungkan kondisi nyata dalam merancang, seperti bagaimana menyeimbangkan dua sisi di lapisan komputasi dalam kondisi kehilangan kinerja dan ketidakstabilan? Untuk mencapai daya saing pusat dari cloud terdesentralisasi. Proyek di lapisan data berapa banyak pengguna nyata yang akan ada, bagaimana memverifikasi keaslian dan validitas data yang disediakan, dan jenis pelanggan apa yang membutuhkan data ini? Dua lapisan lainnya sama, di era ini kita tidak memerlukan terlalu banyak permintaan palsu yang tampaknya benar.
Lima, Meme Meluncur ke SocialFi
Seperti yang saya sebutkan di paragraf pertama, Meme telah keluar dengan cara super cepat, melahirkan bentuk SocialFi yang sesuai dengan Web3. Friend.tech adalah Dapp yang memulai gelombang aplikasi sosial ini, tetapi sayangnya gagal karena desain Token yang terburu-buru. Pump.fun telah memvalidasi kelayakan platform yang murni, tidak menggunakan Token, tidak membuat aturan apapun. Permintaan dan penawaran perhatian bersatu, Anda dapat mengirimkan meme, melakukan siaran langsung, mengeluarkan koin, meninggalkan pesan, bertransaksi, semuanya bebas, Pump.fun hanya mengenakan biaya layanan. Ini pada dasarnya sesuai dengan model ekonomi perhatian media sosial saat ini seperti YouTube, Ins, hanya saja objek pembayarannya berbeda, dalam hal permainan, Pump.fun lebih ke arah Web3.
Clanker dari Base adalah pengumpul yang hebat, karena ekosistem yang terintegrasi dan dikelola dengan baik, Base memiliki Dapp sosialnya sendiri sebagai pendukung, membentuk siklus internal yang lengkap. Meme Agent adalah bentuk 2.0 dari Meme Coin, manusia selalu mencari yang baru, dan saat ini Pump.fun berada di puncak tren, dari sudut pandang tren, pemikiran liar dari biologi silikon menggantikan meme kasar dari biologi karbon hanya masalah waktu.
Saya telah menyebutkan Base berkali-kali, hanya saja isi yang disebutkan berbeda setiap kali. Dari sudut pandang waktu, Base tidak pernah menjadi pelopor, tetapi selalu menjadi pemenang.
Enam, Apa Lagi yang Dapat Dilakukan Agen?
Dari perspektif praktis, agen tidak mungkin terdesentralisasi dalam waktu yang sangat lama di masa depan. Dari sudut pandang pembangunan agen di bidang AI tradisional, ini bukanlah masalah sederhana yang dapat diselesaikan hanya dengan desentralisasi dan open-source. Ini memerlukan akses ke berbagai API untuk mengakses konten Web2, dan biaya operasionalnya sangat mahal. Desain rantai pemikiran dan kolaborasi multi-agen biasanya masih bergantung pada satu manusia sebagai perantara. Kita akan mengalami periode transisi yang panjang, sampai muncul bentuk integrasi yang tepat, mungkin seperti UNI. Namun, seperti yang saya sebutkan dalam artikel sebelumnya, saya tetap percaya bahwa agen akan memberikan dampak besar pada industri kita, seperti keberadaan Cex dalam industri kita, tidak benar tetapi sangat penting.
Artikel yang diterbitkan oleh Stanford & Microsoft bulan lalu (Tinjauan AI Agent) banyak menggambarkan aplikasi agen dalam industri kesehatan, mesin pintar, dan dunia virtual, dan dalam lampiran artikel ini sudah ada banyak contoh eksperimen di mana GPT-4V berperan sebagai agen dalam pengembangan permainan 3A teratas.
Tidak perlu terlalu memaksakan kecepatan penggabungan dengan desentralisasi, saya lebih berharap potongan puzzle yang pertama kali dilengkapi oleh agen adalah kemampuan dan kecepatan dari bawah ke atas. Kita memiliki begitu banyak reruntuhan narasi dan kekosongan metaverse yang perlu diisi, pada tahap yang tepat kita akan mempertimbangkan bagaimana menjadikannya sebagai UNI berikutnya.
Referensi
Rantai pemikiran yang 'muncul' dari model besar, sebenarnya kemampuan apa ini? Penulis: Brain Extreme Body
Satu Artikel Memahami Agen, Stasiun Berikutnya dari Model Besar Penulis: LinguaMind