Penulis asli: Peneliti YBB Capital Zeke

Satu, dimulai dari ketidakpuasan perhatian yang berlebihan

Dalam setahun terakhir, karena narasi di lapisan aplikasi tidak ada, tidak dapat menyamai kecepatan ledakan infrastruktur, ruang crypto secara bertahap menjadi permainan perebutan sumber daya perhatian. Dari Silly Dragon hingga Goat, dari Pump.fun hingga Clanker, ketidakpuasan perhatian menyebabkan persaingan ini menjadi semakin ketat. Dimulai dengan metode yang paling klise untuk menarik perhatian, cepat beralih ke model platform yang menyatukan permintaan dan penyedia perhatian, dan akhirnya, biologi berbasis silikon menjadi penyedia konten baru. Di antara berbagai bentuk Meme Coin, akhirnya muncul sesuatu yang dapat mencapai konsensus antara ritel dan VC: AI Agent.

Perhatian pada akhirnya adalah permainan zero-sum, tetapi spekulasi memang dapat mendorong pertumbuhan liar. Dalam artikel tentang UNI, kami telah mereview awal era keemasan blockchain, yang berasal dari pertumbuhan pesat DeFi yang dipicu oleh Compound Finance yang memulai era pertambangan LP. Masuk dan keluar dari berbagai kolam dengan APY yang mencapai ribuan bahkan puluhan ribu adalah cara paling primitif dari permainan di blockchain pada saat itu, meskipun hasil akhirnya adalah kolam-kolam tersebut runtuh menjadi kekacauan. Namun, masuknya yang gila dari para penambang emas benar-benar memberi blockchain likuiditas yang belum pernah terjadi sebelumnya, dan DeFi akhirnya melampaui spekulasi murni untuk membentuk jalur yang matang, memenuhi kebutuhan finansial pengguna dalam berbagai aspek seperti pembayaran, perdagangan, arbitrase, dan staking. Sementara itu, AI Agent juga sedang menjalani fase liar ini, kami sedang menjelajahi bagaimana Crypto dapat lebih baik menggabungkan AI dan akhirnya mendorong lapisan aplikasi ke tingkat baru.

Bagaimana agen dapat bersifat otonom

Dalam artikel sebelumnya, kami telah memperkenalkan secara singkat tentang asal mula AI Meme: Truth Terminal, serta prospek masa depan AI Agent. Artikel ini fokus pertama-tama pada AI Agent itu sendiri.

Kita mulai dengan mendefinisikan AI Agent, istilah 'Agent' dalam bidang AI adalah istilah yang agak kuno tetapi tidak jelas, yang terutama menekankan pada Otonomi, yaitu, apapun yang dapat merasakan lingkungan dan membuat refleksi AI dapat disebut sebagai Agent. Dalam definisi saat ini, AI Agent lebih dekat dengan agen, yaitu menetapkan sistem yang meniru keputusan manusia untuk model besar, yang dianggap sebagai cara paling menjanjikan menuju AGI (Kecerdasan Buatan Umum) di dunia akademis.

Dalam versi awal GPT, kita jelas dapat merasakan bahwa model besar sangat mirip manusia, tetapi ketika menjawab banyak pertanyaan kompleks, model besar hanya dapat memberikan beberapa jawaban yang tampak benar. Alasan mendasar adalah bahwa model besar saat itu berdasarkan probabilitas, bukan kausalitas, dan kekurangan kemampuan manusia dalam menggunakan alat, ingatan, perencanaan, dll., yang dapat dilengkapi oleh AI Agent. Jadi, untuk merangkum dalam satu formula, AI Agent (agen) = LLM (model besar) + Perencanaan + Memori + Alat.

Model besar berbasis Prompt lebih mirip dengan manusia statis, ia hanya memiliki kehidupan ketika kita memasukkan data, sementara tujuan agen adalah untuk menjadi manusia yang lebih nyata. Saat ini, agen dalam ruang ini terutama berbasis model penyempurnaan dari Meta yang open source Llama 70 b atau 405 b (keduanya memiliki parameter yang berbeda), memiliki kemampuan memori dan menggunakan alat API, sementara dalam aspek lain mungkin memerlukan bantuan atau input manusia (termasuk kolaborasi interaksi dengan agen lain), sehingga kita melihat bahwa agen utama dalam ruang ini masih ada dalam bentuk KOL di jaringan sosial. Untuk membuat agen lebih mirip manusia, perlu mengintegrasikan kemampuan perencanaan dan tindakan, di mana rantai pemikiran dalam perencanaan sangat penting.

Rantai Pemikiran (Chain of Thought, CoT)

Konsep Rantai Pemikiran (Chain of Thought, CoT) pertama kali muncul dalam makalah yang diterbitkan oleh Google pada tahun 2022 (Chain-of-Thought Prompting Elicits Reasoning in Large Language Models), yang menunjukkan bahwa kemampuan penalaran model dapat ditingkatkan dengan menghasilkan serangkaian langkah penalaran antara, membantu model memahami dan menyelesaikan masalah kompleks dengan lebih baik.

Sebuah CoT Prompt yang khas terdiri dari tiga bagian: deskripsi tugas yang jelas, dasar logis yang mendukung penyelesaian tugas, dan contoh solusi konkret. Struktur terorganisir ini membantu model memahami persyaratan tugas, mendekati jawaban secara bertahap melalui penalaran logis, sehingga meningkatkan efisiensi dan akurasi penyelesaian masalah. CoT sangat cocok untuk tugas yang memerlukan analisis mendalam dan penalaran multi-langkah, seperti pemecahan masalah matematika, penyusunan laporan proyek, dan sebagainya. Untuk tugas sederhana, CoT mungkin tidak memberikan keuntungan yang jelas, tetapi untuk tugas kompleks, dapat secara signifikan meningkatkan kinerja model, mengurangi tingkat kesalahan melalui strategi pemecahan langkah demi langkah, dan meningkatkan kualitas penyelesaian tugas.

Dalam membangun AI Agent, CoT berperan kunci, AI Agent perlu memahami informasi yang diterima dan membuat keputusan yang rasional berdasarkan itu. CoT membantu Agent memproses dan menganalisis informasi masukan secara efektif dengan menyediakan cara berpikir yang teratur, mengubah hasil analisis menjadi panduan tindakan konkret. Metode ini tidak hanya meningkatkan keandalan dan efisiensi keputusan Agent, tetapi juga meningkatkan transparansi proses pengambilan keputusan, sehingga perilaku Agent menjadi lebih dapat diprediksi dan dilacak. CoT membantu Agent mempertimbangkan setiap titik keputusan dengan lebih teliti dengan membagi tugas menjadi beberapa langkah kecil, mengurangi kesalahan keputusan akibat kelebihan informasi. CoT membuat proses pengambilan keputusan Agent lebih transparan, sehingga pengguna lebih mudah memahami dasar keputusan Agent. Dalam interaksi dengan lingkungan, CoT memungkinkan Agent terus belajar informasi baru dan menyesuaikan strategi perilaku.

Sebagai strategi yang efektif, CoT tidak hanya meningkatkan kemampuan penalaran model bahasa besar, tetapi juga memainkan peran penting dalam membangun AI Agent yang lebih cerdas dan andal. Dengan memanfaatkan CoT, peneliti dan pengembang dapat menciptakan sistem cerdas yang lebih adaptif terhadap lingkungan yang kompleks dan memiliki otonomi tinggi. CoT menunjukkan keunggulan uniknya dalam aplikasi praktis, terutama dalam menangani tugas kompleks, dengan membagi tugas menjadi serangkaian langkah kecil yang tidak hanya meningkatkan akurasi penyelesaian tugas, tetapi juga meningkatkan keterjelasan dan kontrol model. Metode pemecahan masalah bertahap ini dapat secara signifikan mengurangi kesalahan keputusan yang diakibatkan oleh informasi yang berlebihan atau terlalu rumit saat menghadapi tugas kompleks. Pada saat yang sama, metode ini juga meningkatkan kemampuan pelacakan dan verifikasi seluruh solusi.

Fungsi inti CoT adalah menggabungkan rencana, tindakan, dan pengamatan, mengisi kesenjangan antara penalaran dan tindakan. Pola pikir ini memungkinkan AI Agent merumuskan strategi yang efektif saat memprediksi kemungkinan situasi abnormal yang mungkin dihadapi, serta mengumpulkan informasi baru dan memverifikasi prediksi yang telah ditetapkan sebelumnya saat berinteraksi dengan lingkungan eksternal, memberikan dasar penalaran baru. CoT seperti mesin dengan akurasi dan stabilitas yang kuat, membantu AI Agent menjaga efisiensi kerja yang tinggi dalam lingkungan yang kompleks.

Empat, permintaan palsu yang benar

Apa yang sebenarnya perlu digabungkan antara Crypto dan tumpukan teknologi AI? Dalam artikel tahun lalu, saya berpendapat bahwa desentralisasi daya komputasi dan data adalah langkah kunci untuk membantu usaha kecil dan pengembang individu menghemat biaya, dan tahun ini dalam kategori Crypto x AI yang disusun oleh Coinbase, kami melihat pembagian yang lebih rinci.

(1) Lapisan komputasi (merujuk pada jaringan yang fokus menyediakan sumber daya unit pemrosesan grafis (GPU) untuk pengembang AI);

(2) Lapisan data (merujuk pada jaringan yang mendukung akses, pengaturan, dan verifikasi data AI secara desentralisasi);

(3) Lapisan middleware (merujuk pada platform atau jaringan yang mendukung pengembangan, penyebaran, dan hosting model atau agen AI);

(4) Lapisan aplikasi (merujuk pada produk yang ditujukan untuk pengguna yang menggunakan mekanisme AI di blockchain, baik B2B maupun B2C).

Dalam empat lapisan pembagian ini, setiap lapisan memiliki visi besar, tujuan akhirnya adalah untuk melawan dominasi raksasa Silicon Valley di era internet selanjutnya. Seperti yang saya katakan tahun lalu, apakah kita benar-benar harus menerima bahwa raksasa Silicon Valley mengontrol secara eksklusif daya komputasi dan data? Dalam model besar yang tertutup di bawah monopoli mereka, itu adalah kotak hitam. Sains sebagai agama yang paling diyakini umat manusia saat ini, setiap kalimat yang dijawab oleh model besar di masa depan akan dianggap sebagai kebenaran oleh banyak orang, tetapi bagaimana kebenaran ini dapat diverifikasi? Menurut visi raksasa Silicon Valley, hak yang dimiliki agen pada akhirnya akan melampaui imajinasi, seperti memiliki hak pembayaran dari dompet Anda, hak untuk menggunakan terminal, bagaimana memastikan tidak ada niat buruk dari manusia?

Desentralisasi adalah satu-satunya jawaban, tetapi kadang-kadang kita perlu mempertimbangkan dengan bijak, berapa banyak pembeli visi besar ini? Di masa lalu, kita bisa mengabaikan siklus bisnis dengan menggunakan Token untuk mengatasi kesalahan yang disebabkan oleh idealisme. Namun, situasi saat ini sangat serius, Crypto x AI perlu merancang ulang berdasarkan kenyataan, seperti bagaimana menyeimbangkan pasokan di kedua sisi di lapisan daya komputasi yang kehilangan kinerja dan tidak stabil? Untuk mencapai daya saing yang cocok dengan cloud terpusat. Berapa banyak pengguna nyata yang akan dimiliki proyek di lapisan data, bagaimana memverifikasi keaslian data yang disediakan, dan jenis pelanggan apa yang membutuhkan data ini? Lapisan kedua lainnya sama, di era ini kita tidak membutuhkan begitu banyak permintaan palsu yang tampak benar.

Lima, Meme meluncur ke SocialFi

Seperti yang saya katakan di paragraf pertama, Meme telah dengan cara yang sangat cepat meluncur ke bentuk SocialFi yang sesuai dengan Web3. Friend.tech adalah Dapp yang memicu gelombang aplikasi sosial kali ini, tetapi sayangnya kalah karena desain Token yang terburu-buru. Pump.fun membuktikan kelayakan pemodelan murni platform, tanpa membuat Token, tanpa aturan. Penyedia dan peminta perhatian bersatu, Anda dapat mengirim meme, melakukan siaran langsung, mengeluarkan token, meninggalkan pesan, melakukan transaksi, semuanya bebas, Pump.fun hanya memungut biaya layanan. Ini sangat mirip dengan model ekonomi perhatian media sosial saat ini seperti YouTube, Ins, hanya saja objek biaya berbeda, sedangkan dalam cara bermain Pump.fun lebih mengarah ke Web3.

Base Clanker adalah pengumpul yang terintegrasi secara ekosistem, berkat ekosistem yang ditangani langsung, Base memiliki Dapp sosial sendiri sebagai pendukung, membentuk siklus internal yang lengkap. Agen Meme adalah bentuk 2.0 dari Meme Coin, manusia selalu mencari sesuatu yang baru, dan Pump.fun kini berada di puncak perhatian. Dari sudut pandang tren, imajinasi biologi berbasis silikon menggantikan meme rendah dari biologi berbasis karbon hanyalah masalah waktu.

Saya telah menyebutkan Base berkali-kali, hanya saja konten yang disebutkan berbeda setiap kali. Dari segi waktu, Base tidak pernah menjadi pelopor, tetapi selalu menjadi pemenang.

Enam, apa lagi yang bisa menjadi agen?

Dari sudut pandang pragmatis, agen tidak mungkin menjadi desentralisasi dalam waktu yang lama di masa depan. Berdasarkan cara tradisional dalam membangun agen di bidang AI, bukanlah masalah sederhana dari desentralisasi dan open source proses penalaran, ini membutuhkan akses ke berbagai API untuk mengakses konten Web2, biayanya sangat mahal, desain rantai pemikiran dan kolaborasi multi-agen biasanya masih bergantung pada seorang manusia sebagai perantara. Kita akan mengalami periode transisi yang panjang, sampai muncul bentuk integrasi yang tepat, mungkin seperti UNI. Namun, seperti di artikel sebelumnya, saya masih percaya bahwa agen akan memberikan dampak besar pada industri kita, seperti halnya keberadaan Cex dalam industri kita, tidak benar tetapi sangat penting.

Artikel yang diterbitkan oleh Stanford Microsoft bulan lalu (Tinjauan AI Agent) mendeskripsikan secara luas aplikasi agen dalam industri kesehatan, mesin pintar, dan dunia virtual. Dalam lampiran artikel ini, sudah ada banyak kasus eksperimen di mana GPT-4 V berpartisipasi dalam pengembangan game AAA teratas sebagai agen.

Tidak perlu terlalu memaksakan kecepatan penggabungan dengan desentralisasi, saya lebih berharap bahwa potongan teka-teki yang pertama kali dilengkapi oleh agen adalah kemampuan dan kecepatan dari bawah ke atas. Kita memiliki begitu banyak puing narasi dan metaverse kosong yang perlu diisi, pada fase yang tepat baru kita mempertimbangkan bagaimana menjadikannya UNI berikutnya.

Referensi

Rantai pemikiran ‘emergent’ dari model besar, sebenarnya adalah kemampuan apa? Penulis: Naojiti

Artikel tentang pemahaman AI Agent, langkah berikutnya dari model besar. Penulis: LinguaMind