Jika AIGC telah membuka era pembuatan konten cerdas, maka Agen AI mempunyai peluang untuk benar-benar memproduksi kemampuan AIGC.

Agen AI seperti karyawan serba bisa yang lebih konkret, yang disebut sebagai bentuk utama robot kecerdasan buatan. Ia dapat mengamati lingkungan sekitar, mengambil keputusan, dan mengambil tindakan secara otomatis seperti manusia.

Bill Gates pernah berkata terus terang, "Mengendalikan Agen AI adalah pencapaian yang nyata. Pada saat itu, Anda tidak perlu lagi mencari informasi secara online sendiri." Pakar resmi di bidang AI juga menaruh harapan besar terhadap prospek AI Agen. CEO Microsoft Satya Nadella pernah meramalkan bahwa AI Agent akan menjadi metode utama interaksi manusia-komputer, mampu memahami kebutuhan pengguna dan secara proaktif memberikan layanan. Profesor Ng Enda juga memperkirakan bahwa di lingkungan kerja masa depan, manusia dan Agen AI akan berkolaborasi lebih erat untuk membentuk model kerja yang efisien dan meningkatkan efisiensi.

Agen AI bukan hanya produk teknologi, namun juga inti dari cara hidup dan bekerja di masa depan.

Hal ini mengingatkan kita bahwa ketika Web3 dan blockchain pertama kali menimbulkan diskusi luas, orang sering menggunakan kata “disrupsi” untuk menggambarkan potensi teknologi ini. Melihat kembali beberapa tahun terakhir, Web3 secara bertahap berkembang dari ERC-20 awal dan bukti tanpa pengetahuan menjadi DeFi, DePIN, GameFi, dll. yang terintegrasi dengan bidang lain.

Jika kita menggabungkan Web3 dan AI, dua teknologi digital populer, apakah akan ada efek 1+ 1>2? Dapatkah proyek AI Web3, dengan skala pembiayaannya yang semakin besar, membawa paradigma kasus penggunaan baru ke dalam industri dan menciptakan kebutuhan nyata yang baru?

Agen AI: Asisten cerdas paling ideal bagi umat manusia

Dimana imajinasi Agen AI? Ada jawaban dengan skor tinggi yang beredar luas di Internet, "Model bahasa besar hanya dapat memprogram ular rakus, tetapi Agen AI dapat memprogram seluruh Raja Kemuliaan."

Agen biasanya diterjemahkan sebagai "tubuh cerdas" di Cina. Konsep ini dikemukakan oleh Minsky, “bapak kecerdasan buatan”, dalam bukunya “The Society of Thinking” yang diterbitkan pada tahun 1986. Minsky percaya bahwa individu-individu tertentu dalam masyarakat dapat menemukan solusi untuk suatu masalah tertentu setelah negosiasi adalah Agen. Agen telah menjadi landasan interaksi manusia-komputer selama bertahun-tahun, mulai dari asisten pengeditan Microsoft Clippy hingga saran otomatis Google Dokumen. Bentuk awal Agen ini telah menunjukkan potensi interaksi yang dipersonalisasi, namun kemampuan mereka untuk menangani tugas yang lebih kompleks masih terbatas . Baru setelah munculnya model bahasa besar (LLM) potensi Agen yang sebenarnya dapat dimanfaatkan.

Pada bulan Mei tahun ini, Profesor Andrew Ng, seorang sarjana terkemuka di bidang AI, menyampaikan pidato tentang Agen AI di acara Sequoia AI di Amerika Serikat. Di dalamnya, ia menunjukkan serangkaian eksperimen yang dilakukan oleh timnya:

Biarkan AI menulis beberapa kode dan menjalankannya, dan membandingkan hasil dari LLM dan alur kerja yang berbeda. Hasilnya adalah sebagai berikut:

  • Model GPT-3.5: akurasi 48%

  • Model GPT-4: akurasi 67%

  • GPT-3.5 + Agen: performa lebih tinggi dibandingkan model GPT-4

  • Agen GPT-4 +: jauh lebih tinggi dari model GPT-4, sangat bagus

Memang. Ketika kebanyakan orang menggunakan LLM seperti ChatGPT, mereka biasanya memasukkan kata prompt dan model besar akan segera menghasilkan jawaban tanpa secara otomatis mengidentifikasi dan memperbaiki kesalahan, menghapus dan menulis ulang.

Sebagai perbandingan, alur kerja Agen AI terlihat seperti ini:

Pertama, biarkan LLM menulis garis besar artikel. Jika perlu, cari dulu konten di Internet untuk penelitian dan analisis, keluarkan draf pertama, lalu baca draf tersebut dan pikirkan cara mengoptimalkannya akhirnya menghasilkan artikel yang secara logis teliti dan komprehensif. Artikel berkualitas tinggi dengan tingkat kesalahan terendah.

Perbedaan antara AI Agent dan LLM dapat kita temukan adalah interaksi antara LLM dan manusia didasarkan pada kata-kata cepat (prompt). Agen AI hanya perlu menetapkan tujuan, dan dapat berpikir secara mandiri serta bertindak berdasarkan tujuan tersebut. Uraikan setiap langkah rencana secara rinci berdasarkan tugas yang diberikan, dan andalkan umpan balik dari dunia luar dan pemikiran independen untuk menciptakan dorongan bagi diri Anda sendiri untuk mencapai tujuan Anda.

Oleh karena itu, definisi Agen AI OpenAI adalah: sistem yang digerakkan oleh LLM sebagai otaknya, dengan kemampuan untuk memahami persepsi, perencanaan, memori, dan penggunaan alat secara mandiri, serta dapat secara otomatis menjalankan tugas-tugas kompleks.

Ketika AI berubah dari alat yang digunakan menjadi subjek yang dapat menggunakan alat tersebut, ia menjadi Agen AI. Inilah sebabnya Agen AI bisa menjadi asisten cerdas paling ideal bagi umat manusia. Misalnya, Agen AI dapat memahami dan mengingat minat, preferensi, dan kebiasaan sehari-hari pengguna berdasarkan riwayat interaksi online pengguna, mengidentifikasi niat pengguna, secara proaktif memberikan saran, dan mengoordinasikan beberapa aplikasi untuk menyelesaikan tugas.

Seperti visi Gates, di masa depan kita tidak perlu lagi beralih ke aplikasi yang berbeda untuk tugas yang berbeda. Kita hanya perlu menggunakan bahasa biasa untuk memberi tahu komputer dan ponsel apa yang ingin kita lakukan berdasarkan data yang diinginkan pengguna untuk dibagikan, Agen AI akan memberikan respons yang dipersonalisasi.

Unicorn satu orang menjadi kenyataan

Agen AI juga dapat membantu perusahaan menciptakan model operasi cerdas baru dengan "kolaborasi manusia-mesin" sebagai intinya. Aktivitas bisnis akan semakin banyak diselesaikan oleh AI, sementara manusia hanya perlu fokus pada visi perusahaan, strategi, dan keputusan jalur kritis.

Sama seperti CEO OpenAI Sam Altman yang pernah menyebutkan poin menarik dalam sebuah wawancara, dengan berkembangnya AI, kita akan memasuki era "unicorn satu orang", yaitu perusahaan yang didirikan oleh satu orang dan mencapai 1 miliar. Perusahaan ini dinilai dalam dolar AS.

Kedengarannya seperti fantasi, namun dengan bantuan Agen AI, ide ini menjadi kenyataan.

Katakanlah kita ingin memulai sebuah startup teknologi. Dalam pendekatan tradisional, tentu saja saya perlu mempekerjakan insinyur perangkat lunak, manajer produk, perancang, pemasar, staf penjualan dan keuangan, yang semuanya mengerjakan urusan mereka sendiri namun dikoordinasikan oleh saya.

Lalu bagaimana jika menggunakan AI Agent, saya mungkin tidak perlu mempekerjakan karyawan.

  • Devin - Pemrograman otomasi

Daripada menjadi insinyur perangkat lunak, saya mungkin menggunakan Devin, seorang insinyur perangkat lunak AI yang meledak tahun ini, yang dapat membantu saya menyelesaikan semua pekerjaan front-end dan back-end.

Devin dikembangkan oleh Cognition Labs dan disebut sebagai “insinyur perangkat lunak AI pertama di dunia.” Ia dapat menyelesaikan seluruh pekerjaan pengembangan perangkat lunak secara mandiri, menganalisis masalah, membuat keputusan, menulis kode, dan memperbaiki kesalahan secara mandiri, yang semuanya dapat dijalankan secara mandiri. Hal ini sangat mengurangi beban kerja pengembang. Devin menerima pembiayaan sebesar $196 juta hanya dalam waktu enam bulan, dan valuasinya dengan cepat melonjak hingga miliaran dolar. Investornya termasuk perusahaan modal ventura terkenal seperti Founders Fund dan Khosla Ventures.

Meskipun Devin masih belum meluncurkan versi publiknya, kita dapat melihat sekilas potensi dari Cursor, produk Web2 lain yang baru-baru ini populer. Ia melakukan hampir semua pekerjaan untuk Anda, mengubah ide sederhana menjadi kode fungsional dalam hitungan menit. Anda hanya perlu memberikan perintah dan "duduk dan nikmati hasilnya". Ada laporan bahwa seorang anak berusia delapan tahun, tanpa pengalaman pemrograman apa pun, benar-benar menggunakan Cursor untuk menyelesaikan pekerjaan coding dan membangun situs web.

  • Hebbia — pemrosesan file

Daripada menjadi manajer produk atau orang keuangan, saya mungkin akan memilih Hebbia, yang melakukan semua penyortiran dan analisis dokumen untuk saya.

Berbeda dengan Glean, yang berfokus pada pencarian dokumen dalam perusahaan, Hebbia Matrix adalah platform Agen AI tingkat perusahaan yang menggunakan beberapa model AI untuk membantu pengguna mengekstrak, menyusun, dan menganalisis data dan dokumen secara efisien, sehingga mendorong peningkatan produktivitas perusahaan. . Sungguh mengesankan betapa jutaan dokumen yang dapat ditangani Matrix sekaligus.

Hebbia menyelesaikan putaran Seri B senilai $130 juta pada bulan Juli tahun ini, dipimpin oleh a16z, dengan partisipasi dari investor terkenal seperti Google Ventures dan Peter Thiel.

  • Jasper AI — pembuatan konten

Daripada menggunakan operasi dan desainer media sosial, saya mungkin memilih Jasper AI, yang dapat membantu saya menghasilkan konten.

Jasper AI adalah asisten penulisan Agen AI yang dirancang untuk membantu pembuat konten, pemasar, dan bisnis menyederhanakan proses pembuatan konten dan meningkatkan produktivitas dan efisiensi kreatif. Jasper AI dapat menghasilkan berbagai jenis konten berdasarkan gaya yang diminta pengguna, termasuk postingan blog, postingan media sosial, teks iklan, deskripsi produk, dan banyak lagi. Dan menghasilkan gambar berdasarkan deskripsi pengguna untuk memberikan bantuan visual untuk konten teks.

Jasper AI telah mengumpulkan pendanaan $125 juta dan mencapai penilaian $1,5 miliar pada tahun 2022. Menurut statistik, Jasper AI telah membantu pengguna menghasilkan lebih dari 500 juta kata, menjadikannya salah satu alat penulisan AI yang paling banyak digunakan.

  • MultiOn — Otomatisasi halaman web

Daripada menjadi asisten, saya mungkin memilih MultiOn untuk membantu saya mengelola tugas sehari-hari, mengatur jadwal, mengatur pengingat, dan bahkan merencanakan perjalanan bisnis, memesan hotel secara otomatis, dan secara otomatis mengatur layanan pemesanan kendaraan online.

MultiOn adalah agen AI tugas jaringan otomatis yang dapat membantu melakukan tugas secara mandiri di lingkungan digital apa pun, seperti membantu pengguna menyelesaikan tugas pribadi seperti belanja online dan membuat janji temu untuk meningkatkan efisiensi pribadi, atau membantu pengguna menyederhanakan tugas sehari-hari dan meningkatkan efisiensi kerja.

  • Kebingungan - pencarian, penelitian

Daripada menjadi peneliti, saya mungkin akan memilih Perplexity, yang digunakan oleh CEO NVIDIA setiap hari.

Perplexity adalah mesin pencari AI yang memahami pertanyaan pengguna, mengelompokkannya, lalu mencari dan mengumpulkan konten serta menghasilkan laporan untuk memberikan jawaban yang jelas kepada pengguna.

Kebingungan cocok untuk berbagai kelompok pengguna. Misalnya, pelajar dan peneliti dapat menyederhanakan proses pengambilan informasi saat menulis dan meningkatkan efisiensi dapat memperoleh data yang andal untuk mendukung strategi pemasaran.

Konten di atas hanyalah imajinasi. Kemampuan dan level sebenarnya dari Agen AI ini belum cukup untuk menggantikan talenta elit di semua lapisan masyarakat. Seperti yang dikatakan Li Bojie, salah satu pendiri Logenic AI, kemampuan LLM saat ini hanya level awal dan jauh dari level ahli. Agen AI saat ini lebih seperti karyawan yang bekerja lebih cepat tetapi kurang dapat diandalkan.

Namun, dengan spesialisasinya masing-masing, Agen AI ini membantu pengguna yang sudah ada meningkatkan efisiensi dan kenyamanan dalam beragam skenario.

Bukan hanya perusahaan teknologi, semua lapisan masyarakat bisa mendapatkan keuntungan dari gelombang Agen AI. Di bidang pendidikan, AI Agent dapat menyediakan sumber belajar dan bimbingan belajar yang dipersonalisasi berdasarkan kemajuan belajar, minat, dan kemampuan siswa di bidang keuangan, AI Agent dapat membantu pengguna mengelola keuangan pribadi, memberikan saran investasi, dan bahkan memprediksi tren saham ; di bidang medis, Agen AI dapat membantu dokter mendiagnosis penyakit dan merumuskan rencana perawatan di bidang e-commerce, Agen AI juga dapat berfungsi sebagai layanan pelanggan yang cerdas, secara otomatis menjawab pertanyaan pengguna, menangani masalah pesanan, dan permintaan pengembalian melalui bahasa alami; teknologi pemrosesan dan pembelajaran mesin.

Multi-Agen: Langkah selanjutnya untuk Agen AI

Pada bagian sebelumnya tentang skenario perusahaan unicorn satu orang, satu Agen AI menghadapi keterbatasan saat menangani tugas yang kompleks dan sulit untuk memenuhi kebutuhan sebenarnya. Saat menggunakan beberapa Agen AI, karena Agen AI ini didasarkan pada LLM yang heterogen, pengambilan keputusan kolektif menjadi sulit dan kemampuan mereka terbatas, sehingga manusia diharuskan bertindak sebagai penjadwal antara Agen AI independen ini untuk mengoordinasikan Agen AI yang melayani skenario aplikasi berbeda .Pergi bekerja. Hal ini memunculkan munculnya “Multi Agent (kerangka kerja multi-agen)”.

Masalah yang kompleks sering kali memerlukan integrasi berbagai aspek pengetahuan dan keterampilan, dan satu Agen AI memiliki kemampuan terbatas dan sulit untuk ditangani. Dengan menggabungkan Agen AI dengan kemampuan berbeda secara organik, sistem Multi-Agen memungkinkan Agen AI memanfaatkan kekuatan mereka masing-masing dan belajar dari kekuatan satu sama lain untuk memecahkan masalah kompleks dengan lebih efektif.

Ini sangat mirip dengan proses kerja atau struktur organisasi kita yang sebenarnya: seorang pemimpin memberikan tugas, dan orang-orang dengan kemampuan berbeda bertanggung jawab atas tugas yang berbeda. Hasil dari setiap proses diberikan ke proses selanjutnya, dan akhirnya diperoleh hasil tugas akhir. .

Dalam proses implementasinya, Agen AI tingkat rendah menjalankan tugasnya masing-masing, sedangkan Agen AI tingkat tinggi memberikan tugas dan mengawasi penyelesaiannya.

Multi-Agen juga dapat menyimulasikan proses pengambilan keputusan oleh manusia. Sama seperti ketika kita menghadapi masalah, kita akan meminta saran dari orang lain. Beberapa Agen AI juga dapat menyimulasikan perilaku pengambilan keputusan kolektif dan memberi kita dukungan informasi yang lebih baik. Misalnya, AutoGen yang dikembangkan oleh Microsoft memenuhi persyaratan ini:

  • Kemampuan untuk membuat Agen AI dengan peran berbeda. Agen AI ini memiliki kemampuan percakapan dasar dan dapat menghasilkan balasan berdasarkan pesan yang diterima.

  • Gunakan GroupChat untuk membuat lingkungan obrolan grup yang melibatkan beberapa Agen AI. Dalam GroupChat ini, Agen AI dengan peran administrator mengelola catatan obrolan, urutan pembicara, penghentian ucapan, dll. dari Agen AI lainnya.

Jika diterapkan pada ide perusahaan unicorn yang beranggotakan satu orang, kita dapat membuat beberapa Agen AI dengan peran berbeda melalui arsitektur Multi-Agen, seperti manajer proyek, pemrogram, atau supervisor. Beri tahu mereka tujuan kita dan biarkan mereka memikirkan cara melakukannya. Kita hanya perlu mendengarkan laporannya. Jika kita merasa keberatan atau jika mereka melakukan kesalahan, biarkan mereka mengubahnya sampai kita puas.

Dibandingkan dengan Agen AI tunggal, Multi-Agen dapat mencapai:

  • Skalabilitas: Menangani masalah berskala lebih besar dengan meningkatkan jumlah Agen AI, yang masing-masing menangani sebagian tugas, memungkinkan sistem untuk berkembang seiring meningkatnya permintaan.

  • Paralelisme: Secara alami mendukung pemrosesan paralel, beberapa Agen AI dapat mengerjakan bagian masalah yang berbeda secara bersamaan, sehingga mempercepat penyelesaian masalah.

  • Peningkatan keputusan: Tingkatkan pengambilan keputusan dengan menggabungkan wawasan dari beberapa Agen AI, masing-masing dengan perspektif dan keahliannya sendiri.

Seiring dengan kemajuan teknologi AI, kerangka kerja Multi-Agen dapat memainkan peran yang lebih besar di lebih banyak industri dan mendorong pengembangan berbagai solusi baru berbasis AI.

Angin Agen AI bertiup menuju Web3

Keluar dari laboratorium, perjalanan Agen AI dan Multi-Agen masih panjang.

Terlepas dari Multi-Agen, bahkan Agen AI tercanggih sekalipun saat ini memiliki batas atas yang jelas pada sumber daya komputasi dan daya komputasi yang dibutuhkannya pada tingkat fisik, dan tidak dapat diperluas tanpa batas. Ketika dihadapkan dengan tugas-tugas yang sangat kompleks dan intensif komputasi, Agen AI pasti akan menghadapi hambatan daya komputasi dan kinerjanya akan sangat berkurang.

Selain itu, sistem Agen AI dan Multi-Agen pada dasarnya adalah model arsitektur terpusat, yang menentukan bahwa sistem tersebut memiliki risiko kegagalan tunggal yang sangat tinggi. Lebih penting lagi, model bisnis monopoli OpenAI, Microsoft, Google, dan perusahaan lain yang berbasis pada model besar bersumber tertutup secara serius mengancam kelangsungan hidup startup Agen AI yang independen dan tunggal, sehingga mustahil bagi Agen AI untuk berhasil memanfaatkan data pribadi perusahaan yang sangat besar untuk membuat mereka menjadi lebih pintar dan lebih efisien. Terdapat kebutuhan mendesak akan lingkungan kolaborasi demokratis antara Agen AI, sehingga Agen AI yang benar-benar berharga dapat melayani lebih banyak orang yang mempunyai kebutuhan dan menciptakan nilai yang lebih besar bagi masyarakat.

Terakhir, meskipun Agen AI lebih dekat dengan industri daripada LLM, pengembangannya didasarkan pada LLM. Namun, jalur model besar saat ini ditandai dengan ambang batas teknis yang tinggi, investasi modal yang besar, dan model bisnis yang belum matang . Pembiayaan untuk terus memperbarui dan mengulangi.

Paradigma Multi-Agen adalah sudut pandang yang sangat baik bagi Web3 untuk membantu AI. Banyak tim pengembangan Web3 telah berinvestasi dalam penelitian dan pengembangan untuk memberikan solusi di bidang ini.

Sistem Agen AI dan Multi-Agen sering kali memerlukan sumber daya komputasi dalam jumlah besar untuk melakukan tugas pengambilan keputusan dan pemrosesan yang kompleks. Web3 dapat membangun pasar daya komputasi yang terdesentralisasi melalui blockchain dan teknologi terdesentralisasi, sehingga sumber daya daya komputasi dapat didistribusikan dan dimanfaatkan secara lebih adil dan efisien dalam skala global. Proyek Web3 seperti Akash, Nosana, Aethir, dan IO.net dapat memberikan kekuatan komputasi untuk pengambilan keputusan dan penalaran Agen AI.

Sistem AI tradisional sering kali dikelola secara terpusat, menyebabkan Agen AI menghadapi satu titik kegagalan dan masalah privasi data. Sifat Web3 yang terdesentralisasi dapat membuat sistem Multi-Agen lebih terdesentralisasi dan otonom Di server, persyaratan yang diajukan oleh pengguna dijalankan secara mandiri, sehingga meningkatkan ketahanan dan keamanan. Menetapkan mekanisme insentif dan hukuman bagi pemberi ikrar dan delegator melalui PoS, DPoS, dan mekanisme lainnya dapat mendorong demokratisasi sistem Agen AI tunggal atau Multi-Agen.

Dalam hal ini, GaiaNet, Theoriq, PIN AI, dan HajimeAI semuanya memiliki upaya yang sangat mutakhir.

  • Theoriq adalah proyek yang melayani "AI untuk Web3". Ia berharap dapat membangun sistem panggilan dan ekonomi untuk Agen AI melalui Agentic Protocol, mempopulerkan pengembangan Web3 dan banyak skenario fungsional, dan menyediakan kemampuan penalaran model yang dapat diverifikasi untuk dApps Web3.

  • GaiaNet adalah lingkungan pembuatan dan penerapan Agen AI berbasis node, dengan titik awal melindungi kekayaan intelektual dan privasi data para ahli dan pengguna, untuk bersaing dengan OpenAI GPT Store yang terpusat.

  • HajimeAI memanfaatkan keduanya untuk membangun alur kerja Agen AI berdasarkan kebutuhan aktual dan untuk melakukan kecerdasan serta mengotomatiskan maksud itu sendiri, yang mencerminkan "personalisasi kecerdasan AI" yang disebutkan oleh PIN AI.

  • Pada saat yang sama, Modulus Labs dan ORA Protocol telah membuat kemajuan dalam arah algoritma zkML dan opML dari AI Agent.

Terakhir, pengembangan dan iterasi sistem Agen AI dan Multi-Agen seringkali memerlukan dukungan keuangan dalam jumlah besar, dan Web3 dapat membantu proyek Agen AI potensial mendapatkan dukungan awal yang berharga melalui fitur likuiditas yang dimuat di awal.

Spectral dan HajimeAI telah mengusulkan konsep produk yang mendukung penerbitan aset Agen AI pada rantai: melalui penerbitan token IAO (Initial Agent Offering), Agen AI dapat langsung memperoleh dana dari investor, dan pada saat yang sama menjadi anggota DAO tata kelola, memberikan peluang kepada investor untuk berpartisipasi dalam pengembangan proyek dan berbagi keuntungan di masa depan. Diantaranya, Benchmark DAO HajimeAI berharap untuk secara organik menggabungkan penilaian Agen AI yang terdesentralisasi dan penerbitan aset Agen AI melalui crowdfunding dan insentif token untuk menciptakan lingkaran tertutup Agen AI yang mengandalkan pembiayaan Web3 dan cold start, yang juga merupakan upaya yang relatif baru.

Kotak AI Pandora telah dibuka, dan semua orang di dalamnya bersemangat sekaligus bingung. Tidak ada yang tahu apakah kegilaan itu merupakan peluang atau bahaya tersembunyi. Saat ini, semua lapisan masyarakat tidak lagi berada di era pembiayaan PPT. Betapapun canggihnya teknologi, nilai hanya dapat terwujud jika diterapkan. Masa depan Agen AI ditakdirkan untuk menjadi maraton yang panjang, dan Web3 memastikan bahwa masa depan Agen AI tidak akan hilang dalam perlombaan ini.