Penulis: jolestar

Minggu lalu saya mencoba-coba AI Agent, dan dua hari lalu saya menghadiri acara ai16z di Beijing, ingin melihat apa yang sebenarnya dapat dilakukan AI Agent saat ini, dan memikirkan apa yang dapat dilakukannya di masa depan.

Kondisi AI Agent saat ini mengingatkan saya pada meme itu, mesin penjual otomatis yang menyembunyikan seseorang di dalamnya. Semua orang telah membayangkan AI Agent yang seharusnya sudah memiliki kesadaran sendiri, tetapi sebenarnya dalam AI Agent tersebut tersembunyi seorang pengembang. (Di sini semua orang dapat membayangkan gambarnya, saya mencoba meminta AI untuk menghasilkan gambar ini, tetapi AI tidak dapat memahami "menyembunyikan")

Cara dasar kerja kerangka AI Agent

Kerangka AI Agent saat ini berfungsi sebagai perekat yang menghubungkan klien (Twitter, Discord, Telegram, dll.) dan berbagai plugin (setiap blockchain, dll.), kemudian kerangka tersebut menyediakan pustaka dasar (penyimpanan memori, isolasi percakapan, generasi konteks, dll.), dan kemudian menghubungkan berbagai antarmuka platform AI.

Bagaimana kerangka AI Agent berhubungan dengan aplikasi dan skenario bisnis

Sejak AI menjadi populer tahun lalu, berbagai platform dan alat bermunculan, yang paling penting adalah menyelesaikan satu masalah, bagaimana AI menggabungkan dengan aplikasi. Beberapa platform AI mencoba menyediakan cara plugin, beberapa membangun model alur kerja, dan beberapa aplikasi tradisional menyematkan AI dalam aplikasi mereka. Tetapi kunci di sini adalah: 1. Di mana antarmuka interaksi aplikasi? 2. Bagaimana AI menggabungkan dengan logika bisnis yang ada.

Setiap platform AI menyediakan antarmuka interaksi aplikasi untuk pengguna dalam bentuk dialog seperti jendela obrolan, jelas bahwa semua orang percaya bahwa cara berinteraksi dengan aplikasi AI seharusnya bersifat "personifikasi". Kecerdasan AI Agent terletak pada kemampuannya untuk terhubung langsung dengan semua sistem IM terbuka serta sistem sosial, yang jelas lebih mudah diterima daripada membuat yang baru.

Bagaimana AI menggabungkan dengan logika bisnis yang ada. Solusi yang ditawarkan oleh AI Agent adalah membiarkan pengembang mengintegrasikan keputusan AI ke dalam skenario bisnis. Bahasa pemrograman memerlukan kepastian, kondisi if hanya bisa true atau false, tidak bisa menangani logika bisnis yang samar. Dengan AI, kita bisa mengubah logika yang kompleks menjadi kondisi yang tepat, lalu bisa dengan mulus terintegrasi ke dalam skenario bisnis.

Misalnya, fitur membalas pesan dalam grup, Bot IM tradisional memerlukan beberapa perintah pesan yang jelas untuk memicu, sementara dengan AI, kita dapat mengimplementasikan metode shouldReplyMessage, memberinya konteks, dan ia mengembalikan true atau false.

Peran AI dalam skenario logika bisnis terutama adalah:

1. Penemuan "niat": melalui penjelasan dalam kata kunci, membuat AI menemukan "niat" dalam pesan teks pengguna berdasarkan konteks, dan memetakan niat tersebut ke kode tertentu.

2. Membantu pengambilan keputusan: Menggunakan AI untuk mengubah kondisi kompleks yang samar menjadi benar/salah yang pasti atau jenis enumerasi, lalu menggabungkannya ke dalam logika bisnis.

Melihat ini, banyak orang mungkin kecewa dengan AI Agent, banyak yang berpikir bahwa AI Agent hanya perlu diajari agar bisa melakukan segalanya. Faktanya, karena batasan konteks model besar, tidak mungkin (setidaknya saat ini) untuk menciptakan AI yang serba bisa, yang dapat melakukan semua hal. Namun kabar baiknya adalah para programmer tidak perlu khawatir kehilangan pekerjaan, AI masih memerlukan banyak programmer di belakangnya, dan masih memerlukan orang untuk menyusun if else, tetapi perbedaan kuncinya adalah batasan bisnis yang dapat diproses oleh program sedang diperluas.

Dua jenis AI Agent

Dalam acara tersebut, saya bertanya kepada Shaw satu pertanyaan, pasar memiliki dua harapan untuk AI Agent, 1. AI Agent sendiri memainkan peran, memiliki ID dan merek sendiri, memberikan layanan kepada pengguna. 2. Pengguna memiliki AI Agent pribadi, setara dengan asisten pribadi, dapat membantu pengguna menangani beberapa bisnis. Dari kedua jenis AI Agent tersebut, mana yang akan lebih populer? Dia merasa kedua arah akan baik, dan mungkin juga bisa digabungkan.

Saat ini, di pasar, orang-orang masih banyak mengeksplorasi arah pertama. Arah ini mirip dengan layanan yang di-AI Agent-kan, di masa depan mungkin tidak akan ada antarmuka aplikasi, semua aplikasi telah menjadi AI Agent dan dipersonifikasikan. Sedangkan arah kedua adalah peng-AI Agent-an klien aplikasi, di masa depan klien aplikasi akan menjadi plugin untuk asisten Agent, data lokal aplikasi menjadi bagian dari memori Agent, sementara plugin ini juga bertanggung jawab untuk berkomunikasi dengan layanan Agent di cloud. Dan ini adalah pola arsitektur aplikasi baru yang akan mengubah seluruh infrastruktur.

Persyaratan AI Agent terhadap infrastruktur

1. Infrastruktur harus diimplementasikan tanpa batasan akses (Permissionless), jika tidak, AI Agent akan dibatasi oleh berbagai strategi anti-serangan, layanan harus menggunakan biaya ekonomi (Gas) untuk mencegah serangan. Dalam hal ini, platform dengan tingkat keterbukaan yang rendah akan menghadapi dampak yang cukup besar, panasnya platform terbuka di awal Web2 akan menyala kembali.

2. AI Agent perlu bisa mengoperasikan dana untuk membayar, guna menyelesaikan masalah di atas.

Artinya, layanan masa depan, apakah berbasis blockchain atau tidak, harus mendukung metode verifikasi identitas berbasis kunci pribadi Crypto serta pembayaran berbasis Crypto.

Kombinasi AI Agent dan blockchain

Selain dua poin yang disebutkan di atas, bagaimana AI Agent menggabungkan dengan blockchain adalah arah yang sedang dieksplorasi oleh banyak orang. Dalam acara tersebut, saya berbicara dengan Mikkke tentang focEliza yang sedang dikembangkannya. Dua jenis AI Agent yang disebutkan sebelumnya, setidaknya jenis pertama memerlukan lingkungan operasional atau verifikasi yang disediakan oleh blockchain. Karena begitu sebuah AI Agent memberikan layanan ke luar, akan ada masalah kepercayaan, perannya sebenarnya mirip dengan kontrak pintar.

Ada kontroversi tentang nama "kontrak pintar" pada waktu itu, itu hanya sepotong kode, di mana letak "kecerdasannya"? AI dapat membuat kontrak pintar menjadi lebih bermakna. Tantangannya adalah bagaimana memanggil antarmuka AI dalam lingkungan kontrak pintar. Jika kita berbicara tentang menjalankan model besar dalam lingkungan yang dapat diverifikasi, jalur ini masih cukup jauh, menggunakan solusi mirip Oracle adalah jalur yang lebih praktis.

Dan seputar AI Agent akan muncul banyak kebutuhan, bagaimana mendapatkan pengetahuan publik AI Agent? Bagaimana AI Agent melakukan penilaian fakta? Bagaimana AI Agent mengenali pengguna yang sama di berbagai platform? Bagaimana "memori" dalam kontrak pintar disimpan? Jika saya memiliki beberapa perangkat, masing-masing terpasang AI Agent, bagaimana mereka dapat berbagi memori?

Anda akan menemukan bahwa "data on-chain" yang pernah dilakukan di Web3, hubungan on-chain, DID, jaringan P2P, dan sebagainya, semuanya memiliki makna dan skenario baru.

Kesimpulan

Mengulang kesimpulan saya dari pembagian tentang AI dan blockchain tahun 2021, internet yang lebih ramah terhadap AI juga merupakan internet yang lebih ramah terhadap manusia. Saat itu masih sekadar ide, tetapi sekarang masa depan telah tiba.