Penulis: jolestar

Minggu lalu saya mencoba-coba AI Agent, dua hari lalu saya menghadiri acara ai16z di Beijing, ingin melihat apa yang sebenarnya bisa dilakukan AI Agent saat ini dan memikirkan apa yang bisa dilakukannya di masa depan.

Kondisi AI Agent saat ini mengingatkan saya pada meme itu, di mana ada orang yang tersembunyi di dalam mesin penjual otomatis. AI Agent yang kita bayangkan sebenarnya sudah mulai memiliki kesadaran otonom, tetapi yang ada di dalam AI Agent sebenarnya adalah seorang pengembang. (Di sini, silakan bayangkan gambarnya, saya mencoba membuat AI menghasilkan gambar ini, tetapi AI tidak dapat memahami 'tersembunyi')

Cara kerja dasar kerangka AI Agent

Kerangka kerja AI Agent saat ini berfungsi sebagai perekat yang menghubungkan klien (Twitter, Discord, Telegram, dll.) dan berbagai plugin (berbagai rantai, dll.), kemudian kerangka ini menyediakan perpustakaan dasar (penyimpanan memori, isolasi sesi, pembuatan konteks, dll.), dan selanjutnya terhubung ke berbagai antarmuka platform AI.

Bagaimana kerangka AI Agent dapat terintegrasi dengan aplikasi dan skenario bisnis

Sejak AI booming tahun lalu, berbagai platform dan alat bermunculan, yang paling penting adalah menyelesaikan satu masalah: bagaimana AI dapat terintegrasi dengan aplikasi. Beberapa platform AI mencoba menawarkan cara plugin, beberapa membangun model alur kerja, dan beberapa aplikasi tradisional mengintegrasikan AI ke dalam aplikasi. Tetapi kuncinya adalah: 1. Di mana titik interaksi aplikasi? 2. Bagaimana AI dapat terintegrasi dengan logika bisnis yang ada.

Setiap platform AI memberikan pengguna pintu masuk interaksi aplikasi yang mirip dengan jendela obrolan, jelas bahwa semua orang beranggapan bahwa cara berinteraksi dengan aplikasi AI seharusnya bersifat 'manusiawi'. Dan di sini keunggulan AI Agent adalah ia langsung terhubung dengan semua IM terbuka dan sistem sosial, jelas lebih mudah diterima daripada membuat yang baru.

Bagaimana AI dapat terintegrasi dengan logika bisnis yang ada. Solusi yang ditawarkan oleh AI Agent adalah membiarkan pengembang mengintegrasikan keputusan AI ke dalam skenario bisnis. Bahasa pemrograman memerlukan kepastian, kondisi if hanya bisa true atau false, tidak bisa menangani logika bisnis yang samar. Dengan AI, logika yang kompleks dapat diubah menjadi kondisi yang tepat, sehingga dapat dengan mulus terintegrasi ke dalam skenario bisnis.

Misalnya, fungsi membalas pesan dalam grup, Bot IM tradisional perlu memicu melalui beberapa perintah pesan yang jelas, sedangkan dengan AI dapat diimplementasikan metode shouldReplyMessage, beri dia konteks, dia akan mengembalikan true atau false.

Peran AI dalam skenario logika bisnis terutama adalah:

1. Penemuan 'niat': Dengan petunjuk dalam kata kunci, biarkan AI menemukan 'niat' dalam pesan teks pengguna berdasarkan konteks, dan memetakan niat tersebut ke kode spesifik.

2. Membantu pengambilan keputusan: Dengan AI, kondisi kompleks yang samar dapat diubah menjadi true/false yang pasti atau tipe enumerasi, kemudian digabungkan dengan logika bisnis.

Setelah membaca ini, banyak orang mungkin merasa kecewa dengan AI Agent, banyak yang mengira AI Agent hanyalah mengajarkan AI dan ia akan bisa melakukan segalanya. Nyatanya, karena masalah batasan konteks model besar, tidak mungkin (setidaknya saat ini) menciptakan AI yang serba bisa, yang dapat melakukan segalanya. Tetapi kabar baiknya adalah programmer tidak perlu khawatir kehilangan pekerjaan, AI masih memerlukan banyak programmer di belakangnya, dan masih perlu orang untuk menyusun if else, tetapi perbedaan kuncinya adalah batasan bisnis yang dapat diproses oleh program semakin meluas.

Dua jenis AI Agent

Dalam acara tersebut, saya bertanya kepada Shaw tentang dua harapan pasar terhadap AI Agent, 1. AI Agent sendiri berperan sebagai suatu entitas, memiliki ID dan merek sendiri, memberikan layanan kepada pengguna. 2. Pengguna memiliki AI Agent pribadi, yang berfungsi layaknya asisten pribadi, dapat membantu pengguna menangani beberapa bisnis. Dari kedua jenis AI Agent ini, mana yang lebih populer? Dia merasa kedua arah tersebut sama baiknya, dan mungkin akan saling melengkapi.

Saat ini, yang dieksplorasi di pasar masih di arah pertama. Arah ini mirip dengan pelayanan AI Agent, di masa depan mungkin tidak akan ada antarmuka aplikasi, semua aplikasi akan menjadi AI Agent, menjadi lebih manusiawi. Sedangkan arah kedua adalah pengembangan aplikasi klien menjadi Agent, di mana klien aplikasi masa depan akan menjadi plugin untuk asisten Agent, data lokal aplikasi menjadi bagian dari memori Agent, sekaligus plugin ini juga bertanggung jawab untuk berkomunikasi dengan layanan Agent di cloud. Ini adalah model arsitektur aplikasi baru yang akan mengubah seluruh infrastruktur.

Persyaratan AI Agent terhadap infrastruktur

1. Infrastruktur harus menerapkan tidak ada batasan akses (Permissionless), jika tidak, AI Agent akan dibatasi oleh berbagai strategi anti serangan, layanan harus menggunakan cara biaya ekonomi (Gas) untuk melawan serangan. Dalam hal ini, platform yang kurang terbuka akan menghadapi dampak besar, gelombang platform terbuka di awal Web2 akan menyala kembali.

2. AI Agent perlu dapat mengoperasikan dana untuk membayar, guna menyelesaikan masalah di atas.

Artinya, layanan di masa depan, baik berbasis blockchain atau tidak, perlu mendukung mode autentikasi identitas berbasis kunci pribadi Crypto serta pembayaran berbasis Crypto.

Kombinasi AI Agent dan rantai

Selain dua poin yang disebutkan di atas, bagaimana AI Agent dapat terintegrasi dengan rantai adalah arah yang sedang dieksplorasi. Dalam acara tersebut, saya berbicara dengan Mikkke tentang proyek yang sedang dikerjakannya, focEliza. Dua jenis AI Agent yang disebutkan sebelumnya, setidaknya jenis pertama memerlukan lingkungan operasi atau verifikasi yang disediakan oleh rantai. Karena begitu AI Agent memberikan layanan ke publik, akan muncul masalah kepercayaan, peran yang dijalankannya sebenarnya sama dengan kontrak pintar.

Tentang nama 'kontrak pintar', ada kontroversi di masa lalu, itu hanya sepotong kode, di mana 'pintarnya'? AI dapat membuat kontrak pintar menjadi sesuai namanya. Tantangannya adalah bagaimana memanggil antarmuka AI dalam lingkungan kontrak pintar. Jika kita mengatakan menjalankan model besar dalam lingkungan yang dapat diverifikasi masih jauh, menggunakan solusi seperti Oracle adalah jalur yang lebih praktis.

Di sekitar AI Agent akan muncul banyak kebutuhan, bagaimana cara mendapatkan pengetahuan umum AI Agent? Bagaimana AI Agent menilai fakta? Bagaimana AI Agent mengenali pengguna yang sama di berbagai platform? Bagaimana 'memori' disimpan dalam kontrak pintar? Jika saya memiliki beberapa perangkat, masing-masing dipasang AI Agent, bagaimana mereka berbagi memori?

Anda akan menemukan bahwa apa yang pernah dilakukan di Web3 seperti 'data on-chain', relasi on-chain, DID, jaringan P2P, dll., semuanya memiliki makna dan skenario baru.

Kesimpulan

Mengulang penutupan saya dari pembagian AI dan blockchain tahun 21, internet yang lebih ramah terhadap AI adalah internet yang lebih ramah terhadap manusia. Saat itu hanya sebuah ide, tetapi sekarang masa depan sudah tiba.