Sumber artikel: PA荐读
Penulis: jolestar
Minggu lalu saya mengutak-atik AI Agent, dan dua hari lalu saya menghadiri acara ai16z di Beijing, ingin melihat apa yang dapat dilakukan AI Agent saat ini, dan berpikir tentang apa yang bisa dilakukannya di masa depan.
Keberadaan AI Agent mengingatkan saya pada gambar meme itu, di mana ada seseorang yang tersembunyi di dalam mesin penjual otomatis. Semua orang sudah membayangkan bahwa AI Agent sudah mulai memiliki kesadaran sendiri, tetapi sebenarnya di dalam AI Agent itu ada seorang pengembang. (Di sini, silakan bayangkan gambar tersebut, saya mencoba membuat AI menghasilkan gambar ini, tetapi AI tidak bisa memahami 'tersembunyi')
Cara kerja dasar kerangka AI Agent
Kerangka AI Agent saat ini berfungsi sebagai perekat, menghubungkan klien (Twitter, Discord, Telegram, dll.) dengan berbagai plugin (berbagai rantai, dll.), lalu kerangka menyediakan perpustakaan dasar (penyimpanan memori, isolasi sesi, pembuatan konteks), dan seterusnya menghubungkan berbagai antarmuka platform AI.
Bagaimana kerangka AI Agent berintegrasi dengan aplikasi dan skenario bisnis
Sejak AI menjadi populer tahun lalu, berbagai platform dan alat muncul, yang paling penting adalah menyelesaikan satu masalah, bagaimana AI dapat terintegrasi dengan aplikasi. Beberapa platform AI mencoba menyediakan cara plugin, yang lain membangun model alur kerja, dan juga ada aplikasi tradisional yang menyematkan AI ke dalam aplikasi. Namun, yang menjadi kunci di sini adalah: 1. Di mana akses interaksi aplikasi? 2. Bagaimana AI terintegrasi dengan logika bisnis yang ada.
Setiap platform AI menyediakan akses interaksi kepada pengguna dalam bentuk jendela obrolan yang mirip, jelas bahwa semua orang percaya bahwa cara interaksi dengan aplikasi AI harus bersifat 'personifikasi'. Dalam hal ini, kecerdikan AI Agent adalah ia langsung terhubung ke semua IM terbuka dan sistem sosial, yang jelas lebih mudah diterima dibandingkan membuat yang baru.
Bagaimana AI terintegrasi dengan logika bisnis yang ada. Solusi yang ditawarkan AI Agent adalah memungkinkan pengembang mengintegrasikan keputusan AI ke dalam skenario bisnis. Bahasa pemrograman memerlukan kepastian, kondisi if hanya bisa true atau false, tidak bisa menangani logika bisnis yang samar. Dengan AI, logika kompleks dapat diubah menjadi kondisi yang tepat, lalu dapat disatukan ke dalam skenario bisnis.
Misalnya, fungsi membalas pesan dalam grup, Bot IM tradisional perlu melalui beberapa perintah pesan yang jelas untuk memicu, sedangkan melalui AI dapat mewujudkan metode shouldReplyMessage, berikan konteks, dan ia mengembalikan true atau false.
Peran AI dalam konteks logika bisnis terutama adalah:
1. Penemuan 'niat': Melalui penjelasan dalam kata kunci, membuat AI menemukan 'niat' dalam pesan teks pengguna berdasarkan konteks, dan memetakan niat tersebut ke kode tertentu.
2. Membantu pengambilan keputusan: Dengan AI, mengubah kondisi kompleks yang samar menjadi true/false yang pasti atau tipe enumerasi, lalu mengintegrasikannya ke dalam logika bisnis.
Melihat ini, banyak orang mungkin akan kecewa dengan AI Agent, banyak yang berpikir bahwa AI Agent berarti mengajarkan AI dan ia akan bisa melakukan semuanya. Sebenarnya, karena masalah batasan konteks model besar, tidak mungkin (setidaknya saat ini) untuk menciptakan AI yang serba bisa, yang bisa melakukan segala hal. Tetapi kabar baiknya adalah para programmer tidak perlu khawatir kehilangan pekerjaan, AI masih membutuhkan banyak programmer di belakangnya, dan masih memerlukan seseorang untuk menyusun if else, tetapi perbedaan kunci adalah batasan bisnis yang dapat diproses oleh program sedang diperluas.
Dua jenis AI Agent
Di acara tersebut, saya bertanya kepada Shaw satu pertanyaan, pasar memiliki dua harapan untuk AI Agent, 1. AI Agent sendiri memainkan peran, memiliki ID, merek, dan memberikan layanan kepada pengguna. 2. Pengguna memiliki AI Agent pribadi, yang setara dengan asisten pribadi, yang dapat membantu pengguna menangani beberapa bisnis. Di antara dua jenis AI Agent ini, mana yang akan lebih populer? Dia percaya kedua arah tersebut akan baik, juga mungkin bisa digabungkan.
Saat ini, arah utama yang dieksplorasi di pasar adalah arah pertama. Arah ini mirip dengan layanan yang di-AI-Agent-kan, di masa depan mungkin tidak akan ada antarmuka aplikasi lagi, semua aplikasi akan di-AI-Agent-kan, dipersonifikasikan. Sedangkan arah kedua adalah peng-Agent-an klien aplikasi, klien aplikasi di masa depan akan menjadi plugin untuk asisten Agent, data lokal aplikasi menjadi bagian dari memori Agent, sementara plugin ini juga bertanggung jawab untuk berkomunikasi dengan layanan Agent di cloud. Ini adalah model arsitektur aplikasi baru yang akan mengubah seluruh infrastruktur.
Persyaratan AI Agent terhadap infrastruktur
1. Infrastruktur harus mewujudkan tanpa batasan akses (Permissionless), jika tidak, AI Agent akan dibatasi oleh berbagai strategi anti serangan, layanan harus menggunakan cara biaya ekonomi (Gas) untuk melawan serangan. Dalam hal ini, platform dengan tingkat keterbukaan yang buruk akan menghadapi guncangan yang cukup besar, semangat platform terbuka pada awal Web2 akan kembali terbangkitkan.
2. AI Agent perlu dapat mengoperasikan dana untuk membayar, guna menyelesaikan masalah di atas.
Artinya, layanan di masa depan, baik yang berbasis blockchain atau tidak, harus mendukung verifikasi identitas dengan model kunci pribadi Crypto dan pembayaran berbasis Crypto.
Integrasi AI Agent dan rantai
Selain dua poin yang disebutkan di atas, bagaimana AI Agent terintegrasi dengan rantai adalah arah yang sedang dieksplorasi oleh banyak orang. Di acara itu, saya berbicara dengan Mikkke tentang focEliza yang sedang ia kerjakan. Dua jenis AI Agent yang disebutkan sebelumnya, setidaknya jenis pertama memerlukan lingkungan operasi atau verifikasi yang disediakan oleh rantai. Karena begitu sebuah AI Agent menawarkan layanan ke luar, akan ada masalah kepercayaan, perannya sebenarnya sama dengan kontrak pintar.
Ada kontroversi tentang nama 'kontrak pintar' pada waktu itu, itu hanyalah sepotong kode, di mana 'cerdas'-nya? AI bisa membuat kontrak pintar menjadi sesuai namanya. Masalahnya adalah bagaimana memanggil antarmuka AI dalam lingkungan kontrak pintar. Jika kita berbicara tentang menjalankan model besar dalam lingkungan yang dapat diverifikasi, jalan ini masih cukup jauh, menggunakan solusi seperti Oracle adalah jalur yang lebih praktis.
Dan seputar AI Agent akan muncul banyak kebutuhan, bagaimana cara mendapatkan pengetahuan umum AI Agent? Bagaimana AI Agent menentukan fakta? Bagaimana AI Agent mengenali pengguna yang sama di berbagai platform? Bagaimana 'memori' disimpan dalam kontrak pintar? Jika saya memiliki beberapa perangkat, masing-masing dipasang AI Agent, bagaimana mereka berbagi memori?
Anda akan menemukan bahwa konsep 'data di rantai', hubungan di rantai, DID, jaringan P2P, dan sebagainya yang pernah dibahas di Web3, kini memiliki makna dan konteks baru.
Kesimpulan
Mengulang kesimpulan dari presentasi saya tentang AI dan blockchain di tahun 2021, internet yang lebih ramah terhadap AI adalah juga internet yang lebih ramah terhadap manusia. Saat itu hanya sebuah ide gila, tetapi sekarang masa depan telah datang.