VANA: Memecahkan pulau data, mendukung pelatihan model AI

Di era kecerdasan buatan, pentingnya data tidak bisa dipungkiri. Data adalah dasar dari model besar AI, kualitas sumber data pelatihan menentukan kemampuan AI serta pengalaman pengguna produk. Raksasa teknologi internet yang memiliki banyak dan beragam data bisnis memiliki keunggulan dalam skenario, melalui akumulasi data selama bertahun-tahun dari proses operasi platform internet dan skenario penggunaan pengguna yang ada, dapat menghasilkan banyak data pribadi, memiliki keuntungan yang jelas dalam pengoptimalan pelatihan model.
Setelah produk AI awal diluncurkan, produk tersebut bergantung pada umpan balik dari interaksi pengguna dengan produk untuk mengoptimalkan model, sehingga menghasilkan efek roda data, terus menerus mengoptimalkan dan iterasi, dan nantinya ini akan menjadi moat dari produk AI. Namun, perusahaan rintisan di jalur AI mengalami kesulitan karena tidak memiliki jumlah dan kualitas sumber data yang cukup untuk melatih model, batasan data ini dan pulau data yang terbentuk akan menghambat perkembangan kecerdasan buatan.
VANA: Memecahkan pulau data, pengguna berbagi nilai data
Pada awal internet, berbagai perusahaan internet muncul dengan beragam model operasional yang mengganggu industri tradisional, tetapi kemudian dengan perkembangan industri, perusahaan teknologi internet terkemuka mulai mendominasi pasar, mengendalikan akses lalu lintas, dan memiliki banyak data pengguna. Platform terkemuka dapat menggunakan data pengguna ini untuk rekomendasi algoritma dan mendapatkan nilai komersial dari pinjaman kredit, Reddit telah mendapatkan 200 juta dolar AS dari penjualan konten yang dihasilkan pengguna sebagai data pelatihan AI, tetapi pengguna yang menghasilkan data tersebut tidak mendapatkan nilai dan hasil dari data tersebut. Munculnya VANA akan memecahkan pulau data, memberikan pengguna kepemilikan data, dan berbagi hasil dari data.
VANA adalah protokol kedaulatan data yang terbuka dan terdesentralisasi, sebagai L1 yang kompatibel dengan EVM, VANA memungkinkan pengguna memiliki data mereka sendiri, menyumbangkan data pribadi mereka untuk berbagi keuntungan yang dihasilkan oleh kecerdasan buatan.
VANA menyelesaikan masalah sumber data pelatihan model AI
Seperti yang diketahui, sumber data pelatihan model AI dari perusahaan teknologi internet terutama berasal dari web scraping, pembelian berbayar, dan akumulasi bisnis mereka sendiri. Kelebihan data dari web scraping adalah mudah didapat, tetapi kualitas data rendah dan sulit dibersihkan; data yang dibeli dengan biaya tinggi sangat seragam, karena persaingan bisnis, ada sedikit sumber data bisnis yang benar-benar berharga, dan data semacam ini sulit memberikan keuntungan diferensiasi bagi model AI; nilai data dari akumulasi skenario bisnis tinggi, tetapi cara ini tidak ramah bagi perusahaan kecil dan menengah yang baru berdiri.
Sementara data VANA berasal dari kontribusi pengguna di ekosistem, pengguna yang berpartisipasi dalam ekosistem VANA menyumbangkan data dari media sosial seperti X, LinkedIn, atau data Internet of Things, yang semuanya akan disimpan dengan aman di luar rantai. Data yang telah diverifikasi dan dibersihkan akan digunakan dalam pengembangan model AI. Pengguna yang berpartisipasi dalam kontribusi data dapat memperoleh hak tata kelola DataDAO, menentukan hak penggunaan data, dan berbagi nilai yang dihasilkan dari data.
Keuntungan model VANA
Dengan menggunakan metode tata kelola terdesentralisasi, pengguna memiliki hak kepemilikan atas data dan dapat menentukan cara penggunaan data secara mandiri;
Pengguna dapat mengubah VANA menjadi aset data yang dapat diperdagangkan untuk aplikasi kecerdasan buatan yang terdesentralisasi;
Dengan menggunakan bukti nol pengetahuan (ZKP) dan lingkungan eksekusi yang dapat dipercaya (TEE) untuk melindungi privasi dan keamanan data.
Komponen jaringan VANA
Peserta VANA terutama mencakup kontributor data, validator, penjamin, konsumen data, dan DLP (Pencipta Pool Likuiditas Data), yaitu DataDAO.
1, Kontributor Data
Pengguna yang berpartisipasi dapat memilih DataDAO yang didirikan dalam jaringan VANA untuk menyumbangkan data mereka, data yang diserahkan disimpan di luar rantai, dan bukti kontribusi disimpan di dalam rantai. Sebagai contoh DataDAO ChatGPT, pengguna meminta OpenAI untuk mengekspor data ChatGPT melalui email, setelah menerima balasan email, mereka mengunggah data dan tautan unduhan melalui gptdatadao.org.
2, DataDAO
Dengan mempertaruhkan VANA senilai minimal 100 dolar AS, pengguna dapat membuat dan mendaftar DataDAO, setelah pendaftaran, DataDAO akan muncul di DataHub untuk dipilih oleh kontributor data. Untuk mendorong perkembangan berkelanjutan DataDAO, VANA akan memberikan penghargaan kepada 16 DataDAO teratas berdasarkan peringkat data yang dipertaruhkan, dengan penghargaan untuk tiga tahun pertama sebesar 15% dari total pasokan token, dengan periode penghargaan setiap 21 hari, dan pembukaan kunci pertaruhan memerlukan 7 hari. Jumlah penghargaan VANA ditentukan oleh jumlah VANA yang dipertaruhkan, durasi pertaruhan, dan jumlah penghargaan yang diperoleh DataDAO. DataDAO perlu mempertaruhkan minimal 10.000 VANA untuk memiliki kesempatan mendapatkan penghargaan. 50% dari penghargaan tetap menjadi milik para penjamin, dan sisa penghargaan ditentukan oleh DataDAO untuk kegunaannya.
Saat ini telah terdaftar 17 DataDAO yang telah dibuat, termasuk Volara yang berfokus pada data Twitter/X, R/DataDAO untuk Reddit, serta DLP Labs yang berfokus pada data resume LinkedIn, di mana 140.000 pengguna Reddit telah bergabung dengan R/DataDAO, dan sekarang sudah dilatih model AI yang dimiliki oleh pengguna pertama.
3, Validator
Validator bertanggung jawab atas keamanan, integritas, dan fungsi blockchain Vana Layer 1, memastikan transaksi data divalidasi, dicatat, dan ditambahkan dengan benar ke dalam blockchain, termasuk L1 Validators dan Satya Validators.
L1 Validators bertanggung jawab atas keamanan dan konsensus VANA. Setidaknya mempertaruhkan 35.000 VANA untuk menjadi L1 Validators, L1 Validators awal berjumlah 64, dan kemudian diperluas menjadi 128. Setiap blok mendapatkan 5 VANA, dan downtime akan dikenakan penalti 10%, penghargaan berkurang 10% setiap tahun.
Satya Validators menyediakan lingkungan eksekusi yang dapat dipercaya (TEE) untuk memverifikasi data yang disumbangkan oleh pengguna, dan memastikan keamanan dan privasi data selama proses verifikasi. Dengan demikian mendapatkan penghargaan VANA.
4, Konsumen Data
Pengembang model AI sebagai Konsumen Data memilih dan membeli akses data set yang sesuai dengan kebutuhan pengembangan model AI, menggunakan infrastruktur VANA untuk pelatihan AI dan analisis data, serta bekerja sama dengan DataDAO untuk mengoptimalkan model AI.
Sebagai contoh DataDAO ChatGPT, pengguna mengunggah tautan unduhan dan file data yang dikirim melalui transmisi terenkripsi kepada Satya Validators. Satya Validators melakukan dekripsi dan perhitungan validasi, memastikan keaslian data yang diunggah pengguna dan tidak ada yang diubah.
Skenario aplikasi dan model ekonomi VANA
1, Validator mempertaruhkan VANA untuk menjamin keamanan jaringan dan memverifikasi data untuk mendapatkan penghargaan VANA;
2, VANA sebagai GAS untuk operasi di dalam rantai seperti pelaksanaan kontrak dan interaksi DataDAO;
3, Pengguna mempertaruhkan VANA di DataDAO untuk mendapatkan penghargaan pertaruhan VANA;
4, Konsumen Data secara default menggunakan VANA saat mengakses data;
5, Pemegang VANA berpartisipasi dalam tata kelola dan memberikan suara pada proposal, VANA sebagai pasangan perdagangan utama untuk token yang diterbitkan oleh DataDAO.
Total pasokan VANA dibatasi hingga 120 juta, distribusi token ditunjukkan pada gambar di bawah ini.
Komunitas
Utamanya mencakup penghargaan kontribusi data berkualitas tinggi dari DataDAO, airdrop untuk pengguna awal, serta pengembang. TGE menyediakan 20,3% VANA, tanpa periode penguncian.
Ecosystem ekosistem
Utamanya mencakup dukungan token yang diterbitkan oleh DataDAO, hadiah blok, dan mitra, TGE menyediakan 4,8% VANA, dan tidak mengunci pasokan.
Investor
Vana saat ini telah mendapatkan total pendanaan sebesar 25 juta dolar AS, termasuk 5 juta dolar AS dari putaran strategis Coinbase Ventures, 18 juta dolar AS dari putaran A Paradigm, dan 2 juta dolar AS dari putaran awal Polychain.
Kontributor Inti tim pengembang inti
Kesimpulannya, total pasokan VANA saat TGE adalah 30 juta, yang termasuk 4,8 juta VANA dari Binance Launchpool.
Risiko hukum yang mungkin ada dalam model VANA di Tiongkok
Proyek data model AI terdesentralisasi VANA ini menyelesaikan masalah data untuk pelatihan model AI dengan biaya yang lebih rendah, memungkinkan para pengusaha model AI memiliki data pelatihan berkualitas tinggi, memecahkan pulau data yang dibuat oleh perusahaan internet besar, dan memungkinkan Tencent untuk mendapatkan data pengguna Alibaba untuk melatih model AI, yang menurunkan ambang batas bagi individu dan perusahaan yang berfokus pada kewirausahaan model AI, tetapi model ini mungkin menghadapi risiko pengiriman data saat direplikasi di Tiongkok.
Kantor Informasi Internet Negara menerbitkan (Panduan Pengajuan Penilaian Keamanan Pengiriman Data (Edisi Pertama)) yang dengan jelas menyatakan bahwa perilaku pengiriman data mencakup:
(1) Pengolah data akan mengumpulkan dan menghasilkan data yang ditransfer dan disimpan di luar negeri;
(2) Data yang dikumpulkan dan dihasilkan oleh pengolah data disimpan di dalam negeri, lembaga, organisasi, atau individu di luar negeri dapat mencari, mengambil, mengunduh, dan mengekspor;
(3) Perilaku pengiriman data lainnya yang ditentukan oleh Kantor Siber Negara.
(Undang-Undang Manajemen Lalu Lintas Masuk dan Keluar Republik Rakyat Tiongkok) Pasal 89 secara jelas menyatakan bahwa keluar adalah perjalanan dari daratan Tiongkok ke negara atau wilayah lain, dari daratan Tiongkok ke Wilayah Administratif Khusus Hong Kong, Wilayah Administratif Khusus Makau, dan dari daratan Tiongkok ke wilayah Taiwan. Dari sini dapat dilihat bahwa penilaian apakah keluar atau tidak didasarkan pada yurisdiksi hukum.
Pembuatan DataDAO dan kontribusi pengguna tidak memiliki batasan, Konsumen Data tidak perlu melakukan KYC, selama mereka membayar VANA, mereka dapat mengakses data yang dikumpulkan. Dalam situasi ini, pengguna domestik yang berpartisipasi dalam berbagai DataDAO untuk menyumbangkan data media sosial dan resume mungkin akan melibatkan pengiriman data.
Definisi informasi data pribadi: Berdasarkan (Undang-Undang Keamanan Siber Republik Rakyat Tiongkok) Pasal 76: Informasi pribadi adalah informasi yang dapat merekam identitas pribadi seorang individu baik secara terpisah maupun digabungkan dengan informasi lainnya, termasuk tetapi tidak terbatas pada nama individu, tanggal lahir, nomor identitas, informasi biometrik pribadi, alamat, nomor telepon, dan lainnya.
Data yang dikumpulkan oleh DataDAO, seperti resume dan data kesehatan, akan melibatkan informasi pribadi seperti nama, tanggal lahir, nomor telepon, dan bahkan informasi pribadi sensitif. (Undang-Undang Perlindungan Informasi Pribadi Republik Rakyat Tiongkok) memiliki batasan dan ketentuan mengenai penggunaan dan lintas batas data tersebut.

#币安LaunchpoolVANA 
VANA: Memecahkan pulau data, mendukung pelatihan model AI

Jelajahi Konten Lainnya dari Kreator

Berita Terbaru