V éře umělé inteligence je význam dat nepopiratelný. Data jsou základem AI modelů, kvalita zdrojů tréninkových dat určuje schopnosti AI a uživatelskou zkušenost produktu. Internetové technologické giganty s obrovským množstvím vícerozměrných obchodních dat mají výhodu v scénářích a díky akumulaci dat během mnoha let provozu internetových platforem, jejich existující uživatelské scénáře mohou generovat obrovské množství soukromých dat, což jim poskytuje zjevnou výhodu v optimalizaci trénování modelů.
Po uvedení raných AI produktů na trh se jejich modely optimalizovaly díky zpětné vazbě od uživatelské základny a interakcím s produkty, což vedlo k efektu datového kola a stálé optimalizaci. V budoucnu se to stane ochrannou hrází AI produktů. Naopak začínající podniky v AI sektoru se potýkají s nedostatkem dostatečného množství a kvality zdrojů dat pro trénink modelů. Tyto datové bariéry a vznikající datové ostrovy mohou bránit rozvoji umělé inteligence.
VANA: Odstranit datové ostrovy, sdílet hodnotu dat uživatelů
Na počátku internetu se objevilo mnoho různých internetových společností, které narušily tradiční obchodní modely. Avšak s rozvojem odvětví začaly přední internetové technologické společnosti monopolizovat trh, velké internetové platformy ovládající tok uživatelů mají k dispozici obrovské množství uživatelských dat. Tyto platformy mohou využívat uživatelská data k algoritmickým doporučením a kreditnímu půjčování, což přináší obchodní hodnotu. Reddit již získal 200 milionů dolarů prodejem obsahu generovaného uživateli jako dat pro trénink AI, ale uživatelé, kteří tato data vytvářejí, se nesdílejí o hodnotě a výsledcích dat. VANA přichází, aby odstranila datové ostrovy, umožnila uživatelům vlastnit data a sdílet hodnotu dat.
VANA je otevřený a decentralizovaný protokol pro data a suverenitu, jako L1 kompatibilní s EVM, VANA umožňuje uživatelům vlastnit svá data a přispívat osobními daty k sdílení výnosů generovaných umělou inteligencí.
VANA řeší problém zdrojů tréninkových dat pro AI modely
Jak je známo, zdroje tréninkových dat AI modelů technologických společností pocházejí převážně z crawlerů, placeného nákupu a vlastních obchodních akumulací. Výhodou dat z crawlerů je snadný přístup, ale nízká kvalita dat a obtížné čištění; placená data jsou silně homogenní, kvůli obchodní konkurenci je skutečně hodnotných obchodních dat málo a taková data obtížně přinášejí diferenciovanou výhodu pro AI modely; hodnoty dat akumulovaných z obchodních scénářů jsou vysoké, ale tento způsob není přátelský k malým a začínajícím podnikům.
Data VANA pochází od uživatelů, kteří přispívají do ekosystému. Uživatelé zapojující se do ekosystému VANA přispívají daty z sociálních médií jako X, LinkedIn nebo IoT, která budou bezpečně uložena off-chain. Po ověření a čištění bude data použita pro vývoj AI modelů. Uživatelé, kteří přispějí daty, získají právo na řízení DataDAO, rozhodují o právu na použití dat a sdílejí hodnotu generovanou daty.
Výhody modelu VANA
Zavádí decentralizovaný způsob řízení, který uživatelům poskytuje vlastnictví dat a umožňuje jim rozhodovat o způsobu použití dat.
Uživatelé mohou prostřednictvím VANA převést data na obchodovatelná datová aktiva pro aplikace decentralizované umělé inteligence.
Zaručuje ochranu soukromí a bezpečnost dat pomocí zero-knowledge proof (ZKP) a důvěryhodného výpočetního prostředí (TEE).
Struktura sítě VANA
Účastníci VANA zahrnují přispěvatele dat, validátory, stakery, spotřebitele dat a DLP (Tvůrce likvidity dat), což jsou DataDAO.
1. Přispěvatelé dat
Participující uživatelé mohou přispět svými daty do DataDAO založeného v síti VANA, data, která odesílají, jsou uložena off-chain, doklady o příspěvku jsou uloženy on-chain. Například v ChatGPT DataDAO uživatelé požádají OpenAI o export dat ChatGPT prostřednictvím e-mailu, po obdržení odpovědi e-mailem uploadují data a odkazy na stažení na gptdatadao.org.
2. DataDAO
Zajištěním minimálně 100 dolarů v hodnotě VANA lze vytvořit registrované DataDAO. Po dokončení registrace se DataDAO objeví na DataHubu pro volbu přispěvatelů dat. Aby se podpořil trvalý rozvoj DataDAO, VANA poskytne odměny pro 16 nejlépe hodnocených DataDAO, které stakují VANA. Odměny za první tři roky jsou 15 % z celkového množství tokenů, každých 21 dní je jeden odměnový cyklus a odemykání stakingu vyžaduje 7 dní. Počet odměn VANA se určuje podle množství stakovaných tokenů, doby stakingu a počtu odměn, které DataDAO získá. DataDAO potřebuje stakovat alespoň 10 000 VANA, aby měla šanci získat odměnu. 50 % odměn patří stakerovi, zbývající odměny určuje DataDAO, zda a jak je využije.
V současné době bylo registrováno 17 DataDAO, které zahrnují Volara zaměřující se na data z Twitteru/X, R/DataDAO z Redditu a DLP Labs s daty z LinkedIn životopisů. Již 140 000 uživatelů Redditu se připojilo k R/DataDAO a nyní byl vyškolen první AI model vlastněný uživateli.
3. Validátoři
Validátoři odpovídají za bezpečnost, integritu a funkčnost Vana Layer 1 blockchainu, zajišťují správné ověření, zaznamenání a přidání datových transakcí do blockchainu, zahrnují L1 Validátory a Validátory Satya.
L1 Validátoři odpovídají za bezpečnost a konsensus VANA. Minimální staking 35 000 VANA pro stání jako L1 Validátor. Počáteční počet L1 Validátorů je 64, později se rozšíří na 128. Každý blok získává 5 VANA, výpadek bude penalizován 10%, odměny se každoročně snižují o 10%.
Validátoři Satya poskytují důvěryhodné výpočetní prostředí (TEE) pro ověření dat přispěných uživateli a zajišťují bezpečnost a soukromí dat během ověřovacího procesu. Tím získávají odměny VANA.
4. Spotřebitelé dat
Vývojáři AI modelů jako spotřebitelé dat vybírají a nakupují přístupové oprávnění k datasetům, které vyhovují potřebám vývoje AI modelů, využívají infrastrukturu VANA k tréninku AI a analýze dat, spolupracují s DataDAO na optimalizaci AI modelů.
Například v ChatGPT DataDAO uživatelé nahrávají odkazy na stahování a datové soubory, které jsou zabezpečeny šifrovaným přenosem k Validátorům Satya. Validátoři Satya dešifrují a provádějí kontrolu, aby zajistili pravdivost nahraných dat a zabraňovali jejich manipulaci.
Aplikační scénáře a ekonomický model tokenu VANA
1. Validátoři stakují VANA, aby zajistili bezpečnost sítě a ověřili data, čímž získávají odměny VANA.
2. VANA slouží jako GAS pro provádění smluv a interakce DataDAO v síti;
3. Uživatelé stakují VANA v DataDAO, aby získali odměny za staking VANA;
4. Spotřebitelé dat ve výchozím nastavení používají VANA při přístupu k datům.
5. Držitelé VANA se účastní řízení a hlasují o návrzích, kdy VANA se stává hlavním obchodním párem pro tokeny vydané DataDAO.
Celkový limit VANA je 120 milionů kusů, rozdělení tokenů je znázorněno na obrázku.
Komunita
Hlavními složkami jsou odměny za kvalitní datové příspěvky DataDAO, airdropy pro rané uživatele a vývojáře. TGE dodává 20,3 % VANA, bez zámku.
Ecosystem ekosystém
Hlavními složkami jsou tokeny podporující vydávání DataDAO, blokové odměny a partneři, TGE dodává 4,8 % VANA, bez zámku.
Investoři
Vana dosud získala celkem 25 milionů dolarů financování, včetně 5 milionů dolarů strategického kola financování od Coinbase Ventures, 18 milionů dolarů v A kole od Paradigm a 2 miliony dolarů v seed kole od Polychain.
Core Contributors jádro vývojového týmu
Z výše uvedeného vyplývá, že celková nabídka VANA během TGE je 30 milionů kusů, přičemž zahrnuje 4,8 milionu VANA z Binance Launchpool.
Právní rizika modelu VANA v případě existence v Číně
Projekt decentralizovaných AI modelů VANA řeší problém s tréninkovými daty AI modelů za nižší náklady, což umožňuje podnikatelům v oblasti AI vlastnit kvalitní tréninková data, přerušuje datové ostrovy vytvářené velkými internetovými společnostmi a otevírá možnost pro Tencent získat uživatelská data od Alibaby pro trénink AI modelů. Tento model snižuje překážky pro jednotlivce a firmy zaměřené na podnikání v oblasti AI modelů, avšak jeho replikace v Číně může představovat riziko pro vývoz dat.
Národní úřad pro internetové informace jasně stanovuje v (Průvodci pro zabezpečení výstupu dat (1. vydání)), že výstupy dat zahrnují:
(1) Zpracovatelé dat shromáždí a vytvoří data během provozu v zemi a přenášejí je, ukládají do zahraničí;
(2) Údaje shromážděné a vytvořené zpracovateli dat jsou ukládány v zemi a subjekty, organizace nebo jednotlivci v zahraničí mohou dotazovat, vyžadovat, stahovat a exportovat;
(3) Další způsoby výstupu dat stanovené Národním úřadem pro internetové informace.
(Zákon o správě výstupu a vstupu Čínské lidové republiky) článek 89 jasně uvádí, že výstup znamená cestu z pevninské Číny do jiných zemí nebo oblastí, z pevninské Číny do zvláštní administrativní oblasti Hongkong, zvláštní administrativní oblasti Macao a z pevninské Číny na Tchaj-wan. Z toho vyplývá, že rozhodování o tom, zda se jedná o výstup, se zakládá na soudní jurisdikci.
Vytváření DataDAO a přispívání uživatelů dat nejsou žádná omezení, spotřebitelé dat nemusí procházet KYC, stačí zaplatit VANA a získat přístup k shromážděným datům. V této situaci se účastníci různých DataDAO přispívajícími daty ze sociálních médií nebo životopisů mohou dostat do situací, které zahrnují vývoz dat.
Definice osobních údajů: podle článku 76 (Zákon o kybernetické bezpečnosti Čínské lidové republiky): Osobní údaje jsou informace, které lze elektronicky nebo jinými způsoby záznamu použít k identifikaci jednotlivce buď samostatně, nebo v kombinaci s jinými informacemi, včetně, ale nejen, jména jednotlivce, data narození, čísla občanského průkazu, biometrických informací, adresy, telefonního čísla atd.
Data shromážděná DataDAO, jako jsou životopisy a zdravotní data, mohou obsahovat osobní informace jako jméno, datum narození, telefonní číslo a dokonce i citlivé osobní údaje. (Zákon o ochraně osobních údajů Čínské lidové republiky) omezuje použití těchto dat a jejich přeshraniční přenos.