У епоху штучного інтелекту важливість даних не викликає сумнівів. Дані, як основа великих моделей AI, якість джерел даних для навчання визначає здатність AI та користувацький досвід продуктів. Інтернет-технологічні гіганти, що мають велику кількість многомірних бізнес-даних, мають перевагу в сценаріях, через накопичення даних, що відбувалося під час роботи Інтернет-платформ, і наявні сценарії використання користувачів можуть генерувати велику кількість приватних даних, що надає їм перевагу в оптимізації навчання моделей.
Після запуску ранніх AI продуктів, вони оптимізують моделі, спираючись на зворотний зв'язок від користувачів та їхній взаємодії з продуктами, створюючи ефект даних, що обертаються, і безперервно оптимізуючи та ітерацією, що згодом стане захисним механізмом для AI продуктів. Однак стартапи в галузі AI страждають від недостатньої кількості та якості джерел даних для навчання моделей, цей бар'єр даних і формування даних-островів заважає розвитку штучного інтелекту.
VANA: руйнує дані-острови, користувачі діляться цінністю даних
На ранніх етапах Інтернету з'явилися різні компанії, які руйнували традиційні бізнес-моделі, але з розвитком галузі провідні технологічні компанії Інтернету почали монополізувати ринок, великі Інтернет-платформи контролюють потоки трафіку і мають велику кількість даних користувачів. Провідні платформи можуть використовувати ці дані для алгоритмічних рекомендацій, кредитного кредитування для отримання комерційної вигоди, Reddit отримав 200 мільйонів доларів доходу, продаючи користувацький контент як дані для навчання AI, але користувачі, які створюють дані, не отримують частку вартості та результатів даних. Поява VANA зламає дані-острови, надаючи користувачам дані та можливість ділитися прибутками від даних.
VANA є відкритим і децентралізованим протоколом суверенітету даних, як L1, що сумісний з EVM, VANA дозволяє користувачам володіти своїми даними, вносити персональні дані та ділитися доходами, отриманими від штучного інтелекту.
VANA вирішує проблему джерел даних для навчання AI моделей
Відомо, що дані для навчання AI моделей в Інтернет-технологічних компаніях в основному надходять через веб-сканування, платну покупку та накопичення власного бізнесу. Переваги даних, отриманих через веб-сканування, полягають у легкому доступі, але якість даних низька, а очищення є складним; дані, які купуються, страждають від серйозної гомогенізації; через комерційну конкуренцію дійсно цінні бізнес-джерела даних рідкісні, такі дані важко забезпечити відмінності для навчання AI моделей; дані, накопичені в бізнес-сценаріях, мають високу цінність, але цей спосіб є неприязно для стартапів малого і середнього бізнесу.
Дані VANA походять з внесків користувачів в екосистемі, користувачі, які беруть участь в екосистемі VANA, вносять дані з соціальних медіа, таких як X і LinkedIn, ці дані будуть безпечно зберігатися поза ланцюгом. Дані після перевірки та очищення будуть використані для розробки AI моделей. Після внесення даних учасники можуть отримати право голосу в управлінні DataDAO, визначати, як використовувати дані, і ділитися створеною вартістю.
Переваги моделі VANA
Використовуючи децентралізований метод управління, надаємо користувачу право власності на дані та можливість самостійно вирішувати, як використовувати дані;
Користувачі можуть перетворювати дані через VANA в торгівельні активи даних для застосування в децентралізованому штучному інтелекті;
Забезпечуємо конфіденційність і безпеку даних шляхом використання доказів нульового знання (ZKP) і довірених виконавчих середовищ (TEE).
Мережа VANA
Учасники VANA в основному складаються з учасників даних, валідаторів, стейкерів, споживачів даних та DLP (Творці ліквідності даних), тобто DataDAO.
1. Учасники даних
Користувачі можуть вибрати DataDAO, створену в мережі VANA, щоб внести свої дані; дані, подані, зберігаються поза ланцюгом, а докази внеску зберігаються на ланцюзі. Наприклад, у ChatGPT DataDAO користувачі запитують OpenAI на експорт даних ChatGPT через електронну пошту, після отримання відповіді з електронної пошти, дані та посилання на завантаження завантажуються через gptdatadao.org.
2. DataDAO
Застосування VANA для створення зареєстрованого DataDAO вимагає заморожування VANA на суму не менше 100 доларів. Після реєстрації DataDAO з'явиться на DataHub для вибору учасниками, які вносять дані. Щоб сприяти сталому розвитку DataDAO, VANA буде надавати винагороди 16 DataDAO з найвищим рейтингом заморожених VANA, за перші три роки винагорода за заморожування становитиме 15% від загальної кількості токенів, кожні 21 день - один цикл нагороди, розблокування заморожування вимагає 7 днів. Кількість винагород VANA залежить від кількості заморожених токенів, часу заморожування та кількості винагород, отриманих DataDAO. DataDAO повинна заморозити щонайменше 10 000 VANA, щоб мати можливість отримати винагороду. 50% винагороди фіксовано належать тому, хто заморозив, решту винагороди DataDAO вирішує, на що їх використовувати.
На даний момент зареєстровано 17 DataDAO, серед яких Volara, що зосереджується на даних Twitter/X, R/DataDAO з Reddit та DLP Labs з даних резюме LinkedIn, вже 140 тисяч користувачів Reddit приєдналися до R/DataDAO, і вже навчена перша модель штучного інтелекту, яка належить користувачеві.
3. Валідатори
Валідатори відповідають за безпеку, цілісність та функціональність блокчейну Vana Layer 1, забезпечуючи правильність перевірки, реєстрації та додавання даних до блокчейну, головним чином складаються з L1 Validators та Satya Validators.
L1 Validators відповідають за безпеку та консенсус VANA. Мінімальна кількість для замороження, щоб стати L1 Validators, становить 35 000 VANA, початкових L1 Validators - 64, а згодом розшириться до 128. За кожен блок отримують 5 VANA, за збій буде накладено штраф у розмірі 10%, а нагорода зменшиться на 10% щорічно.
Satya Validators забезпечує довірене виконавче середовище (TEE) для перевірки даних, внесених користувачами, а також гарантує безпеку та конфіденційність процесу перевірки. Отже, отримуємо винагороду VANA.
4. Споживачі даних
Розробники моделей AI, як споживачі даних, вибирають і купують доступ до наборів даних, що відповідають вимогам розробки AI моделей, використовують інфраструктуру VANA для навчання AI та аналізу даних, співпрацюють з DataDAO для оптимізації моделей AI.
Наприклад, у ChatGPT DataDAO користувачі завантажують посилання на завантаження та файли даних, які шифруються та передаються Satya Validators. Після розшифровки Satya Validators перевіряють дані, щоб підтвердити їхню справжність без змін.
Сценарії застосування та економічна модель токена VANA
1. Валідатори заморожують VANA для забезпечення безпеки мережі та перевірки даних, отримуючи винагороду VANA;
2. VANA як газ для виконання контрактів у мережі, взаємодії DataDAO та інших операцій на ланцюзі;
3. Користувачі заморожують VANA в DataDAO, щоб отримати винагороду за заморожування VANA;
4. Споживачі даних за замовчуванням використовують VANA під час доступу до даних;
5. Власники VANA беруть участь в управлінні та голосують за пропозиції, VANA є основною торговою парою для токенів, випущених DataDAO.
Максимальна кількість VANA становить 120 мільйонів одиниць, розподіл токенів зображено на схемі нижче.
Спільнота
Основні аспекти включають винагороду за якісні дані DataDAO, аерозоль для ранніх користувачів і програмістів. TGE постачання становить 20,3% VANA, без терміну блокування.
Екосистема
Основні аспекти включають підтримку випуску токенів DataDAO, блокчейн-нагороди та партнерів; TGE постачання становить 4,8% VANA без блокування.
Інвестори
Vana наразі отримала загалом 25 мільйонів доларів фінансування, серед яких 5 мільйонів доларів стратегічного фінансування від Coinbase Ventures, 18 мільйонів доларів фінансування серії A від Paradigm та 2 мільйони доларів фінансування на початковій стадії від Polychain.
Основні учасники
Отже, під час TGE загальний обсяг VANA становитиме 30 мільйонів одиниць, з яких 4,8 мільйона VANA буде в програмі Binance Launchpool.
Юридичні ризики моделі VANA в Китаї
Даний децентралізований проект даних моделі AI VANA вирішує проблему даних для навчання AI моделей за більш низькою ціною, що дозволяє підприємцям моделей AI отримувати якісні дані для навчання, руйнуючи дані-острови, створені великими Інтернет-компаніями, і відкриваючи можливість Tencent отримувати дані користувачів Alibaba для навчання AI моделей, знижуючи бар'єри для окремих осіб і компаній, що прагнуть створити AI моделі, однак така модель може нести ризики вивезення даних в Китаї.
Державне управління Інтернетом опублікувало (Посібник з оцінки безпеки вивезення даних (перше видання)), де чітко зазначено, що дії з вивезення даних включають:
(1) Обробники даних передають та зберігають дані, зібрані та створені під час діяльності в країні, за кордон;
(2) Дані, зібрані та створені обробниками даних, зберігаються в країні, за кордоном установи, організації або особи можуть запитувати, отримувати, завантажувати, експортувати;
(3) Інші дії з вивезення даних, визначені Державним управлінням кібернетики.
(Закон Китаю про управління перетворенням та в'їздом) стаття 89 чітко визначає, що виїзд означає подорож з материкового Китаю в інші країни або регіони, з материкового Китаю в спеціальний адміністративний район Гонконг, спеціальний адміністративний район Макао, з материкового Китаю на Тайвань. З цього видно, що визначення виїзду базується на юрисдикції.
Створення DataDAO та внесення даних користувачами не має жодних обмежень, споживачі даних не зобов'язані проходити KYC, їм потрібно лише сплатити VANA, щоб отримати доступ до зібраних даних. У такому випадку участь користувачів з Китаю в різних DataDAO, які вносять дані з соціальних медіа та резюме, може стосуватися вивезення даних.
Визначення особистої інформації: відповідно до (Закону Китаю про кібербезпеку) статті 76: особиста інформація є інформацією, що може ідентифікувати особу, зафіксованою в електронній або іншій формі, включаючи, але не обмежуючись, ім'ям, датою народження, номером особи, біометричною інформацією, адресою, номером телефону тощо.
Зібрані DataDAO резюме, медичні дані можуть містити особисту інформацію, таку як ім'я, дата народження, номер телефону та навіть чутливу особисту інформацію. (Закон Китаю про захист особистої інформації) для використання та перетворення цих даних є обмеження.