Рейчел, Золотий фінанс

27 листопада Чжао Чанпень у X написав, що завдання, такі як маркування даних AI, дуже підходять для виконання через блокчейн, оскільки можна скористатися глобальною дешевою робочою силою та здійснювати миттєві платежі за допомогою криптовалюти, зламуючи географічні обмеження.

Маркування даних означає ручне або автоматизоване маркування сирих даних (таких як текст, зображення, аудіо тощо), щоб надати їм певну структуровану інформацію. Марковані дані використовуються для навчання моделей машинного навчання або штучного інтелекту, наприклад, маркування тексту за категоріями емоцій (позитивна, негативна, нейтральна) є одним із видів маркування даних. Використання блокчейну для маркування даних штучного інтелекту особливо підходить для сценаріїв маркування даних, які потребують високої прозорості, надійності та розподіленої співпраці. Це не тільки може підвищити ефективність і якість маркування даних, але й створити нові можливості для глобальної співпраці та торгівлі даними.

На сьогодні які якісні проекти існують у цій галузі? Які перспективи розвитку цієї галузі?

Роль блокчейну в маркуванні даних AI

Блокчейн - це децентралізована технологія розподіленого реєстру, яка має такі характеристики, як прозорість, незмінність і простежуваність. Ці характеристики можуть вирішити такі проблеми традиційних методів у маркуванні даних:

  • Справжність даних і захист від підробок: кожен запис маркування зберігається в блокчейні, що унеможливлює його довільну зміну, забезпечуючи довіру до маркування.

  • Прозорість розподілу завдань: блокчейн може фіксувати процеси розподілу, виконання та перевірки завдань, запобігаючи несправедливому розподілу завдань або спотворенню результатів.

  • Система стимулів: використовуючи технологію смарт-контрактів блокчейну, маркувальники даних можуть автоматично отримувати криптовалюту або інші винагороди за виконання завдань.

  • Відстеження даних: джерело кожного маркування, інформація про маркувальника та рецензента можуть бути відстежені.

Сценарії застосування

  • Розподілене маркування: використовуючи блокчейн, завдання з маркування даних розподіляються між маркувальниками по всьому світу, що підвищує ефективність обробки даних.

  • Перевірка якості: результати маркування кількох людей перевіряються за допомогою технології блокчейну, щоб забезпечити точність маркування.

  • Торгівля маркованими даними: марковані дані можуть торгуватися на блокчейні, при цьому продавці та покупці не повинні турбуватися про цілісність або справжність даних.

  • Захист приватності: використання блокчейну для шифрування та зберігання маркованих даних, щоб забезпечити безпеку приватних даних.

Супутні проекти

  • OORT DataHub: забезпечує децентралізовані послуги маркування даних на основі блокчейну, використовує алгоритм Proof of Honesty для контролю якості. Платформа розподіляє завдання через смарт-контракти, перевіряє якість даних і виплачує винагороду, залучаючи маркувальників з усього світу та забезпечуючи прозорість маркованих даних і захист приватності.

Економічна модель токенів проекту виглядає наступним чином:

Винагорода спільноти: через участь у маркуванні та аналізі даних користувачі можуть отримувати винагороду у вигляді токенів $OORT. Крім того, можливо отримати унікальні NFT, пов'язані з внеском, які надають додаткові права, такі як винагороди за підвищення річної прибутковості (APY), знижки на обладнання та право голосу в DAO.

Застава за завдання: учасники повинні закласти щонайменше 210 токенів $OORT, щоб підтвердити свою відданість завданню, токени повертаються після виконання завдання і виплачуються винагороди.

Розподіл доходів від продажу: деякі власники NFT також можуть отримувати дивіденди з майбутніх доходів від продажу даних, що ще більше підвищує довгострокову прибутковість.

  • PublicAI: проект AI в екосистемі Solana, мета якого - зв'язати замовників даних та глобальних маркувальників, винагороджуючи учасників через механізм стимулювання криптовалютами, одночасно використовуючи технології блокчейну для фіксації деталей процесу маркування, щоб забезпечити безпеку та приватність даних.

Економічна модель токенів проекту виглядає наступним чином:

Винагорода спільноти: 10% токенів Public буде використано для винагороди за попередню взаємодію користувачів, зокрема існує три способи отримання аердропу: стати AI Builder: збирати якісний контент з Інтернету; стати AI Validator: перевіряти зібраний контент; стати AI Developer: використовувати перевірені набори даних для навчання AI агентів.

Розподіл токенів: проект завершив раунд початкового фінансування в 2 мільйони доларів у січні 2024 року, інвесторами є IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital та кілька відомих професорів у галузі штучного інтелекту, наразі деталі розподілу токенів PublicAI ще не визначені.

Виклики, з якими стикаємося

На сьогодні кілька факторів стримують розвиток цієї галузі: по-перше, маркування даних AI потребує значних обчислювальних і зберігаючих ресурсів; по-друге, продуктивність проекту обмежена масштабуванням блокчейну; по-третє, стандартизація технологій і регулювання ще не досконалі.

По-друге, це, можливо, найбільший виклик, з яким ми стикаємося сьогодні. Оскільки маркування даних AI та навчання моделей зазвичай потребують значних обчислювальних ресурсів, а обчислювальна потужність вузлів у блокчейн-мережі обмежена. Як ефективно інтегрувати та використовувати розподілені обчислювальні ресурси для задоволення обчислювальних потреб проектів маркування даних AI з урахуванням децентралізованих характеристик блокчейну є питанням, яке потребує термінового вирішення. Відомо, що Greenfield, що належить Binance, надає підтримку зберігання для цієї галузі, сподіваючись на більше зберігання та обчислювальних ресурсів у цій сфері.