reddit dao

Криптономист взял интервью у Анны Казлаускас, генерального директора и соучредителя Vana’s, Reddit Data DAO, где за первую неделю зарегистрировалось 140 тысяч пользователей с подтвержденными учетными записями Reddit. Сейчас Анна работает с разработчиками над созданием Data DAO для других платформ, таких как LinkedIn и ChatGPT. 

Помимо DAO, у них есть и другие возможности, позволяющие пользователям объединять свои данные в наборы данных, которые затем можно использовать для обучения моделей GenAI, например для создания портретов или аватаров.

Помимо того, что делает Вана, мы с Анной говорили о росте децентрализованного пространства искусственного интеллекта, поскольку платформы помогают людям использовать и монетизировать свои данные для новых приложений. 

Можете ли вы дать обзор Vana и ее миссии в децентрализованном пространстве ИИ?

Vana — это принадлежащая пользователям платформа искусственного интеллекта, работающая на основе принадлежащих пользователям данных. Наша миссия — предоставить пользователям возможность владеть своими данными и ценностью, которую они создают, с помощью моделей искусственного интеллекта. Растет потребность в большем количестве обучающих данных для повышения производительности моделей ИИ, поскольку в конечном итоге модели ИИ хороши настолько, насколько хороши их данные. 

Например, LLaMA 3 обучен примерно на 15 триллионах слов, что примерно соответствует объему данных, доступных в общедоступном Интернете. Сейчас компании пытаются получить больше данных, иногда платя за это сотни миллионов долларов. Крупные технологические платформы накапливают ценные пользовательские данные и создают новые технологии, не принимая во внимание разрешения пользователей, что сдерживает инновации. 

В Vana мы освобождаем данные из этих огороженных садов, ставя их под контроль пользователей. Мы позволяем пользователям напрямую вносить вклад в модели ИИ, выбирать, как использовать их данные и как использовать ИИ. Мы считаем, что сможем превзойти ведущие модели, если сможем получить доступ к самым лучшим данным, превзойдя производительность таких моделей, как GPT-6, за счет доступа к данным, доступным только непосредственно от пользователей. Vana спроектирована как блокчейн уровня 1, разработанный с нуля для частных данных, принадлежащих пользователям. 

За первую неделю в Reddit Data DAO зарегистрировалось 140 тысяч пользователей. Как вы думаете, что послужило причиной такого быстрого внедрения и какие уроки вы извлекли из этого запуска?

Reddit Data DAO имел невероятный успех с точки зрения внедрения: за первую неделю на него зарегистрировалось более 140 тысяч пользователей. Такой уровень внедрения необычен для ДАО: сейчас это крупнейшая ДАО данных в истории. 

Одной из причин быстрого внедрения является то, что большая часть истории уже была изложена, поскольку пользователи все больше и больше осознают ценность своих данных благодаря освещению в прессе продаж данных. Понимая, что Reddit продает ваши данные за 200 миллионов долларов или что Apple скупает данные за 50 миллионов долларов, вы гораздо лучше осознаете их ценность. 

Также существует большой интерес к продуктам, принадлежащим пользователям, созданным в web3, которые выходят за рамки привычных продуктов DeFi и выходят на новый уровень владения. Мы наблюдаем эту тенденцию в таких проектах, как Farcaster, сетях DePIN и DAO данных, построенных на Vana, которые представляют собой новую волну продуктов, принадлежащих пользователям.

Одним из важных уроков стала необходимость подтверждения требований о вкладе. Более миллиона человек пытались присоединиться к Reddit Data DAO, но многие из них не соответствовали критериям наличия учетной записи Reddit, существующей в течение определенного времени и содержащей минимальный объем данных. Это подчеркивает важность наличия механизмов для обеспечения качественного вклада.

Вы упомянули о планах по созданию Data DAO для таких платформ, как LinkedIn и Chat GPT. Какие уникальные проблемы и возможности вы видите в переходе на эти платформы?

Vana — это одноранговая сеть для данных, принадлежащих пользователям, и разработчики создали различные DAO данных, такие как Reddit Data DAO, LinkedIn Data DAO и ChatGPT Data DAO. 

Эти различные источники данных невероятно ценны для обучения моделей ИИ, но в настоящее время они заперты в огороженных садах. Из каждой из этих платформ может быть сложно получить данные, но это всегда возможно благодаря регулированию данных. 

Как Vana позволяет пользователям монетизировать свои данные и каковы примеры того, какую пользу пользователи от этого получили?

Наша цель — помочь пользователям одновременно монетизировать и защитить свои данные. Например, с помощью Reddit Data DAO они сейчас обучают модель, принадлежащую пользователю (на данном этапе в основном сосредоточены на постинге, но это только начало). Пользователи получают оплату каждый раз, когда используется модель, что создает экономический стимул для совместного владения моделью. 

А пользовательские данные остаются полностью конфиденциальными — вместо того, чтобы продавать данные, данные просто «арендуются», при этом базовые данные никогда не покидают безопасную среду. 

Учитывая растущую озабоченность по поводу конфиденциальности данных, как Vana обеспечивает безопасность пользовательских данных и их этичное использование в Data DAO?

Конфиденциальность данных превратилась из просто идеологического вопроса или вопроса предпочтений в экономический вопрос. Если у кого-то есть ваши данные, он потенциально может создать вашу ИИ-версию, которая будет экономически ценна, будет приносить доход и потенциально конкурировать с вами. Вот почему конфиденциальность так важна и важна для Vana. 

Мы изобрели концепцию под названием «данные, не связанные с хранением», которая аналогична кошельку, не связанному с хранением, но содержит ваши личные данные. Он держит ваши данные под вашим полным контролем, разрешенным вашим закрытым ключом. Это позволяет переносить ваши данные между приложениями и добавляет собственный финансовый уровень сверху, позволяя создавать такие вещи, как DAO данных.

Как наборы данных, созданные с помощью Data DAO Vana, улучшают обучение генеративных моделей ИИ и какие преимущества они предлагают по сравнению с традиционными наборами данных?

Обычно модели ИИ обучаются на данных, полученных из общедоступного Интернета — данных, которые доступны без входа в систему где угодно. Но если вы подумаете об этом с точки зрения обучения ребенка миру, вы не захотите, чтобы он просто беспорядочно бродил по общедоступному Интернету. Вы хотели бы предоставить им высококачественную информацию, которая может быть недоступна публично – например, высококачественные тексты, мыслительные процессы или сообщения. ИИ в первую очередь обучается на общедоступных данных, но ему действительно нужны частные данные, чтобы расширять границы. Вот что позволяют данные DAO: пользователи предоставляют свои личные данные для создания ИИ, принадлежащего пользователям. 

Мы считаем, что искусственный интеллект должен создаваться сообществом как программное обеспечение с открытым исходным кодом. Наша цель — предоставить исследователям доступ к лучшим наборам данных, которые в настоящее время хранятся в огороженных садах, чтобы расширить границы производительности ИИ.

Какие тенденции вы предвидите в сфере децентрализованного ИИ в ближайшие 5–10 лет и как Vana позиционирует себя как лидера в этой развивающейся сфере?

За последний год децентрализованное пространство искусственного интеллекта действительно ускорилось. Например, на EthCC в этом году децентрализованное мероприятие по искусственному интеллекту проводилось почти каждый день, по сравнению с ни одним в прошлом году. Люди придумывают, как применить суверенные технологии, которые хорошо зарекомендовали себя в сфере финансов, в сфере искусственного интеллекта. Мы в Vana считаем, что основой всего этого являются данные. Чтобы создать ИИ, принадлежащий пользователям, и суверенный ИИ, вам нужны данные, принадлежащие пользователям, поэтому наше внимание сосредоточено на этой части данных.

В ближайшие 5-10 лет я с нетерпением жду нескольких вех: 1) Модель фонда, принадлежащая пользователям, которой коллективно владеют 100 миллионов человек. 2) Больше автономных агентов ИИ, которые могут зарабатывать самостоятельно, и обеспечение того, чтобы эти агенты действительно принадлежали пользователям, которые участвовали в их обучении. 

Поскольку ИИ играет все более важную экономическую роль, обеспечивая широкое распределение власти как с технической, так и с социальной точки зрения. 

Можете ли вы рассказать больше о своем сотрудничестве с разработчиками при создании Data DAO? Какие инновационные проекты сейчас находятся в разработке?

Vana — это сеть без разрешений, поэтому любой может создать DAO данных. Это блокчейн первого уровня, разработанный с нуля для частных данных, принадлежащих пользователям. Сегодня в тестовой сети Satori развернуто более 100 ДАО данных. Многие из разработчиков являются ранними участниками экосистемы Bittensor и глубоко понимают пересечение криптовалюты и искусственного интеллекта. Некоторые известные проекты включают Twitter Data DAO, LinkedIn Data DAO и GitHub Data DAO. Мы также сотрудничаем с проектами в области ZK и инструментов DAO, чтобы сделать создание и управление данными DAO еще проще.

Какие этические соображения наиболее актуальны при разработке децентрализованного ИИ и как Vana решает эти проблемы?

Я думаю, что один из самых важных вопросов в сфере искусственного интеллекта сегодня заключается в том, кто должен владеть моделями и решать, какие данные в них подаются. Поскольку мы начинаем все больше и больше полагаться на ИИ в получении информации, они становятся нашим источником истины. Тот, кто решает, что входит в ИИ, по сути определяет истину. Страшно, когда это контролирует одна организация. По нашему мнению в Vana, эти решения должно принимать сообщество, а не отдельная компания.

Еще один вопрос, который возникает в связи с децентрализованным ИИ: если ИИ полностью децентрализован, что, если ИИ выйдет из строя и у него не будет кнопки выключения? В Vana мы подходим к этому так, что модели ИИ в конечном итоге принадлежат пользователям, которые внесли в них свой вклад, поэтому они всегда сохраняют полный контроль. 

Какой совет вы бы дали начинающим предпринимателям, желающим войти в децентрализованное пространство искусственного интеллекта, основываясь на своем опыте работы с Vana и Data DAO?

Это прекрасное время, чтобы начать строить децентрализованное пространство ИИ. Существует много возможностей применить некоторые криптоэкономические примитивы, которые хорошо зарекомендовали себя в DeFi, к новой развивающейся категории децентрализованных данных и искусственного интеллекта. Я бы также рекомендовал потратить некоторое время на погружение в некриптографическое пространство искусственного интеллекта с открытым исходным кодом, чтобы узнать о некоторых подходах, которые люди используют вне криптографического контекста. Я бы погрузился в некоторые из существующих проектов, чтобы посмотреть, какие примитивы доступны для сборки, включая попытку запустить DAO данных на Vana.