reddit dao

O Cryptonomist entrevistou Anna Kazlauskas, CEO e cofundadora da Vana’s, que Reddit Data DAO, que na primeira semana viu 140 mil usuários se inscreverem com contas verificadas do Reddit. Anna agora está trabalhando com desenvolvedores para criar Data DAOs para outras plataformas, como LinkedIn e ChatGPT. 

Além dos DAOs, eles têm outros meios para os usuários agruparem seus dados em conjuntos de dados que podem então ser usados ​​para treinamento de modelos GenAI, como a criação de retratos ou avatares.

Além do que Vana está fazendo, com Anna conversamos sobre o crescimento do espaço descentralizado de IA, à medida que as plataformas ajudam as pessoas a usar e monetizar seus dados para novas aplicações. 

Você pode fornecer uma visão geral de Vana e sua missão no espaço descentralizado de IA?

Vana é uma plataforma de IA de propriedade do usuário, alimentada por dados de propriedade do usuário. Nossa missão é que os usuários sejam proprietários de seus dados e do valor que eles criam por meio de modelos de IA. Há uma necessidade crescente de mais dados de treinamento para melhorar o desempenho do modelo de IA, já que, em última análise, os modelos de IA são tão bons quanto seus dados. 

Por exemplo, o LLaMA 3 é treinado em cerca de 15 trilhões de palavras, que é aproximadamente a quantidade de dados disponíveis na Internet pública. As empresas estão agora a tentar adquirir mais dados, por vezes pagando centenas de milhões de dólares por isso. As principais plataformas tecnológicas estão a acumular dados valiosos dos utilizadores e a construir novas tecnologias sem considerar as permissões dos utilizadores, o que está a atrasar a inovação. 

Na Vana, estamos liberando dados desses jardins murados, colocando-os sob controle do usuário. Permitimos que os usuários contribuam diretamente com modelos de IA, escolham como seus dados serão usados ​​e como a IA será usada. Acreditamos que podemos realmente superar os modelos líderes se pudermos acessar os melhores dados – superando o desempenho de modelos como o GPT-6, acessando dados disponíveis apenas diretamente dos usuários. Vana é arquitetada como um blockchain de camada 1 projetado desde o início para dados privados de propriedade do usuário. 

O Reddit Data DAO viu 140 mil usuários se inscreverem na primeira semana. O que você acha que motivou essa rápida adoção e que lições você aprendeu com esse lançamento?

O Reddit Data DAO foi um sucesso incrível do ponto de vista da adoção, com mais de 140 mil usuários se inscrevendo na primeira semana. Este nível de adoção é incomum para DAOs – é agora o maior DAO de dados da história. 

Uma das coisas que impulsionou a rápida adoção é que grande parte da história já havia sido exposta, à medida que os usuários estão se tornando cada vez mais conscientes do valor dos seus dados através da cobertura da imprensa sobre as vendas de dados. Perceber que o Reddit está vendendo seus dados por US$ 200 milhões ou que a Apple está comprando dados por US$ 50 milhões torna você muito mais consciente de seu valor. 

Há também um grande apetite por produtos de propriedade do usuário desenvolvidos em web3 que vão além dos produtos DeFi familiares para uma nova fronteira de propriedade. Estamos vendo essa tendência em projetos como Farcaster, redes DePIN e DAOs de dados construídos em Vana, que representam uma nova onda de produtos de propriedade do usuário.

Uma lição importante foi a necessidade de comprovação dos requisitos de contribuição. Mais de um milhão de pessoas tentaram ingressar no Reddit Data DAO, mas muitas não atenderam aos critérios de ter uma conta Reddit que já existe há um certo tempo e tem uma quantidade mínima de dados. Isto destaca a importância de ter mecanismos para garantir contribuições de qualidade.

Você mencionou planos para criar Data DAOs para plataformas como LinkedIn e Chat GPT. Que desafios e oportunidades únicos você vê na expansão para essas plataformas?

Vana é uma rede ponto a ponto para dados de propriedade do usuário, e os construtores criaram vários DAOs de dados, como Reddit Data DAO, LinkedIn Data DAO e ChatGPT Data DAO. 

Essas diferentes fontes de dados são extremamente valiosas para o treinamento de modelos de IA, mas atualmente estão trancadas em jardins murados. Pode ser difícil extrair dados de cada uma dessas plataformas, mas é sempre possível devido à regulamentação de dados. 

Como Vana capacita os usuários a monetizar seus dados e quais são alguns exemplos de como os usuários se beneficiaram com isso?

Nosso objetivo é ajudar os usuários a monetizar e proteger seus dados simultaneamente. Por exemplo, com o Reddit Data DAO, eles agora estão treinando um modelo de propriedade do usuário (focado principalmente em shitposting neste estágio, mas é um começo). Os usuários são pagos sempre que o modelo é utilizado, criando um incentivo econômico para a propriedade conjunta do modelo. 

E os dados do usuário permanecem totalmente privados – em vez de vendê-los, os dados são apenas “alugados”, onde os dados subjacentes nunca saem do ambiente seguro. 

Com a crescente preocupação com a privacidade dos dados, como a Vana garante que os dados do usuário sejam seguros e usados ​​de forma ética dentro dos Data DAOs?

A privacidade dos dados deixou de ser apenas uma questão ideológica ou de preferência para se tornar uma questão económica. Se alguém tiver seus dados, poderá criar uma versão sua de IA que seja economicamente valiosa, gerando receita e potencialmente competindo com você. É por isso que a privacidade é tão importante e fundamental para Vana. 

Inventámos um conceito chamado “dados sem custódia”, que é semelhante a uma carteira sem custódia, mas para os seus dados pessoais. Ele mantém seus dados sob seu controle total, com permissão de sua chave privada. Isso permite que seus dados sejam portáveis ​​entre aplicativos e adiciona uma camada financeira nativa, permitindo a construção de coisas como DAOs de dados.

Como os conjuntos de dados criados por meio dos Data DAOs da Vana melhoram o treinamento de modelos generativos de IA e quais vantagens eles oferecem em relação aos conjuntos de dados tradicionais?

Normalmente, os modelos de IA são treinados com dados extraídos da Internet pública – dados que estão disponíveis sem login em qualquer lugar. Mas se você pensar nisso do ponto de vista de ensinar uma criança sobre o mundo, você não iria querer que ela simplesmente vagasse aleatoriamente pela Internet pública. Você gostaria de fornecer a eles informações de alta qualidade que podem não estar disponíveis publicamente – coisas como redação, processos de pensamento ou mensagens de alta qualidade. A IA é treinada principalmente em dados públicos, mas realmente precisa de dados privados para ultrapassar fronteiras. Isto é o que os DAOs de dados permitem: usuários contribuindo com seus dados privados para criar IA de propriedade do usuário. 

Acreditamos que a IA deveria ser criada mais como um software de código aberto, por uma comunidade. Nosso objetivo é dar aos pesquisadores acesso aos melhores conjuntos de dados que estão atualmente mantidos em cativeiro dentro de jardins murados para ampliar as fronteiras do desempenho da IA.

Que tendências você prevê no espaço descentralizado de IA nos próximos 5 a 10 anos e como a Vana está se posicionando para liderar neste cenário em evolução?

O espaço descentralizado de IA realmente acelerou no ano passado. Por exemplo, na EthCC deste ano, houve um evento de IA descentralizada quase todos os dias, em comparação com nenhum evento no ano passado. As pessoas estão descobrindo como aplicar tecnologias soberanas que funcionaram bem para finanças no espaço da IA. Na Vana, acreditamos que a base de tudo isso são os dados. Para construir IA de propriedade do usuário e IA soberana, você precisa de dados de propriedade do usuário, portanto, nosso foco está nesses dados.

Nos próximos 5 a 10 anos, estou entusiasmado com alguns marcos: 1) Um modelo de base de propriedade do usuário, de propriedade coletiva de 100 milhões de pessoas. 2) Agentes de IA mais autônomos que possam ganhar por conta própria e garantir que esses agentes sejam realmente propriedade dos usuários que contribuíram para treiná-los. 

Dado que a IA desempenha um papel económico cada vez mais importante, garante que o poder é amplamente distribuído, tanto do ponto de vista técnico como social. 

Você pode compartilhar mais sobre sua colaboração com desenvolvedores para construir Data DAOs? Quais são alguns dos projetos inovadores atualmente em preparação?

Vana é uma rede sem permissão, então qualquer pessoa pode construir um DAO de dados. É um blockchain de camada um projetado desde o início para dados privados de propriedade do usuário. Existem mais de 100 DAOs de dados implantados na testnet Satori hoje. Muitos dos construtores são participantes iniciais do ecossistema Bittensor e entendem profundamente a interseção entre criptografia e IA. Alguns projetos notáveis ​​incluem Twitter Data DAO, LinkedIn Data DAO e GitHub Data DAO. Também estamos fazendo parceria com projetos no espaço ZK e no espaço de ferramentas DAO para tornar os DAOs de dados ainda mais fáceis de criar e gerenciar.

Quais são as considerações éticas mais prementes no desenvolvimento da IA ​​descentralizada e como é que Vana aborda estas questões?

Acho que uma das maiores questões da IA ​​hoje é quem deve possuir os modelos e decidir quais dados serão inseridos neles. À medida que começamos a confiar cada vez mais na IA para obter informações, elas se tornam nossa fonte de verdade. Quem decide o que acontece na IA está essencialmente decidindo a verdade. É assustador ter uma única entidade controlando isso. Nossa visão na Vana é que a comunidade, e não uma única empresa, deve tomar essas decisões.

Uma outra questão que surge na IA descentralizada é: se a IA for totalmente descentralizada, e se a IA se tornar desonesta e não houver botão para desligar? A forma como abordamos isso na Vana é que os modelos de IA pertencem, em última análise, aos usuários que contribuíram para eles, para que eles sempre permaneçam no controle total. 

Que conselho você daria aos aspirantes a empreendedores que desejam entrar no espaço descentralizado de IA, com base em suas experiências com Vana e Data DAOs?

É um ótimo momento para começar a construir no espaço descentralizado de IA. Há muitas oportunidades de aplicar algumas das primitivas criptoeconômicas que funcionaram bem para o DeFi à nova categoria emergente de dados descentralizados e IA. Eu também recomendo passar algum tempo mergulhando no espaço de IA de código aberto e não criptográfico para aprender sobre algumas das abordagens que as pessoas estão adotando fora de um contexto criptográfico. Eu mergulharia em alguns dos projetos existentes para ver que tipo de primitivos estão disponíveis para construção, incluindo tentar iniciar um DAO de dados em Vana.