reddit dao

The Cryptonomist przeprowadził wywiad z Anną Kazlauskas, dyrektor generalną i współzałożycielką Vana’s, czyli DAO Reddit Data, w którym w pierwszym tygodniu zarejestrowało się 140 tys. użytkowników przy użyciu zweryfikowanych kont Reddit. Anna współpracuje obecnie z programistami przy tworzeniu Data DAO dla innych platform, takich jak LinkedIn i ChatGPT. 

Oprócz DAO mają one inne możliwości, dzięki którym użytkownicy mogą łączyć swoje dane w zbiory danych, które można następnie wykorzystać do szkolenia modeli GenAI, na przykład tworzenia portretów lub awatarów.

Poza tym, czym zajmuje się Vana, rozmawialiśmy z Anną o rozwoju zdecentralizowanej przestrzeni AI, ponieważ platformy pomagają ludziom wykorzystywać dane i zarabiać na nich w nowych aplikacjach. 

Czy możesz przedstawić przegląd Vany i jej misji w zdecentralizowanej przestrzeni AI?

Vana to należąca do użytkownika platforma AI zasilana danymi należącymi do użytkowników. Naszą misją jest, aby użytkownicy byli właścicielami swoich danych i wartości, jaką tworzą dzięki modelom AI. Rośnie zapotrzebowanie na więcej danych szkoleniowych, aby poprawić wydajność modelu AI, ponieważ ostatecznie modele AI są tak dobre, jak ich dane. 

Na przykład LLaMA 3 jest trenowana na około 15 bilionach słów, co stanowi w przybliżeniu ilość danych dostępnych w publicznym Internecie. Firmy starają się obecnie pozyskać więcej danych, płacąc za to czasami setki milionów dolarów. Główne platformy technologiczne gromadzą cenne dane użytkowników i tworzą nowe technologie bez uwzględniania uprawnień użytkowników, co hamuje innowacje. 

W Vana uwalniamy dane z otoczonych murem ogrodów, oddając je pod kontrolę użytkownika. Umożliwiamy użytkownikom bezpośredni wkład w modele sztucznej inteligencji, wybór sposobu wykorzystania ich danych i sposobu wykorzystania sztucznej inteligencji. Wierzymy, że możemy faktycznie osiągnąć lepsze wyniki niż wiodące modele, jeśli uda nam się uzyskać dostęp do najlepszych danych, pokonując tym samym wydajność modeli takich jak GPT-6, uzyskując dostęp do danych dostępnych wyłącznie bezpośrednio od użytkowników. Vana została zaprojektowana jako blockchain warstwy 1 zaprojektowany od podstaw z myślą o prywatnych danych będących własnością użytkownika. 

W pierwszym tygodniu do Reddit Data DAO zarejestrowało się 140 tys. użytkowników. Jak myślisz, co spowodowało to szybkie przyjęcie i jakie wnioski wyciągnąłeś z tej premiery?

Reddit Data DAO było niesamowitym sukcesem z punktu widzenia adopcji – w pierwszym tygodniu zarejestrowało się ponad 140 tys. użytkowników. Ten poziom adopcji jest niezwykły w przypadku DAO – jest to obecnie największe DAO danych w historii. 

Jedną z przyczyn szybkiego przyjęcia rozwiązania jest fakt, że większość historii została już opowiedziana, ponieważ użytkownicy stają się coraz bardziej świadomi wartości swoich danych dzięki doniesieniom prasowym na temat sprzedaży danych. Uświadomienie sobie, że Reddit sprzedaje Twoje dane za 200 milionów dolarów lub że Apple kupuje dane za 50 milionów dolarów, sprawia, że ​​jesteś znacznie bardziej świadomy ich wartości. 

Istnieje również duży apetyt na produkty należące do użytkowników, zbudowane w web3, które wykraczają poza znane produkty DeFi i wkraczają w nowe granice własności. Obserwujemy ten trend w projektach takich jak Farcaster, sieci DePIN i DAO danych zbudowane na platformie Vana, które reprezentują nową falę produktów będących własnością użytkowników.

Ważną lekcją była potrzeba przedstawienia dowodu spełnienia wymagań dotyczących składek. Ponad milion osób próbowało dołączyć do DAO Reddit Data, ale wiele z nich nie spełniało kryteriów posiadania konta Reddit, które istnieje od pewnego czasu i zawiera minimalną ilość danych. Podkreśla to znaczenie posiadania mechanizmów zapewniających wysoką jakość wkładów.

Wspomniałeś o planach stworzenia Data DAO dla platform takich jak LinkedIn i Chat GPT. Jakie wyjątkowe wyzwania i możliwości widzisz w ekspansji na te platformy?

Vana to sieć peer to peer dla danych należących do użytkowników, a twórcy stworzyli różne DAO danych, takie jak DAO danych Reddit, DAO danych LinkedIn i DAO danych ChatGPT. 

Te różne źródła danych są niezwykle cenne przy szkoleniu modeli sztucznej inteligencji, ale obecnie są zamknięte w otoczonych murem ogrodach. Pobranie danych z każdej z tych platform może być trudne, ale zawsze jest to możliwe ze względu na regulacje dotyczące danych. 

W jaki sposób Vana umożliwia użytkownikom zarabianie na danych i jakie są przykłady korzyści, jakie użytkownicy z tego skorzystali?

Naszym celem jest pomóc użytkownikom jednocześnie zarabiać i chronić swoje dane. Na przykład w ramach DAO Reddit Data trenują teraz model będący własnością użytkownika (na tym etapie skupia się głównie na zamieszczaniu shitpostów, ale to początek). Użytkownicy otrzymują wynagrodzenie za każdym razem, gdy używany jest model, co stanowi zachętę ekonomiczną do współwłasności modelu. 

Dane użytkowników pozostają w pełni prywatne – zamiast je sprzedawać, dane są po prostu „wynajmowane”, a dane źródłowe nigdy nie opuszczają bezpiecznego środowiska. 

W obliczu rosnących obaw związanych z prywatnością danych, w jaki sposób Vana zapewnia bezpieczeństwo danych użytkowników i ich etyczne wykorzystanie w ramach Data DAO?

Prywatność danych przestała być kwestią ideologiczną lub preferencji i stała się kwestią ekonomiczną. Jeśli ktoś ma Twoje dane, może potencjalnie stworzyć Twoją wersję sztucznej inteligencji, która jest ekonomicznie wartościowa, generuje przychody i potencjalnie konkuruje z Tobą. Dlatego prywatność jest tak ważna i kluczowa dla Vany. 

Wymyśliliśmy koncepcję zwaną „danymi niepowierniczymi”, która jest podobna do portfela niezabezpieczonego, ale dotyczy Twoich danych osobowych. Dzięki Twojemu kluczowi prywatnemu Twoje dane są pod Twoją pełną kontrolą. Umożliwia to przenoszenie danych między aplikacjami i dodaje natywną warstwę finansową, umożliwiając tworzenie takich obiektów, jak DAO danych.

W jaki sposób zbiory danych utworzone za pomocą rozwiązań DAO firmy Vana usprawniają uczenie generatywnych modeli sztucznej inteligencji i jakie zalety oferują w porównaniu z tradycyjnymi zbiorami danych?

Zazwyczaj modele sztucznej inteligencji są szkolone na podstawie danych pobranych z publicznego Internetu – danych, które są dostępne bez konieczności logowania się w dowolnym miejscu. Ale jeśli pomyślisz o tym z perspektywy nauczania dziecka o świecie, nie chciałbyś, aby po prostu błąkało się losowo po publicznym Internecie. Chcesz zapewnić im wysokiej jakości informacje, które mogą nie być publicznie dostępne – na przykład wysokiej jakości teksty, procesy myślowe lub wiadomości. Sztuczna inteligencja szkoli się głównie na danych publicznych, ale naprawdę potrzebuje danych prywatnych, aby przesuwać granice. Oto, co umożliwiają dane DAO: użytkownicy udostępniają swoje prywatne dane, aby stworzyć sztuczną inteligencję należącą do użytkowników. 

Wierzymy, że sztuczna inteligencja powinna być tworzona przez społeczność bardziej na wzór oprogramowania open source. Naszym celem jest zapewnienie badaczom dostępu do najlepszych zbiorów danych, które są obecnie przechowywane w otoczonych murami ogrodach, aby przesuwać granice wydajności sztucznej inteligencji.

Jakie trendy przewidujesz w zdecentralizowanej przestrzeni sztucznej inteligencji na najbliższe 5–10 lat i jak Vana może zająć pozycję lidera w tym rozwijającym się krajobrazie?

W ciągu ostatniego roku zdecentralizowana przestrzeń sztucznej inteligencji naprawdę przyspieszyła. Na przykład w tym roku w EthCC prawie codziennie odbywało się zdecentralizowane wydarzenie dotyczące sztucznej inteligencji, w porównaniu do żadnego w zeszłym roku. Ludzie zastanawiają się, jak zastosować suwerenne technologie, które sprawdziły się w finansach w przestrzeni sztucznej inteligencji. W Vana wierzymy, że podstawą tego wszystkiego są dane. Aby zbudować sztuczną inteligencję należącą do użytkownika i suwerenną sztuczną inteligencję, potrzebne są dane należące do użytkownika, dlatego skupiamy się na tym fragmencie danych.

Jestem podekscytowany kilkoma kamieniami milowymi w ciągu najbliższych 5–10 lat: 1) Model fundacji będący własnością użytkownika, będący zbiorową własnością 100 milionów ludzi. 2) Więcej autonomicznych agentów AI, którzy mogą samodzielnie zarabiać, i zapewnienie, że ci agenci rzeczywiście należą do użytkowników, którzy przyczynili się do ich przeszkolenia. 

Ponieważ sztuczna inteligencja odgrywa coraz ważniejszą rolę gospodarczą, zapewniając szeroką dystrybucję władzy zarówno z punktu widzenia technicznego, jak i społecznego. 

Czy możesz podzielić się więcej na temat swojej współpracy z programistami przy tworzeniu Data DAO? Jakie innowacyjne projekty są obecnie w przygotowaniu?

Vana to sieć niewymagająca uprawnień, więc każdy może zbudować DAO danych. Jest to łańcuch bloków pierwszej warstwy zaprojektowany od podstaw z myślą o prywatnych danych będących własnością użytkownika. Obecnie w sieci testowej Satori wdrożono ponad 100 obiektów DAO danych. Wielu twórców to pierwsi uczestnicy ekosystemu Bittensor, którzy głęboko rozumieją skrzyżowanie kryptowalut i sztucznej inteligencji. Niektóre godne uwagi projekty obejmują Twitter Data DAO, LinkedIn Data DAO i GitHub Data DAO. Współpracujemy również z projektami w przestrzeni ZK i przestrzeni narzędzi DAO, aby jeszcze bardziej ułatwić tworzenie danych DAO i zarządzanie nimi.

Jakie względy etyczne są najpilniejsze w rozwoju zdecentralizowanej sztucznej inteligencji i jak Vana radzi sobie z tymi kwestiami?

Myślę, że jednym z największych pytań w dzisiejszej sztucznej inteligencji jest to, kto powinien być właścicielem modeli i decydować, jakie dane mają być w nich umieszczane. W miarę jak zaczynamy w coraz większym stopniu polegać na sztucznej inteligencji, staje się ona naszym źródłem prawdy. Ktokolwiek decyduje o tym, co trafia do sztucznej inteligencji, zasadniczo decyduje o prawdzie. To przerażające, że kontroluje to jeden podmiot. W firmie Vana uważamy, że takie decyzje powinna podejmować społeczność, a nie pojedyncza firma.

Jeszcze jedno pytanie, które pojawia się w przypadku zdecentralizowanej sztucznej inteligencji, brzmi: jeśli sztuczna inteligencja jest w pełni zdecentralizowana, to co się stanie, jeśli sztuczna inteligencja stanie się nieuczciwa i nie będzie przycisku wyłączania? W Vana podchodzimy do tego w taki sposób, że ostatecznie modele AI są własnością użytkowników, którzy wnieśli do nich swój wkład, dzięki czemu zawsze mają pełną kontrolę. 

Jakiej rady udzieliłbyś początkującym przedsiębiorcom, którzy chcą wejść do zdecentralizowanej przestrzeni AI, w oparciu o swoje doświadczenia z Vana i Data DAO?

To świetny czas, aby rozpocząć budowanie w zdecentralizowanej przestrzeni AI. Istnieje wiele możliwości zastosowania niektórych prymitywów kryptoekonomicznych, które sprawdziły się w przypadku DeFi, w nowej, wyłaniającej się kategorii zdecentralizowanych danych i sztucznej inteligencji. Poleciłbym również poświęcić trochę czasu na zagłębienie się w przestrzeń sztucznej inteligencji o otwartym kodzie źródłowym, która nie jest kryptograficzna, aby poznać niektóre podejścia, jakie ludzie przyjmują poza kontekstem kryptograficznym. Zagłębiłbym się w niektóre z istniejących projektów, aby zobaczyć, jakiego rodzaju prymitywy są dostępne do budowania, w tym wypróbować uruchomienie DAO danych na Vana.