Autor: David & Goliath
Kompilacja: Deep Tide TechFlow
Obecnie, obliczenia i procesy szkoleniowe w przemyśle AI są głównie zdominowane przez scentralizowanych gigantów Web2. Firmy te zajmują dominującą pozycję dzięki silnej sile kapitałowej, nowoczesnemu sprzętowi oraz ogromnym zasobom danych. Chociaż taka sytuacja może utrzymywać się podczas rozwoju najsilniejszych uniwersalnych modeli uczenia maszynowego (ML), sieć Web3 może stopniowo stać się bardziej ekonomicznym i dostępnym źródłem zasobów obliczeniowych dla modeli średniej klasy lub dostosowanych.
Podobnie, gdy zapotrzebowanie na wnioskowanie przekracza możliwości osobistych urządzeń brzegowych, niektórzy konsumenci mogą wybierać sieć Web3, aby uzyskać mniej cenzurowane i bardziej zróżnicowane wyniki. Zamiast starać się całkowicie zrewolucjonizować cały stos technologii AI, uczestnicy Web3 powinni skupić się na tych szczególnych scenariuszach i w pełni wykorzystać swoje unikalne zalety w zakresie odporności na cenzurę, przejrzystości i społecznej weryfikowalności.
Zasoby sprzętowe niezbędne do szkolenia modeli podstawowych następnej generacji (takich jak GPT czy BERT) są rzadkie i kosztowne, a zapotrzebowanie na najwydajniejsze chipy będzie nadal przewyższać podaż. Ta rzadkość zasobów prowadzi do tego, że sprzęt koncentruje się w rękach zaledwie kilku dobrze finansowanych liderów branży, którzy wykorzystują ten sprzęt do szkolenia i komercjalizacji najbardziej wydajnych i najbardziej złożonych modeli podstawowych.
Jednak tempo aktualizacji sprzętu jest bardzo szybkie. Jak więc zostanie wykorzystany przestarzały sprzęt średniej lub niskiej wydajności?
Te urządzenia sprzętowe mogą być wykorzystywane do szkolenia prostszych lub bardziej ukierunkowanych modeli. Dopasowując różne kategorie modeli do sprzętu o różnej wydajności, można osiągnąć optymalne rozmieszczenie zasobów. W takim przypadku protokół Web3 może odegrać kluczową rolę, koordynując dostęp do zróżnicowanych, niskokosztowych zasobów obliczeniowych. Na przykład, konsumenci mogą korzystać z prostych modeli średniej klasy trenowanych na zestawach danych osobowych i wybierać modele wysokiej klasy trenowane i hostowane przez scentralizowane firmy tylko w przypadku bardziej złożonych zadań, zapewniając jednocześnie, że tożsamość użytkowników jest ukryta, a dane wskazujące są szyfrowane.
Oprócz problemów z wydajnością, obawy dotyczące uprzedzeń i potencjalnej cenzury w modelach scentralizowanych również rosną. Środowisko Web3 słynie z przejrzystości i weryfikowalności, co pozwala na szkolenie modeli, które zostały zaniedbane lub uznane za zbyt wrażliwe przez Web2. Chociaż te modele mogą nie być konkurencyjne pod względem wydajności i innowacyjności, wciąż mają istotną wartość dla niektórych grup społecznych. Dlatego protokół Web3 może stworzyć unikalny rynek w tej dziedzinie, oferując bardziej otwarte, wiarygodne i odporne na cenzurę usługi szkoleniowe modeli.
Początkowo, dwie metody - scentralizowana i zdecentralizowana - mogą współistnieć, każda służąc różnym przypadkom użycia. Jednak w miarę jak Web3 ciągle poprawia doświadczenia deweloperów i zgodność platform, a efekty sieciowe otwartego AI stają się coraz bardziej widoczne, Web3 może ostatecznie konkurować w kluczowych obszarach scentralizowanych firm. Szczególnie gdy konsumenci coraz bardziej zdają sobie sprawę z ograniczeń modeli scentralizowanych, przewagi Web3 staną się bardziej wyraźne.
Oprócz szkolenia modeli średniej klasy lub w określonych dziedzinach, uczestnicy Web3 mają również przewagę w dostarczaniu bardziej przejrzystych i elastycznych rozwiązań wnioskowania. Zdecentralizowane usługi wnioskowania mogą przynieść wiele korzyści, takich jak zerowy czas przestoju, modułowe łączenie modeli, publiczna ocena wydajności modeli oraz bardziej zróżnicowane, niecenzurowane wyniki. Usługi te mogą również skutecznie unikać problemu „uzależnienia od dostawcy”, z którym borykają się konsumenci w związku z poleganiem na nielicznych scentralizowanych dostawcach. Podobnie jak w przypadku szkolenia modeli, przewaga konkurencyjna zdecentralizowanej warstwy wnioskowania nie polega na samej mocy obliczeniowej, ale na rozwiązaniu niektórych długo istniejących problemów, takich jak przejrzystość parametrów dostrajania zamkniętego źródła, brak weryfikowalności i wysokie koszty.
Dan Olshansky zaproponował obiecującą koncepcję, aby stworzyć więcej możliwości dla badaczy AI i inżynierów poprzez sieć routingu wnioskowania AI POKT, umożliwiając im stosowanie wyników swoich badań w praktyce i uzyskiwanie dodatkowych dochodów poprzez dostosowane modele uczenia maszynowego (ML) lub sztucznej inteligencji (AI). Co ważniejsze, ta sieć, integrując wyniki wnioskowania z różnych źródeł (w tym dostawców zdecentralizowanych i scentralizowanych), może wspierać bardziej sprawiedliwą konkurencję na rynku usług wnioskowania.
Chociaż optymistyczne prognozy sugerują, że cały stos technologii AI może w przyszłości całkowicie przenieść się na łańcuch, obecnie ten cel nadal stoi przed ogromnymi wyzwaniami związanymi z koncentracją danych i zasobów obliczeniowych, ponieważ te zasoby zapewniają znaczącą przewagę konkurencyjną obecnym gigantów. Jednak zdecentralizowana koordynacja i sieci obliczeniowe wykazują unikalną wartość w dostarczaniu bardziej spersonalizowanych, ekonomicznych, bardziej otwartych i odpornych na cenzurę usług AI. Skupiając się na tych segmentach rynku, które są najważniejsze pod względem tych wartości, Web3 może zbudować swoje bariery konkurencyjne, zapewniając, że najbardziej wpływowe technologie tej ery mogą ewoluować w różnych kierunkach, przynosząc korzyści szerszym interesariuszom, a nie tylko nielicznym tradycyjnym gigantów.
Na koniec chciałbym szczególnie podziękować wszystkim członkom zespołu Placeholder Investment oraz Kyle'owi Samaniemu z Multicoin Capital, Anandowi Iyerowi z Canonical VC, Keccakowi Wongowi z Nectar AI, Alpinowi Yukseloglu z Osmosis Labs oraz Cameronowi Dennisowi z NEAR Foundation, którzy dostarczyli recenzji i cennych uwag podczas pisania tego dokumentu.