Chainbase wydał model AI typu open source, Theia-Llama-3.1-8B. Jest to model językowy, który koncentruje się na kryptografii.

Firma uruchomiła wersję alfa chatbota o nazwie TheiaChat w sierpniu. Została wydana w celu ujawnienia funkcji Theia.

Szkolenia Theia zostały zaczerpnięte z dwóch źródeł

Dane użyte do trenowania modelu zostały pobrane z CoinMarketCap i innych raportów badawczych. Dane CoinMarketCap użyte do trenowania i dostrajania Theia-Llama-3.1-8B obejmują dokumenty projektu, takie jak whitepapery, oficjalne wpisy na blogu i artykuły informacyjne.

Raporty z badań uzyskano z wiarygodnych źródeł internetowych, aby zapewnić dogłębny wgląd w podstawy projektu, wpływ rynku i postęp prac rozwojowych.

Wpis na blogu szczegółowo opisuje, że dane z tych dwóch głównych źródeł przeszły również proces ręcznego i algorytmicznego filtrowania w celu ograniczenia redundancji i wyeliminowania błędów.

Chainbase wykorzystał również zaawansowane techniki do dostrajania i optymalizacji modelu. Zespół wykorzystał LoRA (Low-Rank Adaptation) do wydajnego dostrajania. Pomogło to w dostosowaniu podstawowego modelu Llama-3.1-8B-Instruct do domeny kryptowalut.

Proces szkolenia został udoskonalony dzięki wykorzystaniu LLaMA Factory i DeepSpeed, a także zaawansowanych technik, takich jak ZeRO, odciążenie, rzadka uwaga, 1-bitowy Adam i paralelizm potokowy, aby przyspieszyć szkolenie i zmniejszyć wykorzystanie pamięci.

Oprócz dostrajania Chainbase zoptymalizował model, aby przygotować go do wydajnego wdrożenia. Ten proces kwantyzacji zmniejsza rozmiar pamięci modelu i przyspiesza wnioskowanie, zachowując jednocześnie akceptowalną dokładność.

Chainbase zaproponował benchmark modelu kryptograficznej sztucznej inteligencji

Aby ocenić wydajność Theia-Llama-3.1-8B, Chainbase zaproponował test porównawczy dla modeli kryptograficznej sztucznej inteligencji.

Test ten ocenia modele w siedmiu wymiarach, obejmujących zrozumienie i generowanie wiedzy kryptograficznej, zasięg wiedzy oraz zdolność wnioskowania.

Wstępne wyniki testów porównawczych skupiające się na zrozumieniu i możliwościach generowania w domenie kryptograficznej pokazują, że Theia-Llama-3.1-8B przewyższa 11 innych LLM. Obejmuje to popularne modele z OpenAI, Google, Meta, Qwen i DeepSeek. Model osiągnął wynik perplexity 1,184 i wynik BERT 0,861, przewyższając główne modele obecnie dostępne na rynku.

Chainbase stwierdził również w swoim wpisie na blogu, że wydajność Theia-Llama-3.1-8B przewyższa wydajność głównych modeli dostępnych obecnie na rynku. „Następnie zbudujemy większe modele i ocenimy więcej wymiarów modeli” — stwierdził Chainbase.