Il reste encore deux semaines de préparation avant le début de l'Epoch Deux.

Rédigé par : J1N, Techub News

Introduction : Epoch One à Deux

Kuzco est un réseau de minage de puissance dédié aux modèles de langage LLM, sélectionné cette année pour le programme d'accélérateur d'automne Crypto Startup Accelerator (CSX) de a16z, lancé le 9 septembre à New York. Les projets sélectionnés par ce programme peuvent obtenir un investissement d'au moins 500 000 dollars de a16z et bénéficier de l'assistance et du soutien de l'équipe opérationnelle de a16z. Le programme d'accélérateur est maintenant terminé.

Le 16 novembre, Kuzco a annoncé que le premier programme d'incitation (Epoch One) se terminera le 18 novembre 2024, toutes les opérations seront suspendues, les instantanés de données seront stockés de manière permanente et le classement final des points sera publié sur un nouveau tableau de classement.

Selon les informations officielles, Epoch One sera lancé le 6 mars 2024, avec un nombre maximal de dispositifs dépassant 8000. Le réseau exécute le modèle de langage Llama-3 AI de Meta, spécification 8B, avec un total d'inférences dépassant 1 trillion de tokens.

Et annoncer que les informations de financement et la feuille de route du projet seront publiées dans les semaines à venir, ainsi que le deuxième programme d'incitation (Epoch Two) qui débutera le 9 décembre, Epoch Two apportera certaines nouvelles fonctionnalités, telles qu'un débit et une fiabilité plus élevés des équipements NVIDIA ; encouragera les utilisateurs à intégrer des équipements de puissance de pointe tels que A100 et H100 ; et soutiendra davantage de modèles de génération d'images et de modèles de langage multimodal VLM.

Il reste encore deux semaines de préparation avant le début de l'Epoch Deux, cet article explorera :

  • Partager les pratiques et les résultats personnels du minage, de la transition d'un seul appareil à un déploiement en cluster.

  • Montrer l'ensemble du processus d'obtention de financements par la recherche et la pratique, ainsi que le montage de machines de haute spécification.

  • Explorer la compatibilité entre la configuration matérielle et les besoins du projet, et répondre aux questions courantes des investisseurs.

Rétrospective sur l'Epoch One : Opérations individuelles

Configuration

Ma liste de configuration comprend des cartes graphiques de la série RTX 2060, 2070S, 3080, 4060, 4060Ti, ainsi que 4 cartes 4070S et 2 appareils Apple M2, M3. Ces dispositifs sont répartis sur plusieurs hôtes, ordinateurs portables et une machine de minage dédiée.

Coût

Il est à noter que ces cartes graphiques ont été initialement achetées par l'auteur chaque année en fonction des besoins de jeu, et non spécifiquement pour le minage. Par conséquent, lors du calcul des coûts, les frais d'achat de matériel n'ont pas été pris en compte, seuls les coûts réels d'électricité de la machine de minage ont été comptabilisés. Ici, un exemple de la machine de minage assemblée dans le premier article (Guide pratique de Kuzco, disciple d'a16z : comment miner efficacement avec la puissance AI ?) est donné.

Configuration de la machine de minage :

  • Carte mère : z490 (remplacée ultérieurement par une carte industrielle)

  • CPU : I9 de 10e génération

  • Cartes graphiques : 2060, 2070s, 3080, 4060ti, 4070s

Machine de minage artisanale

Le tableau ci-dessous montre la consommation électrique de la machine de minage en octobre et novembre, totalisant 564 kWh, avec des points gagnés (KZO Point) d'environ 600 millions. Toutes les machines combinées totalisent environ 1,1 milliard de points. Les coûts spécifiques de l'électricité doivent être calculés en fonction des tarifs d'électricité locaux, ceci n'est qu'une référence.

Au total, 1 milliard de points ont été obtenus

Préparation de l'Epoch Deux : Déploiement en cluster

Basé sur le partage de l'auteur dans le premier article, ainsi que sur son expérience riche en opérations due à l'assemblage, au débogage et au déploiement d'équipements, l'auteur a réussi à obtenir un certain soutien financier et a investi tout cela dans l'assemblage de machines de minage haute performance pour améliorer l'échelle de calcul et l'efficacité opérationnelle.

Des opérations individuelles à un déploiement en cluster

Logique de configuration et de sélection des machines de haute spécification

En combinant l'expérience pratique de l'auteur dans l'Epoch One, l'optimisation complète de la carte mère, du CPU, des cartes graphiques, de l'alimentation, de la plateforme et de la configuration réseau a été réalisée, choisissant une combinaison matérielle plus adaptée, ce qui a non seulement amélioré la stabilité, la sécurité et l'efficacité globales, mais également mis davantage l'accent sur la liquidité du marché de l'occasion dans le choix des matériels. Cette stratégie permet de réduire efficacement les coûts d'investissement réels et d'offrir aux participants futurs un meilleur rapport qualité-prix.

Carte mère

L'auteur a choisi une carte mère industrielle plutôt qu'une B85 mainstream, principalement en raison d'une évaluation globale des performances, de la stabilité et du rapport qualité-prix.

En termes de performances, faire fonctionner le modèle Llama-3 de Kuzco nécessite de lancer plusieurs processus Docker, et l'exécution parallèle de ces processus consomme beaucoup de ressources CPU, ce qui impose des exigences élevées en matière de performances CPU, alors que le CPU compatible avec B85 ne peut pas répondre à cette demande.

De plus, les cartes mères industrielles présentent des avantages évidents en matière de fonctionnement stable à long terme, de résistance à la chaleur et de garantie du fabricant, tout en ayant une meilleure liquidité sur le marché de l'occasion, ce qui en fait sans aucun doute le meilleur choix.

Carte graphique

L'auteur a choisi d'utiliser la 4070S comme carte graphique principale, principalement pour les raisons suivantes :

Avantages des performances de calcul AI : par rapport aux cartes graphiques de la série 30, les cartes graphiques de la série 40 présentent une amélioration des performances dans le calcul AI bien supérieure à celle de l'amélioration des performances de jeu. La raison principale est que la puissance de calcul AI dépend principalement du nombre de cœurs CUDA des cartes graphiques, et les cartes graphiques de la série 40 ont beaucoup plus de cœurs CUDA que celles de la série 30.

Avantage du rapport efficacité énergétique : l'auteur a effectué des tests détaillés sur plusieurs GPU, calculant la consommation moyenne par token.

  • 4060Ti (160W) : 0.125 Tokens/W

  • 3080 (330W) : 0.22 Tokens/W

  • 4090 (450W) : 0.26 Tokens/W

  • 4070S (220W) : 0.38 Tokens/W

D'après les résultats des tests, la 4070S se distingue par son équilibre entre performance et consommation d'énergie, son rapport efficacité énergétique plus élevé réduit directement les coûts d'électricité, en faisant le choix le plus rentable.

Prix et liquidité du marché de l'occasion : en tant que carte graphique de milieu à haut de gamme, la 4070S a une bonne liquidité et une bonne valeur de revente sur le marché de l'occasion, réduisant ainsi le coût de possession des équipements tout en offrant une flexibilité pour les futures mises à niveau matérielles.

CPU

Comme mentionné précédemment, le Llama-3 de Kuzco nécessite de lancer plusieurs Docker lors de son fonctionnement, ce qui entraîne une occupation significative des ressources CPU, surtout en cas d'exécution multi-cartes, où l'utilisation du CPU peut atteindre 80%-90%. Par conséquent, la capacité de traitement multi-cœurs et multi-threads est extrêmement importante. Un CPU hautes performances, multi-threads et stable peut non seulement soutenir efficacement l'exécution de multiples tâches, mais aussi garantir la stabilité et l'efficacité du processus de minage.

Le i5 de 13e génération atteint une utilisation de plus de 70 % avec les cartes graphiques à pleine charge

Environnement réseau

Le routeur logiciel est la boîte carrée sur l'image

L'environnement réseau est également crucial dans le minage, même si des cartes graphiques haute performance sont configurées, si le réseau n'est pas optimisé, la puissance de calcul sera gravement affectée. Selon mes tests, une vitesse de connexion insuffisante peut réduire la puissance de calcul de 30 %, tandis qu'un mauvais nœud réseau peut empêcher complètement la connexion au réseau de Kuzco, ces deux situations sont inacceptables pour le minage. Pour résoudre ces problèmes, j'ai adopté une solution de routeur logiciel, qui est non seulement facile à configurer, mais fonctionne presque sans intervention manuelle après la configuration, et peut théoriquement prendre en charge un nombre illimité de dispositifs. En ce qui concerne les méthodes spécifiques, il est conseillé aux lecteurs de consulter les informations pertinentes en fonction de leurs besoins.

Alimentation

Alimentation nucléaire classique 2000w

Lors du choix d'une alimentation, il faut porter une attention particulière à la question de la consommation de pointe, c'est pourquoi même si la consommation nominale de 7 cartes 4070S n'est que de 1540W, l'auteur a choisi d'utiliser deux alimentations de 2000W, atteignant une puissance totale de 4000W. Ce n'est pas un gaspillage de ressources, mais une considération pour la stabilité et la sécurité de fonctionnement de l'équipement.

Les cartes graphiques peuvent présenter des pics de consommation d'énergie pendant leur fonctionnement, c'est-à-dire qu'à certains moments, leur consommation réelle peut atteindre 1,5 fois ou plus leur consommation nominale, avant de revenir à un niveau normal. Si la puissance de l'alimentation n'est pas suffisante pour faire face à ce pic, cela peut déclencher le mécanisme d'arrêt d'urgence de l'alimentation, voire endommager la carte graphique. Cela représente une menace mortelle pour le bon fonctionnement de la machine de minage.

Performances de consommation d'énergie de la 4070s

Prenons l'exemple de la 4070S, bien que sa consommation nominale soit de 220W, la consommation de pointe peut dépasser 400W. La consommation de pointe totale des 7 cartes graphiques pourrait atteindre plus de 3000W, c'est pourquoi une alimentation double de 2000W est utilisée pour garantir un fonctionnement stable de la machine. Les utilisateurs qui configurent plusieurs 4090 doivent faire particulièrement attention, car la consommation nominale d'une seule 4090 est de 450W, tandis que la consommation de pointe peut atteindre 770W. Dans le cas de plusieurs cartes, deux alimentations peuvent ne pas suffire, il est généralement nécessaire d'utiliser trois alimentations pour assurer la stabilité du système.

Performances de consommation d'énergie de la 4090

Supplément

Quant à la configuration du BIOS, la compatibilité matérielle et la gestion à distance, l'auteur ne s'étendra pas ici. De nombreux tutoriels gratuits sont disponibles en ligne pour référence, la plupart des problèmes peuvent être résolus en suivant ces tutoriels. Il est recommandé de consulter et de traiter en fonction de votre configuration matérielle et de vos besoins, de manière simple et efficace.

Risques et bénéfices

Pour répondre à la question la plus préoccupante : combien peut-on miner par jour ? Pour être franc, cette question n'a pas de réponse claire, car le risque et le bénéfice coexistent toujours. Je peux partager un point de vue clair : que ce soit dans le secteur des cryptomonnaies ou dans l'industrie traditionnelle, si un projet peut calculer avec précision ses bénéfices quotidiens, il est probable que vous ne puissiez plus faire de gros bénéfices. À moins que vous ne disposiez de certaines ressources monopolistiques, comme des coûts d'électricité très bas ou des équipements de minage très bon marché, vous pourrez alors bénéficier d'un avantage en termes de rentabilité. Cependant, de telles ressources ne sont pas accessibles à tout le monde.

L'auteur choisit des équipements avec une bonne liquidité précisément pour réduire les risques d'investissement et la pression des coûts. Prenons l'exemple du minage avec Kuzco, où les coûts se concentrent principalement sur la dépréciation du matériel et l'électricité, donc votre perte maximale est limitée à ces coûts fixes. Si vous ne participez pas sous des coûts bas, alors toute décision d'investissement perd de son sens. Il est important de souligner que la nature du minage de tête signifie qu'il n'y a pas de prévision de bénéfices clairs, mais c'est aussi là que réside le potentiel du minage de tête.

D'un point de vue subjectif, ce secteur a un énorme potentiel de marché : d'une part, Kuzco a reçu le soutien d'investissement de a16z ; d'autre part, la demande pour les modèles de langage LLM s'élargit rapidement. Pensez-y, presque personne n'utiliserait pas LLM, n'est-ce pas ? Des plateformes comme ChatGPT d'OpenAI, Llama de Meta et XAI d'Elon Musk, avec leurs financements élevés successifs, montrent clairement le potentiel de croissance de cette industrie.

Pour les personnes ordinaires, entrer directement dans l'industrie de l'AI n'est pas une tâche facile. D'une part, la technologie AI présente une barrière à l'entrée élevée ; d'autre part, la formation des modèles AI nécessite des ressources et des financements énormes, que la plupart des gens ne peuvent pas se permettre. En rejoignant le réseau de puissance AI via Kuzco, les gens ordinaires peuvent participer facilement à ce domaine à forte croissance tout en gardant les coûts sous contrôle, contribuant ainsi à la puissance AI tout en obtenant un retour.

De plus, le prix du Bitcoin est sur le point de dépasser 100 000 dollars, passant de 16 000 dollars en 2022 à un sommet actuel, ce qui comporte un risque de retrait énorme. Si vous choisissez d'acheter directement les tokens des projets AI, vous serez également confronté à un risque de volatilité élevé similaire. En revanche, participer à un réseau de puissance AI est un choix beaucoup plus robuste : non seulement les coûts sont clairs et contrôlables, mais cela permet également d'entrer dans la voie de croissance rapide de l'industrie AI avec un risque relativement faible. C'est l'une des manières pratiques pour les gens ordinaires d'entrer dans le domaine de l'AI dans l'environnement actuel.