Actualmente, queda medio mes de tiempo de preparación antes de que comience Epoch Two.
Escrito por: J1N, Techub News
Introducción: Epoch One a Dos
Kuzco es una red de minería de potencia de IA dedicada a LLM, seleccionada este año para el programa de aceleración de Crypto Startup Accelerator (CSX) de a16z, que se lanzó el 9 de septiembre en Nueva York. Los proyectos seleccionados para este programa podrán recibir al menos 500,000 dólares de inversión de a16z, y recibirán orientación y apoyo del equipo operativo de a16z. Actualmente, este programa de aceleración ha concluido.
El 16 de noviembre, Kuzco anunció que el primer periodo (Epoch One) del plan de incentivos finalizará el 18 de noviembre de 2024, todas las operaciones se detendrán, las instantáneas de datos se almacenarán permanentemente y la clasificación final de puntos se publicará en una nueva tabla de clasificación.
Divulgación oficial, Epoch One se lanzará el 6 de marzo de 2024, con un número máximo de dispositivos que supera las 8000 unidades. En esta red se ejecuta el modelo de lenguaje de IA Llama-3 de Meta, con especificaciones de 8B, que ha realizado más de 1 billón de inferencias de tokens en total.
Y anunció que en las próximas semanas se darán a conocer información sobre financiamiento y la hoja de ruta del desarrollo del proyecto, así como que el segundo periodo (Epoch Two) de incentivos comenzará el 9 de diciembre, Epoch Two traerá algunas nuevas características, como mayor rendimiento y fiabilidad del hardware NVIDIA; incentivará a los usuarios a conectar dispositivos de potencia de cálculo de primera línea como A100 y H100; y apoyará más modelos de generación de imágenes y modelos de lenguaje multimodal VLM.
Actualmente, queda medio mes de tiempo de preparación antes de que comience Epoch Two. Este artículo explorará:
Compartiendo la práctica y los resultados de minería personal, desde la transición de una sola máquina a un clúster.
Demostración del proceso completo de obtención de financiamiento y construcción de máquinas de alta especificación a través de la investigación y la práctica.
Exploración de la coincidencia entre la configuración de hardware y las necesidades del proyecto, y respuesta a las preguntas comunes de los inversores.
Revisión de Epoch One: Operaciones en solitario
Configuración
La lista de configuraciones del autor incluye tarjetas gráficas de la serie RTX 2060, 2070S, 3080, 4060, 4060Ti, así como 4 unidades 4070S y 2 dispositivos Apple M2 y M3. Estos dispositivos están distribuidos en varias computadoras de escritorio, laptops y una máquina de minería dedicada.
Costo
Cabe mencionar que estas tarjetas gráficas fueron adquiridas por el autor cada año según las necesidades de juegos, no específicamente para la minería. Por lo tanto, al calcular los costos, no se incluyó el costo de adquisición de hardware, solo se contabilizó el costo real de electricidad de la máquina minera. Aquí se toma como ejemplo la máquina minera ensamblada en el primer artículo (Guía práctica de Kuzco «discípulo» de a16z: ¿cómo minar eficientemente en IA?).
Configuración de esta máquina minera:
Placa base: z490 (se cambiará por una placa industrial posteriormente)
CPU: 10ª generación I9
Tarjetas gráficas: 2060, 2070s, 3080, 4060ti, 4070s
Máquina minera de ensamblaje manual
La siguiente imagen muestra el consumo de electricidad de esta máquina minera en octubre y noviembre, totalizando 564 grados, obteniendo aproximadamente 600 millones de puntos (KZO Point). Todas las máquinas juntas suman alrededor de 1.1 mil millones de puntos. Los costos específicos de electricidad deben calcularse según las tarifas eléctricas de cada ubicación, aquí solo se proporciona como referencia.
En la parte más a la derecha, se obtuvieron un total de 1 billón de puntos
Preparando Epoch Two: Despliegue en clúster
Basado en las comparticiones del autor en el primer artículo, así como en su experiencia rica en operaciones al participar en el ensamblaje, la depuración y el despliegue del entorno, el autor logró obtener un cierto apoyo financiero y lo invirtió todo en el ensamblaje de máquinas mineras de alto rendimiento para aumentar aún más la escala de potencia de cálculo y la eficiencia operativa.
De operaciones individuales a despliegue en clúster
Lógica de configuración y selección de máquinas de alta especificación
Combinando la experiencia práctica del autor en Epoch One, se realizó una optimización integral de la placa base, CPU, tarjeta gráfica, fuente de alimentación, plataforma y configuraciones de red, eligiendo combinaciones de hardware más adecuadas, lo que no solo mejoró la estabilidad, seguridad y eficiencia general del funcionamiento, sino que también prestó más atención a la circulabilidad del mercado de segunda mano en la selección de hardware. Esta estrategia puede reducir efectivamente los costos reales de inversión, proporcionando a los participantes posteriores opciones de alto costo-beneficio.
Placa base
El autor eligió una placa base industrial en lugar de la B85 convencional, principalmente por consideraciones integrales de rendimiento, estabilidad y relación costo-beneficio.
En términos de rendimiento, ejecutar el modelo Llama-3 de Kuzco requiere iniciar múltiples procesos de Docker, y ejecutar estos procesos en paralelo consume muchos recursos de CPU, lo que requiere un rendimiento de CPU más alto, y el CPU compatible con B85 no puede satisfacer esta demanda.
Además, las placas base industriales tienen ventajas evidentes en la estabilidad operativa a largo plazo, resistencia a altas temperaturas y garantía del fabricante, además de tener una mayor circulación en el mercado de segunda mano, por lo que sin duda son la mejor opción.
Tarjeta gráfica
El autor eligió usar la 4070S como tarjeta gráfica principal, principalmente por las siguientes razones:
Ventajas del rendimiento informático de IA: en comparación con las tarjetas gráficas de la serie 30, las tarjetas gráficas de la serie 40 tienen un aumento de rendimiento en computación de IA mucho mayor que en rendimiento de juegos. La razón principal es que la potencia de cálculo de IA se basa principalmente en la cantidad de núcleos CUDA de la tarjeta gráfica, y las tarjetas de la serie 40 tienen significativamente más núcleos CUDA que las de la serie 30.
Ventajas de eficiencia energética: el autor realizó pruebas detalladas en múltiples GPU, calculando el consumo de energía promedio por cada token.
4060Ti (160W): 0.125 Tokens/W
3080 (330W): 0.22 Tokens/W
4090 (450W): 0.26 Tokens/W
4070S (220W): 0.38 Tokens/W
Según los resultados de las pruebas, la 4070S se desempeña mejor en el equilibrio entre rendimiento y consumo de energía, su mayor eficiencia energética reduce directamente los costos de electricidad, convirtiéndola en la opción más rentable.
Precios y liquidez en el mercado de segunda mano: como tarjeta gráfica de gama media-alta, la 4070S tiene una alta liquidez y retención de valor en el mercado de segunda mano, lo que reduce aún más el costo de propiedad del dispositivo y proporciona flexibilidad para futuras actualizaciones de hardware.
CPU
Como se mencionó anteriormente, el Llama-3 de Kuzco necesita iniciar múltiples Docker durante su operación, lo que resulta en un uso de recursos de CPU muy significativo, especialmente en configuraciones de múltiples tarjetas, donde la tasa de utilización de CPU puede alcanzar el 80%-90%. Por lo tanto, la capacidad de procesamiento multihilo y multinúcleo es especialmente importante. Un CPU de alto rendimiento y multihilo no solo puede soportar la ejecución de múltiples tareas de manera efectiva, sino que también puede garantizar la estabilidad y eficiencia de todo el proceso de minería.
El i5 de 13ª generación puede alcanzar una tasa de utilización de más del 70% al máximo con la tarjeta gráfica.
Entorno de red
El enrutador suave es el cuadro de la figura
El entorno de red también es crucial en la minería; incluso si se cuenta con tarjetas gráficas de alto rendimiento, si la red no está optimizada, la potencia de cálculo se verá gravemente afectada. Según las pruebas del autor, una velocidad de red insuficiente puede reducir la potencia de cálculo hasta en un 30%, y nodos de red de baja calidad pueden impedir la conexión a la red de Kuzco, lo cual es inaceptable para la minería. Para resolver estos problemas, el autor utiliza una solución de enrutador suave, que no solo es fácil de configurar, sino que, una vez configurada, puede funcionar de manera eficiente con poca intervención humana, y teóricamente puede soportar la conexión de un número ilimitado de dispositivos. En cuanto a la forma específica de operación, se sugiere que los lectores consulten la información relevante según sus necesidades.
Fuente de alimentación
Fuente de alimentación nuclear clásica de 2000W
Al elegir la fuente de alimentación, es necesario prestar especial atención al problema del consumo máximo, que es la razón por la cual, incluso cuando el consumo nominal de 7 4070S es solo de 1540W, el autor aún opta por utilizar dos fuentes de alimentación de 2000W, alcanzando una potencia total de 4000W. Esto no es un desperdicio de recursos, sino un consideración por la estabilidad y seguridad del funcionamiento del equipo.
Las tarjetas gráficas experimentan picos de consumo de energía, lo que significa que en ciertos momentos su consumo real puede alcanzar 1.5 veces su potencia nominal o incluso más, para luego volver a un nivel normal. Si la potencia de la fuente de alimentación no es suficiente para manejar estos picos, podría activar el mecanismo de parada forzada de la fuente de alimentación, e incluso causar daños a la tarjeta gráfica. Esto es una amenaza mortal para el funcionamiento normal de la máquina minera.
Desempeño de consumo de 4070s
Tomando como ejemplo la 4070S, aunque su potencia nominal es de 220W, la potencia máxima puede superar los 400W. La potencia máxima total de 7 tarjetas gráficas puede alcanzar más de 3000W, por lo que configurar una fuente de alimentación dual de 2000W es para garantizar el funcionamiento estable de la máquina. Los usuarios que configuran múltiples 4090 deben tener especial cuidado, ya que la potencia nominal de una 4090 es de 450W, mientras que la potencia máxima puede alcanzar hasta 770W. En situaciones de múltiples tarjetas, confiar solo en dos fuentes de alimentación puede no satisfacer la demanda; normalmente se necesitarán tres fuentes para garantizar la estabilidad del sistema.
Desempeño de consumo de 4090
Complemento
En cuanto a configuraciones de BIOS, compatibilidad de hardware y problemas de gestión remota, el autor no se extenderá demasiado aquí. Hay muchos tutoriales gratuitos en línea que pueden servir de referencia; seguir los tutoriales puede resolver la mayoría de los problemas. Se sugiere consultar y manejar de manera específica según las configuraciones de hardware y necesidades personales, de manera simple y eficiente.
Riesgos y beneficios
Para responder a la pregunta más preocupante para todos: ¿cuánto se puede minar al día? Francamente, esta pregunta no tiene una respuesta clara, ya que el riesgo y el beneficio siempre coexisten. Puedo compartir un punto de vista claro: ya sea en el mundo de las criptomonedas o en la industria tradicional, si un proyecto puede calcular con precisión las ganancias diarias, es probable que al ingresar ya no puedas ganar mucho dinero. A menos que tengas ciertos recursos monopolísticos, como costos eléctricos extremadamente bajos o equipos de minería muy baratos, solo así podrás tener una ventaja en las ganancias. Sin embargo, tales recursos no están disponibles para todos.
El autor eligió dispositivos con buena liquidez para reducir el riesgo de inversión y la presión de costos. Tomando como ejemplo la minería con Kuzco, los costos se concentran principalmente en la depreciación del hardware y los gastos de electricidad, por lo que tu máxima pérdida se limita a estos costos fijos. Si no participas bajo un costo bajo, cualquier decisión de inversión pierde su significado. Es importante enfatizar que la naturaleza de la minería de criptomonedas significa que no hay expectativas de ganancias claras, pero ese es precisamente el potencial de la minería inicial.
Desde un juicio subjetivo, este campo tiene un enorme potencial de mercado: por un lado, Kuzco ha recibido apoyo de inversión de a16z; por otro lado, la demanda de modelos de lenguaje LLM está creciendo rápidamente. Piénsalo, casi nadie no usaría un LLM, ¿verdad? Plataformas como ChatGPT de OpenAI, Llama de Meta, y XAI de Musk, han tenido rondas de financiamiento masivo, lo que deja claro el potencial de crecimiento de esta industria.
Para las personas comunes, participar directamente en la industria de IA no es fácil. Por un lado, la tecnología de IA tiene una alta barrera de entrada; por otro lado, el entrenamiento de modelos de IA requiere enormes recursos y financiamiento, lo que la mayoría de las personas no puede soportar. Sin embargo, al unirse a la red de potencia de IA a través de Kuzco, las personas pueden participar fácilmente en este campo de alto crecimiento con costos controlables, contribuyendo a la potencia de IA y obteniendo ganancias al mismo tiempo.
Además, el precio de Bitcoin está a punto de superar los 100,000 dólares, subiendo de 16,000 dólares en 2022 a su punto máximo actual, lo que conlleva un gran riesgo de retroceso. Si se elige comprar directamente los tokens de proyectos de IA, también se enfrentará a un riesgo de alta volatilidad similar. En comparación, participar en la red de potencia de IA es una opción más robusta: no solo los costos son claros y controlables, sino que también permite acceder al sector de IA en rápido crecimiento con relativamente bajo riesgo. Esta es una de las formas en que las personas comunes pueden ingresar al campo de la IA en el contexto actual.