Autor: Iris Chen, Dr. Nick

1. Necesidades y desafíos coexisten

El "Informe de evaluación del índice de potencia informática global 2022-2023" señala que en el contexto de la desaceleración del crecimiento del PIB mundial, la economía digital aún mantiene una fuerte tendencia de crecimiento La proporción de la economía digital en el PIB en los principales países del mundo. Está aumentando año tras año. Se espera que la proporción general de los países de la muestra del 50,2% en 2022 al 54,0% en 2026, la potencia informática se haya convertido gradualmente en la principal fuerza que impulsa el crecimiento económico. Por cada aumento de 1 punto en el índice de potencia informática, la economía digital y el PIB del país crecerán un 3,6‰ y un 1,7‰ respectivamente. Más importante aún, cuando el índice de potencia informática supera los 40 puntos, la fuerza impulsora del crecimiento del PIB por cada aumento de 1 punto será 1,3 veces mayor que cuando está por debajo de 40 puntos, e incluso el triple cuando supera los 60 puntos. Las ventajas de las regiones que sean las primeras en desarrollar potencia informática se fortalecerán a medida que aumente la proporción de inversión en potencia informática, ampliando aún más la brecha con las regiones que se están desarrollando más tarde, lo que demuestra la importancia de desarrollar potencia informática.

1. Se acerca la ola AIGC y la demanda de la industria de potencia informática es enorme.

Con la aplicación y el desarrollo de tecnologías clave como la inteligencia artificial, blockchain, Internet de las cosas y AR/VR, la demanda de potencia informática aumentará en el futuro. Se espera que para 2030:

  • Inteligencia artificial: una penetración profunda en todas las industrias requerirá 16.000 EFLOPS de potencia informática (equivalente a incorporar 160.000 millones de Qualcomm Snapdragon 855 NPU2 en teléfonos inteligentes)

  • Blockchain: respaldar áreas como las monedas digitales cifradas requerirá 5500 EFLOPS de potencia informática (equivalente a 1300 millones de AntMiner V9)

  • Internet de las cosas: conectar todos los dispositivos en fábricas y hogares requerirá 8500 EFLOPS de potencia informática (equivalente a 7900 millones de chips en dispositivos de vanguardia de IoT)

  • Computación espacial/AR/VR/Metaverso: a su máximo potencial, se requerirán 3900 EFLOPS de potencia informática (equivalente a 2,1 mil millones de consolas SONY PS4)

Al mismo tiempo, la explosión de ChatGPT en 2022 desencadenará la ola de AIGC, aumentando aún más la demanda de potencia informática. En la serie GPT lanzada por Open AI, GPT3 es un modelo de lenguaje compuesto por 175 mil millones de parámetros, y GPT4 tiene billones de parámetros. A medida que aumenta el número de parámetros de modelos grandes, la potencia informática necesaria para entrenar un modelo de IA aumentará. 275 veces cada dos años. Esto ha llevado la tasa de crecimiento del mercado mundial de la informática con IA a un nuevo nivel. IDC predice que el mercado mundial de la informática con IA alcanzará los 34.660 millones de dólares en 2026, de los cuales el mercado de la informática generativa con IA crecerá de 820 millones de dólares en 2022 a los EE.UU. 10,99 mil millones de dólares en 2026. mil millones, lo que representa el 31,7% de la cuota de mercado de la informática con IA desde el 4,2%. Bajo esta tendencia de desarrollo, habrá una gran demanda de potencia informática en el futuro.

2. El costo de las amenazas a la seguridad es difícil de reducir y la industria de la potencia informática enfrenta desafíos

(1) Seguridad: acceso flexible a la red de potencia informática, muchos nodos de recursos distribuidos

  • La red de potencia informática consta de cinco partes principales: la capa de servicio de la red informática, la capa de programación de la red informática, el centro de potencia informática, el centro de usuario/potencia informática de borde y la red de transporte de potencia informática. Sin embargo, si bien esta arquitectura proporciona servicios informáticos eficientes y flexibles, también plantea una serie de desafíos de seguridad:

  • La red de potencia informática tiene las características de potencia informática ubicua y acceso flexible. Los enlaces de recursos frecuentes aumentarán la superficie de exposición a ataques de los recursos.

  • Hay una gran cantidad de datos confidenciales y privados circulando en la red informática. Si se manipulan o se filtran durante el proceso de transmisión, provocarán graves consecuencias.

  • El servicio informático es un servicio de extremo a extremo, con una gran base de usuarios, una gran cantidad de nodos de recursos distribuidos, una gestión de información de datos compleja y una trazabilidad difícil de la evidencia.

  • La nueva arquitectura de la red informática agrega elementos de red como la unidad de detección de la red informática y la unidad de control de la red informática, lo que aumenta la complejidad de la gestión y el control.

(2) Costo: las GPU son escasas y la potencia informática está seriamente inactiva.

A medida que la IA floreció, aumentó la demanda de GPU. Actualmente, la mayor parte del mercado de GPU está ocupado por NVIDIA. Sin embargo, el suministro de chips NVIDIA es escaso y los precios también están aumentando. Tomando como ejemplo la GPU A100, su precio unitario de mercado ha alcanzado los 150.000 yuanes, un aumento de más del 50%. dos meses. Al mismo tiempo, la aplicación de modelos grandes aumentará aún más los costos de potencia informática. Se ha calculado que 10.000 chips Nvidia A100 son el umbral de potencia informática para construir grandes modelos de IA. El coste único de formación de GPT3 ha superado los 12 millones de dólares.

Al mismo tiempo, la GPU tiene el problema de la potencia informática inactiva. El entrenamiento de GPT3 en un modelo con 175 mil millones de parámetros requiere que se guarden más de 1 TB de datos en la memoria, lo que excede cualquier GPU existente en la actualidad. Limitado por la memoria, se requieren más GPU para la computación y el almacenamiento en paralelo, lo que resulta en una baja utilización de la GPU y potencia de computación. inactivo. Además, debido a limitaciones de memoria, la relación entre la complejidad del modelo y la cantidad de GPU requeridas no es lineal, lo que agravará el problema de la baja utilización de la GPU. La tasa de utilización de la potencia informática se entrena en aproximadamente 25.000 GPU A100. es sólo del 32% al 36%. También existe una gran cantidad de potencia informática en centros de datos independientes, mineros de cifrado y dispositivos de consumo de los usuarios, como MacBooks y PC para juegos. Estos recursos son difíciles de agregar y utilizar.

A medida que la potencia informática aumente, la demanda de energía también crecerá rápidamente. Se espera que la demanda mundial de energía de los centros de datos sea de 430 a 748 teravatios hora entre 2023 y 2027, lo que equivale al 2-4 % de la demanda mundial de energía entre 2024 y 2027, lo que plantea desafíos para la infraestructura energética. Morgan Stanley predice que en un escenario de referencia en el que la utilización de GPU aumenta del 60% al 70%, la capacidad energética total de los centros de datos globales alcanzará los 70-122 GW entre 2023 y 2027, con una tasa de crecimiento anual compuesta del 20% en particular. :

  • Escenario de mercado alcista (90 % de utilización de chips): se espera que la demanda mundial de energía de los centros de datos sea de 446 a 820 teravatios hora entre 2023 y 2027.

  • Escenario de mercado bajista (50 % de utilización de chips): se espera que la demanda mundial de energía de los centros de datos sea de 415 a 677 teravatios hora entre 2023 y 2027.

Por lo tanto, las empresas que puedan satisfacer la creciente demanda de energía informática se beneficiarán de esta tendencia, especialmente aquellos proveedores de soluciones de energía que puedan reducir el retraso en el suministro de energía a los centros de datos.

2. Tendencias de desarrollo e introducción del proyecto.

1. La informática descentralizada proporciona soluciones informáticas seguras y de bajo coste para la Web 3

La esencia de la Web 1 es la asociación. Las páginas web son de "sólo lectura" y los usuarios sólo pueden buscar y explorar información. La esencia de la Web 2 es la interacción. El sitio web es "escribible y legible". También puedes participar en la creación de contenido. La Web 3 es la era del Internet de todo. Los sitios web son “legibles, escribibles y almacenables”. La propiedad y el control del contenido digital creado por los usuarios les pertenecen a ellos mismos, y pueden optar por firmar acuerdos con otros para su distribución. Como representante de la Internet de próxima generación, Web 3 enfatiza la descentralización, la apertura y la soberanía del usuario. La computación descentralizada es diferente de la computación en la nube tradicional y satisface efectivamente las necesidades informáticas impulsadas por la tecnología moderna y se ha convertido en el núcleo de la infraestructura de Web 3. Con el desarrollo de nuevas tecnologías de Internet y la mayor expansión del volumen de datos, el mercado de aplicaciones descentralizadas tiene amplias perspectivas de desarrollo, Zhiyan Consulting predice que se espera que el mercado global de aplicaciones descentralizadas alcance los 1.185.540 millones de dólares en 2025.

Frente a los desafíos de seguridad, costos y energía en la industria informática, la construcción de una red informática distribuida descentralizada es una dirección importante para el desarrollo de la infraestructura de IA. La informática descentralizada utiliza de manera integral los recursos informáticos existentes mediante el arrendamiento, el intercambio y la programación de la potencia informática para proporcionar una solución informática segura, de bajo costo y sin tiempo de inactividad para diversas aplicaciones en el ecosistema Web 3. En comparación con los sistemas centralizados tradicionales, las ventajas específicas de la informática descentralizada son las siguientes:

"Seguridad

  • Todos los participantes tienen capacidades de procesamiento. Si un participante se ve amenazado, otros participantes pueden reaccionar.

  • Permite el control y la toma de decisiones distribuidos. Ayuda a garantizar que ninguna entidad pueda ejercer un control total sobre Internet o sus usuarios, que los usuarios tengan menos probabilidades de ser monitoreados o censurados y que la privacidad y la libertad de expresión sean mayores en línea.

》Bajo costo: la informática descentralizada distribuye los costos y responsabilidades a múltiples entidades, lo que la hace más asequible y sostenible a largo plazo. La plataforma de potencia informática descentralizada Web 3 actualmente en el mercado puede proporcionar una potencia informática generalmente menor que las plataformas de potencia informática centralizadas 80-. 90% de descuento sobre el precio.

  • Potencia informática más barata. En los centros de datos tradicionales, la estructura de costos es de servidores (30%), vivienda (12%), red (15%), CA (21%), energía (17%) y mano de obra (5%), mientras que la informática descentralizada depende de Si los usuarios comparten recursos y aportan potencia informática de manera mutuamente beneficiosa, en teoría se puede ahorrar el 70% de los costos.

  • Costes de formación más baratos. La informática descentralizada permite escalar la capacitación de GNN a mil millones de modelos de borde con la ayuda de miles de subprocesos paralelos en tecnología sin servidor. Según una investigación de la UCLA, para modelos grandes, la computación descentralizada puede proporcionar un rendimiento 2,75 veces mayor por dólar que los sistemas tradicionales. Para modelos grandes y dispersos, la computación descentralizada es 1,22 veces más rápida y 4,83 veces más barata.

  • Costos de implementación más baratos. Las soluciones tradicionales de IA requieren importantes inversiones en desarrollo de software, infraestructura y talento. La informática descentralizada permite a los desarrolladores aprovechar la infraestructura y los recursos existentes, lo que facilita la creación e implementación de aplicaciones de IA. Al mismo tiempo, puede democratizar el desarrollo de la IA, permitiendo a los usuarios compartir recursos informáticos y colaborar para desarrollar soluciones de IA.

  • Infraestructura más adecuada para la IA. Al reducir el costo de la capacitación y la informática, la informática descentralizada tiene el potencial de permitir que más organizaciones e individuos utilicen la IA e impulsen el crecimiento y la innovación en numerosas industrias.

》Servicio sin tiempo de inactividad: los nodos de la red descentralizada están dispersos, en teoría nunca hay tiempo de inactividad y no hay un punto único de falla.

Introducción al proyecto

Akash Network: un mercado descentralizado de computación en la nube que permite a los usuarios comprar y vender recursos informáticos de forma segura y eficiente. A diferencia de otras plataformas descentralizadas, los usuarios pueden ejecutar cualquier aplicación nativa de la nube en contenedores administrados por Akash. No es necesario reescribir todo Internet en un nuevo lenguaje propietario y no existe un bloqueo de proveedor para evitar cambiar de proveedor de nube.

io.net: una red informática descentralizada que permite a los ingenieros de aprendizaje automático acceder a clústeres de nubes distribuidas a un costo menor que los servicios centralizados. Hay productos destacados como IO Worker, IO Cloud e IO Browser, que están valorados en más de mil millones de dólares en Solana.

2. La IA impulsa la informática de alto rendimiento, y la informática de alto rendimiento potencia la IA.

La computación de alto rendimiento se refiere a sistemas informáticos que utilizan supercomputadoras y grupos de computadoras paralelos para resolver problemas informáticos avanzados. Estos sistemas suelen ser más de un millón de veces más rápidos que los sistemas de escritorio, portátiles o servidores más rápidos y tienen aplicaciones en campos establecidos y emergentes, como los vehículos autónomos, el Internet de las cosas y la agricultura de precisión.

La informática de alto rendimiento solo representa alrededor del 5% del mercado total disponible en centros de datos. Sin embargo, con el rápido desarrollo de la IA y la aplicación de grandes modelos, el aumento de la IA y las cargas de trabajo de análisis de datos de alto rendimiento está impulsando cambios en la HPC. diseño del sistema. HPC También potencia la IA, y los dos promueven el desarrollo mutuo. El gasto global en HPC será de aproximadamente 37 mil millones de dólares en 2022, y Hyperion predice que alcanzará los 52 mil millones de dólares en 2026. Al mismo tiempo, el mercado de IA compatible con HPC tendrá una tasa de crecimiento compuesta del 22,7 % de 2020 a 2026.

Introducción al proyecto

Arweave: El protocolo AO recientemente propuesto, que utiliza una arquitectura de solución modular que no es Ethereum, puede lograr una computación de rendimiento ultraalto en la cadena pública de almacenamiento e incluso lograr una experiencia cuasi-Web2, lo que brinda a Web3 x AI una buena infraestructura nueva.

iExec: una plataforma de computación en la nube descentralizada que brinda servicios informáticos de alto rendimiento, lo que permite a los usuarios alquilar recursos informáticos para realizar tareas informáticas intensivas, como análisis, simulación y renderizado de datos.

CETI: Fundado por el ex CEO de crypto.com, apunta a centros de computación de alto rendimiento a nivel empresarial.

3. El punto de inflexión de la interacción hombre-computadora: la computación espacial

La computación espacial se refiere a computadoras que utilizan tecnología AR/VR para integrar la interfaz gráfica del usuario en el mundo físico real, cambiando así la interacción persona-computadora. El lanzamiento de los auriculares MR Hololens de Microsoft en 2015 fue un hito en la informática espacial moderna. Aunque no fue popular, demostró el potencial de la informática espacial. Este año, el Vision Pro lanzado por Apple trajo una tecnología de percepción espacial más precisa y más profunda. La experiencia interactiva del usuario lleva la computación espacial a la vanguardia.

De hecho, estamos alcanzando un punto de inflexión en la interacción persona-computadora: alejándonos de las configuraciones tradicionales de teclado y mouse hacia el borde de los gestos táctiles, la IA conversacional y las interacciones informáticas visuales mejoradas. Según el pronóstico de IDC, los envíos globales de dispositivos de realidad virtual alcanzarán los 9,17 millones de unidades en 2023, un aumento interanual del 7%, mientras que los envíos de dispositivos de realidad aumentada serán de 440.000 unidades, un aumento interanual del 57%. Se espera que en los próximos cuatro años, el mercado de realidad virtual Con una tasa de crecimiento anual de más del 20%, el mercado de AR alcance más del 70% El desarrollo de la tecnología AR/VR aumentará en gran medida la importancia de la computación espacial. Después de las PC y los teléfonos inteligentes, la computación espacial tiene el potencial de impulsar la próxima ola de cambios disruptivos: hacer que la tecnología forme parte de nuestro comportamiento diario y conectar nuestras vidas físicas y digitales con datos y comunicaciones en tiempo real.

Introducción al proyecto

Clore.ai: una plataforma que conecta a inquilinos y usuarios que necesitan GPU, diseñada para brindar a los usuarios acceso a potentes recursos informáticos a precios competitivos y términos flexibles. Su potente GPU permite a los usuarios renderizar películas a un nivel profesional, lo que reduce significativamente el tiempo necesario, y es compatible con varios motores de renderizado y también se puede utilizar para entrenamiento y minería de IA.

Render Network: una plataforma de renderizado de GPU descentralizada diseñada para avanzar en la tecnología de inteligencia artificial y renderizado de próxima generación. Los usuarios pueden extender el trabajo de renderizado de GPU a nodos de GPU de alto rendimiento en todo el mundo a pedido.

4. La computación perimetral se ha convertido en un complemento importante de la computación en la nube.

La computación de borde se refiere al procesamiento de datos en una ubicación que está físicamente más cerca del dispositivo terminal. El "borde" está en una ubicación donde el tiempo de ida y vuelta desde el usuario final es de como máximo 20 milisegundos. La computación de borde implementa recursos informáticos más cerca del. dispositivo terminal, que permite procesar los datos localmente, reduciendo así el retraso en la transmisión de datos a la nube para su procesamiento y la presión sobre el ancho de banda de la red, por lo que tiene más ventajas en términos de latencia, ancho de banda, autonomía y privacidad.

Gigantes tecnológicos como Facebook, Amazon, Microsoft, Google y Apple están invirtiendo en computación de punta y ubicaciones de borde (desde TI y OT internas hasta sitios remotos externos) para acercarse a los usuarios finales y al lugar donde se generan los datos. Bank of America predice que para 2025, el 75% de los datos generados por las empresas se crearán y procesarán en el borde. Para 2028, el tamaño del mercado de la computación de borde alcanzará los 404 mil millones de dólares, con una tasa de crecimiento anual compuesta del 15% a partir de 2022. al 28.

Introducción al proyecto

Aethir: la plataforma de infraestructura de computación en la nube Aethir Edge se lanzará en abril de 2024. Como único dispositivo de minería autorizado por Aethir, Aethir Edge lidera el desarrollo de la computación de borde descentralizada y democratiza el futuro de la computación de borde.

Theta Network: una plataforma de servicios de transmisión de video descentralizada diseñada para resolver problemas de cuellos de botella como el alto costo y la baja eficiencia en el sistema de transmisión de video existente. Está previsto lanzar Theta EdgeCloud, una plataforma híbrida de computación en la nube basada en una arquitectura completamente transfronteriza, en el segundo trimestre de 2024.

5. Se espera que la formación en IA se centre completamente en el razonamiento de la IA.

Bajo la tendencia de descentralización, la capacitación en IA no es actualmente el mejor escenario de implementación para DePIN. Los requisitos de potencia informática para la producción de IA se centran principalmente en dos aspectos: el razonamiento de la IA y el entrenamiento de la IA. El entrenamiento de IA se refiere al entrenamiento de un modelo de red neuronal complejo alimentando una gran cantidad de datos. El razonamiento de IA se refiere al uso de un modelo entrenado para usar una gran cantidad de datos para inferir varias conclusiones. Por lo tanto, la descentralización se combina con la potencia informática y la dificultad. El coeficiente es de El proceso desde el entrenamiento hasta el ajuste fino del entrenamiento y la inferencia disminuye capa por capa. Si se construye una aplicación de potencia informática descentralizada en Ethereum para uso de GPT, una sola operación de multiplicación de matriz consumirá hasta 10 mil millones de dólares estadounidenses en tarifas de gas y tomará 1 mes, cada token (1000 tokens equivalen aproximadamente a 750 palabras). El costo de capacitación suele ser de aproximadamente 6 N (N es el número de parámetros de un modelo de lenguaje grande), mientras que el costo de inferencia es solo de aproximadamente 2 N, lo que significa que el costo de inferencia es aproximadamente un tercio del costo de capacitación.

Al mismo tiempo, en comparación con el entrenamiento de IA, el razonamiento de IA está más estrechamente relacionado con las necesidades de terminales de aplicaciones a gran escala, como la electrónica de consumo. Counterpoint Research predice que los envíos del mercado mundial de PC volverán a los niveles previos a la epidemia en 2024. Se espera que las PC con IA crezcan a una tasa de crecimiento compuesta del 50% a partir de 2020 y dominen el mercado de PC después de 2026. Con la aparición de nuevos productos electrónicos de consumo integrados con IA, como PC con IA y teléfonos inteligentes con IA en 2024, la tendencia a la aplicación a gran escala de modelos de IA finales a gran escala y software de IA se hará cada vez más evidente. La importancia del razonamiento de la IA será cada vez más prominente y se convertirá en Con la tecnología central detrás de la ejecución eficiente de grandes modelos en el dispositivo y el software de IA, se espera que el enfoque de desarrollo de la industria de la IA pase del entrenamiento a la inferencia.

Introducción al proyecto

Nosana: una plataforma distribuida para compartir recursos de GPU basada en blockchain, diseñada para resolver el problema de la escasez de GPU en el mercado. Pasar a la inferencia de IA en 2023, siendo pionero en el lanzamiento de una red informática GPU a gran escala para la inferencia de IA, un movimiento decidido para integrar la tecnología blockchain en la IA, convirtiéndola en una herramienta ideal para manejar los exigentes requisitos informáticos de la IA.

Exabits: una plataforma de servicios informáticos de alto rendimiento e inteligencia artificial descentralizada que tiene como objetivo construir un ecosistema de inteligencia artificial justo, fácil de usar e inclusivo y proporcionar computación acelerada asequible para el entrenamiento y la inferencia de modelos de inteligencia artificial.