Nvidia puede enfrentar más retrasos con sus chips de IA Blackwell, que se introdujeron a principios de este año, que supuestamente están sobrecalentándose en configuraciones de servidores, lo que genera preocupaciones.
Según The Information, hay temores de que los chips puedan crear desafíos para grandes consumidores de servicios en la nube como Meta Platforms, Google y Microsoft. Esto ocurre mientras estos gigantes tecnológicos se preparan para desarrollar centros de datos dependiendo de esta tecnología.
Nvidia ha solicitado un rediseño de los estantes para abordar el problema.
La Información informa además que el sobrecalentamiento está surgiendo de chips colocados en estantes de servidores que están destinados a soportar hasta 72 unidades. Como parte de los esfuerzos para limitar el desafío, Nvidia ha solicitado a los proveedores que remodelen los estantes repetidamente.
Los varios rediseños en los estantes han suscitado preocupaciones entre sus clientes sobre retrasos en la instalación de nueva tecnología de centros de datos de IA.
Algunos consumidores y empleados han confirmado el problema de sobrecalentamiento con los chips de IA Blackwell.
“Nvidia está trabajando con los principales proveedores de servicios en la nube como parte integral de nuestro equipo y proceso de ingeniería,” dijo un portavoz de Nvidia a Reuters.
“Las iteraciones de ingeniería son normales y esperadas.”
Portavoz de Nvidia.
Los chips de IA Blackwell se presentaron por primera vez en marzo y se suponía que llegarían al mercado en el segundo trimestre, pero enfrentaron retrasos en las entregas, afectando posteriormente los cronogramas de implementación de los clientes.
Los chips supuestamente combinan dos componentes de silicio en una unidad destinada a funcionar más rápido que las versiones anteriores en trabajos como la creación de respuestas de chatbots.
Según Guru Focus, con los productos de Nvidia siendo esenciales para plataformas tecnológicas clave, este problema sigue las intentos del gigante tecnológico de establecer su liderazgo en IA y computación en la nube.
Además, el desafío del sobrecalentamiento podría causar preguntas sobre si las crecientes necesidades de proyectos de IA intensivos en datos pueden ser satisfechas.
El gigante de la fabricación de chips aún no ha revelado qué proveedores ayudan a remediar los problemas de diseño o cuándo se pueden resolver las preocupaciones de sobrecalentamiento. Los retrasos adicionales podrían influir en los planes de infraestructura de IA más amplios de clientes críticos.
El precio de Nvidia cayó en respuesta a la noticia del sobrecalentamiento.
Un informe de Tom's Hardware indicó que el lanzamiento de los chips de IA Blackwell ya se había retrasado varios meses porque Nvidia estaba trabajando en un defecto de diseño que afectaba los rendimientos de producción.
Ahora, los inversores informaron que el precio de las acciones de Nvidia se retiró tras los informes de que sus chips de IA Blackwell se calientan al ser instalados en estantes de servidores de alta capacidad.
Las acciones cayeron un 2.9% en las operaciones previas al mercado en la bolsa de valores. Sin embargo, en términos de año hasta la fecha, las acciones han subido un 187%.
“Habíamos oído que los diseños de servidores aún se estaban finalizando a partir del mes pasado, pero nos sorprendería si los envíos de NVL72 se retrasan significativamente debido a problemas de calor (y refrigeración),” dijo el analista de Wedbush Securities, Matt Bryson, en una nota a un cliente el lunes.
“Dicho esto, será un tema sobre el que preguntaremos en la SC24 esta semana.”
Bryson.
La SC24 es una conferencia sobre computación de alto rendimiento, redes y análisis y se está llevando a cabo en Atlanta. Se espera que Nvidia publique sus ganancias del tercer trimestre este miércoles.
La noticia del sobrecalentamiento ha suscitado más preocupaciones sobre el impacto de la IA en el consumo de energía y agua. Las GPU avanzadas supuestamente pueden ser 30 veces más rápidas que las GPU anteriores. Cuanto más potente es una GPU, más calor produce.
Según PCmag, ejecutar modelos de IA generativa requiere mucha energía así como agua para enfriar los servidores, lo que resulta en algunas predicciones de que los centros de datos experimentarán escasez de agua tan pronto como en 2025, ya que las empresas tecnológicas no son tan rápidas para añadir electricidad a la red eléctrica como lo son para añadir los centros de datos.
De Cero a Web3 Pro: Tu Plan de Lanzamiento Profesional de 90 Días