El fabricante de chips Ampere Computing ha anunciado una asociación con Qualcomm para desarrollar un servidor de IA de nueva generación, utilizando las CPU de Ampere y el chip de inferencia AI Cloud AI 100 Ultra de Qualcomm, que promete un alto rendimiento y ahorro de energía.
En su hoja de ruta de desarrollo para el próximo año, Ampere Computing, empresa especializada en la fabricación de chips ARM para servidores de centros de datos, sorprendió a todos al anunciar una asociación con Qualcomm, nombre famoso por sus chips móviles.
La combinación tiene como objetivo aprovechar las fortalezas de ambas partes para crear una nueva línea de servidores de inferencia de IA, utilizando la CPU de Ampere y el chip Cloud AI 100 Ultra de Qualcomm. Esta solución está diseñada para ejecutar modelos de IA a gran escala, especialmente modelos de lenguaje grandes (LLM) y aplicaciones de IA generativa, de una manera eficiente y energéticamente eficiente.
Según Jeff Wittich, director de tecnología de Arm, “Trabajamos con Qualcomm para crear una solución de nivel de servidor que combine de manera efectiva las CPU Ampere con sus tarjetas de alto rendimiento. Esto no es sólo un desarrollo común, sino una revolución en la forma en que abordamos la IA”.
Los resultados de las pruebas muestran que el modelo de lenguaje Llama 3 de Meta que se ejecuta en la CPU Ampere en Oracle Cloud logra un rendimiento equivalente al de la GPU Nvidia A100 pero consume menos energía. Ampere y Qualcomm creen que el nuevo servidor será una opción atractiva para las empresas que buscan soluciones de inteligencia artificial potentes y energéticamente eficientes.
Además, Ampere también presentó el nuevo chip AmpereOne con 256 núcleos, fabricado en un proceso avanzado de 3 nm, que admite RAM DDR5 de 12 canales, lo que permite a los clientes de centros de datos ajustar de manera flexible el acceso a la memoria según sus necesidades.
Sin detenerse ahí, Ampere también cooperó con NETINT para crear una solución que combina su CPU con el chip de procesamiento de video de NETINT. El nuevo servidor es capaz de codificar 360 canales de video en vivo en paralelo y utiliza el modelo de texto a voz Whisper de OpenAI para generar subtítulos para 40 transmisiones de video.
Estas colaboraciones demuestran los esfuerzos de Ampere para expandir el mercado más allá del sector tradicional de centros de datos, hacia aplicaciones de IA en medios, entretenimiento, comercio minorista y fabricación.