La empresa de inteligencia artificial DeepSeek, con financiación de un importante fondo de inversión chino, acaba de anunciar un nuevo modelo de inteligencia artificial diseñado para competir directamente con o1 de OpenAI.
DeepSeek-R1 es un modelo de inteligencia artificial avanzado que utiliza un enfoque de "razonamiento", lo que le permite verificar la precisión de las respuestas mediante un análisis profundo y tomándose más tiempo para pensar antes de recibir comentarios.
De manera similar al modelo o1 de OpenAI, DeepSeek-R1 realiza acciones secuenciales para llegar a un resultado, lo que puede tardar decenas de segundos dependiendo de la complejidad de la pregunta.
En las pruebas, DeepSeek-R1 logró un rendimiento comparable al de la vista previa o1 de OpenAI en dos puntos de referencia populares: AIME y MATH. Sin embargo, DeepSeek-R1 no es perfecto; algunos usuarios encontraron que el modelo tenía problemas simples y podía ser "descifrado" para dar respuestas inseguras, incluso sensibles.
DeepSeek ha aplicado estrictas medidas de censura para evitar temas políticamente delicados. Esto refleja las regulaciones del gobierno chino, que exigen que los modelos de IA demuestren “valores fundamentales socialistas”. Además, estas restricciones se pueden aplicar mediante la inclusión en una lista negra de fuentes de datos que no se utilizarán en la capacitación.
El lanzamiento de DeepSeek-R1 se produce en un momento en que los modelos tradicionales de IA se enfrentan a los límites de las “leyes de escala”: la teoría de que aumentar los datos y la potencia informática ayudará a mejorar las capacidades de la IA. En cambio, las empresas están buscando nuevas direcciones como la “computación en tiempo de prueba”, la tecnología utilizada en DeepSeek-R1, que permite a los modelos utilizar más tiempo de procesamiento al realizar tareas.
DeepSeek no sólo impresiona por su tecnología sino también por su enorme inversión. Financiado por High-Flyer Capital Management, un fondo de inversión cuántico chino, DeepSeek posee un grupo de servidores que contiene 10.000 GPU Nvidia A100 a un costo de hasta 138 millones de dólares. La compañía también anunció que abrirá el código fuente de DeepSeek-R1 y proporcionará API a la comunidad.
DeepSeek ha ejercido presión sobre competidores nacionales como ByteDance, Baidu y Alibaba, obligándolos a reducir los precios o proporcionar algunos modelos de IA de forma gratuita para seguir siendo competitivos. Con DeepSeek-R1, la empresa continúa fortaleciendo su posición en el campo de la IA, marcando un importante paso adelante en la carrera tecnológica global.