Autor: Josh Ho y Teng Yan, Cadena de pensamiento Traducción: Golden Finance xiaozou;
En este artículo, analizaremos en profundidad Hyperbolic, un servicio de nube de IA de acceso abierto actualmente popular. La ambiciosa misión de Hyperbolic es hacer que la IA sea más accesible proporcionando potencia informática de inferencia asequible.
Pero antes de eso, echemos un vistazo a lo que creemos que son algunas de las cosas más interesantes sobre Hyperbolic...
1. El secreto de la hiperbólica: prueba de muestreo
Hyperbolic está abriendo nuevos caminos al resolver uno de los desafíos más difíciles de la inteligencia artificial: verificar si un resultado realmente proviene de un modelo de IA específico.
Este problema es especialmente problemático para los proveedores centralizados de código cerrado como OpenAI. Cuando solicita resultados de GPT-4, ¿cómo puede estar seguro de que no lo están engañando, por ejemplo, si OpenAI ejecuta el modelo GPT-3.5 más económico (1/20 del precio por token)?
Actualmente, dichas garantías dependen de la reputación, pero Hyperbolic cree que esto debe manejarse de manera descentralizada y sin confianza.
Actualmente existen varias formas de hacer esto:
· Aprendizaje automático optimista (OpML): asume que todas las transacciones son válidas a menos que las cuestione un validador.
· Aprendizaje automático de conocimiento cero (zkML): Utilice circuitos ZK para verificar que los cálculos se realicen correctamente.
Sin embargo, ambos tienen limitaciones:
· OpML depende de validadores para verificar los resultados, lo que retrasa la finalidad debido a los períodos de disputa. Además, faltan incentivos intrínsecos para garantizar que los validadores se comporten con integridad.
· zkML es muy intensivo desde el punto de vista computacional, a veces incluso tarda días en generar una prueba de modelo grande con más de 70 mil millones de parámetros.
Hyperbolic tiene como objetivo superar estas deficiencias a través de su protocolo de prueba de muestreo (PoSP) y aprendizaje automático muestreado (SpML). SpML utiliza muestreo y teoría de juegos para fomentar un comportamiento honesto sin la necesidad de una supervisión constante.
Se basa en un concepto de teoría de juegos puramente estratégico llamado Equilibrio de Nash, donde todos los jugadores tienen un incentivo claro para actuar con integridad porque los costos de hacer trampa exceden las ganancias potenciales.
La forma más sencilla de verlo es como un sistema de emisión de billetes de autobús.
Los inspectores de billetes sólo realizan controles aleatorios, por lo que se podría pensar que los pasajeros a menudo corren el riesgo de evadir las tarifas. Pero, sorprendentemente, no lo hacen porque las sanciones por evasión de tarifas son lo suficientemente fuertes como para disuadir a los pasajeros de hacer trampa. Siempre que la multa supere con creces el coste de compra del billete, prevalecerá la integridad.
SpML de Hyperbolic utiliza incentivos financieros para abordar las limitaciones de los mecanismos de verificación actuales como OpML y zkML. Proporciona un buen equilibrio entre velocidad y seguridad sin una gran carga computacional.
¿A qué debo prestar atención? Es decir, se supone que todo el mundo se comporta racionalmente, lo que no siempre es así.
Si SpML funciona bien en la práctica, cambiará las reglas del juego para las aplicaciones de IA descentralizadas, haciendo realidad la inferencia verificada sin confianza.
2. Computación escalable y de bajo costo
Entrenar IA es costoso. La energía y el acceso a la informática se encuentran entre los mayores costos que enfrentan las empresas y las nuevas empresas. El coste de la potencia informática necesaria para entrenar modelos casi se duplica cada 9 meses.
El costo de GPT-3 en 2020 es de aproximadamente 4 millones de dólares, mientras que el costo de entrenamiento computacional de GPT-4 en 2023 asciende a 190 millones de dólares, lo cual es asombroso.
Sólo las organizaciones con buenos recursos pueden sobrevivir. Los jugadores más pequeños y los entusiastas quedan excluidos del mercado debido a costes exorbitantes. Un postdoctorado en Stanford tuvo que detener su investigación porque no podía permitirse los miles de GPU que necesitaba.
Un desafío importante en las redes informáticas descentralizadas es la gestión de hardware heterogéneo: no sólo chips Nvidia de primera línea, sino también una variedad de GPU.
El sistema operativo descentralizado de Hyperbolic está en el corazón de su red informática. Agrupará recursos sin problemas con escalado automático y tolerancia a fallas integrados.
El gran avance de Hyperbolic radica en su aproximación a esta complejidad.
· Proporciona flexibilidad al optimizar las operaciones tensoriales en diferentes hardware, desde Nvidia hasta GPU AMD.
· La pila de compilación de Hyperbolic abstrae la complejidad, lo que permite a los desarrolladores lograr un alto rendimiento en diferentes configuraciones de GPU sin atascarse en la implementación y configuración.
Otros mercados pueden ofrecer GPU descentralizadas, pero a menudo carecen de las optimizaciones sofisticadas que Hyperbolic puede proporcionar, lo que coloca la carga del ajuste del rendimiento en el usuario.
Hyperbolic simplifica esto a través de una API que brinda acceso a modelos de IA optimizados para una variedad de hardware, lo que hace que los recursos informáticos del mundo sean más accesibles.
El 15 de agosto, Hyperbolic lanzó una versión alfa restringida de su GPU Marketplace, lo que permitió a 100 miembros en espera probar la función de alquiler de GPU.
3. Capa de servicios de IA
El siguiente componente del ecosistema de IA hiperbólica es la capa de servicios de IA, que proporciona funciones como inferencia, entrenamiento de modelos, evaluación de modelos y generación aumentada de recuperación (RAG).
En la aplicación Hyperbolic puedes ejecutar fácilmente los mejores modelos de código abierto, como Llama 3.1 405B y Hermes 370B. Para ajustar la salida, puede ajustar hiperparámetros como tokens máximos, temperatura y P superior.
La plataforma Hyperbolic abre la puerta a aplicaciones innovadoras de IA, que incluyen:
· Reparto de ingresos de los agentes de IA: tokenizar la propiedad de los agentes de IA para redistribuir los ingresos.
· Inteligencia Artificial DAO: Utilizar inteligencia artificial para tomar decisiones de gobernanza.
· Propiedad dividida de GPU: permite a los usuarios poseer e intercambiar partes de una GPU.
4. ¿Qué papel juega Crypto?
El núcleo de la infraestructura de Hyperbolic es su cadena de bloques, que sustenta las capas de orquestación, servicio y verificación. Blockchain se encarga de la liquidación y la gobernanza de la nube de inteligencia artificial de código abierto de Hyperbolic. También soporta los mecanismos de arbitraje y verificación de la tecnología PoSP.
Si bien todavía hay muy pocos detalles sobre la cadena de bloques, puede esperar que Hyperbolic revele más al respecto pronto.
5. Alfa de nivel de investigación
Hyperbolic todavía se encuentra en la etapa de prueba. Recaudaron 7 millones de dólares en una ronda inicial liderada por Polychain Capital y Lightspeed Faction.
Curiosamente, Hyperbolic es el proveedor exclusivo del modelo Llama 3.1 405B Base.
El modelo Base es la versión inicial previamente entrenada de LLM sin ajuste ni aprendizaje reforzado con retroalimentación humana (RLHF). Tiene las siguientes ventajas:
· Soporte integral para el ajuste de tareas específicas
· Es el punto de partida para técnicas avanzadas de inteligencia artificial, como la generación de datos sintéticos o la destilación de modelos.
6. Sobre el equipo
El Dr. Jasper (Yue) Zhang es el cofundador y director ejecutivo de Hyperbolic Labs. Anteriormente fue investigador senior de blockchain en Ava Labs e investigador cuantitativo en Citadel Securities. Obtuvo un doctorado en matemáticas de la Universidad de California, Berkeley, en dos años y ganó medallas de oro tanto en la Competencia Global de Matemáticas de Alibaba como en la Olimpíada de Matemáticas de China.
El Dr. Yuchen Jin es cofundador y director de tecnología de Hyperbolic Labs. Tiene un doctorado en Sistemas y Redes Informáticas de la Universidad de Washington. Anteriormente trabajó en OctoML, una empresa que proporciona infraestructura para ejecutar, ajustar y escalar aplicaciones de IA generativa.
7. Algunos de nuestros pensamientos
En general, estamos muy entusiasmados con Hyperbolic. Definitivamente son uno de los equipos más notables en el campo Crypto AI.
Hyperbolic es más que un simple proveedor de potencia informática; innovaciones como PoSP y SpML también añaden nuevas capas de confianza y verificación a la IA descentralizada.
Es muy interesante experimentar con modelos base en Hyperbolic, especialmente porque son uno de los pocos proveedores actualmente capaces de implementar esta característica. Podemos confiar absolutamente en su compromiso con la IA de código abierto.
Hace unas semanas escribimos sobre Prime Intellect. Queda por ver si Hyperbolic se centrará en el entrenamiento de IA distribuida como Prime Intellect.
Si bien observamos que la demanda de potencia informática es generalmente escasa, este no parece ser el caso de Hyperbolic. Ya han mostrado una tracción temprana en el mercado de la investigación, atrayendo un gran interés por parte de investigadores y desarrolladores.