Esto puede no parecer mucho, pero desplegar dos LLMs—8B y 70B parámetros—en nuestras propias GPU con un algoritmo diseñado a medida para almacenar memoria de chat fue increíblemente difícil! Solo quedan unos pequeños ajustes en la interfaz de usuario, y Athena 2 Eos y Titan están a punto de salir en vivo
#Argochain #DevolvedAI $AGC #AI $POL #MEXC