Autor: Josh O'Sullivan, CoinTelegraph; Compilador: Bai Shui, Golden Finance;

El cofundador de Ethereum, Vitalik Buterin, ha respaldado el nuevo método de compresión Token for Image Tokenizer (TiTok) para sus posibles aplicaciones blockchain.

No debe confundirse con la plataforma de redes sociales TikTok, el nuevo método de compresión TiTok reduce significativamente el tamaño de la imagen, lo que la hace más adecuada para el almacenamiento en blockchain.

Buterin destacó el potencial de la cadena de bloques de TiTok en la plataforma descentralizada de redes sociales Farcaster, diciendo que "320 bits es básicamente un hash. Lo suficientemente pequeño como para que todos los usuarios estén en la cadena".

Este desarrollo podría tener implicaciones significativas para el almacenamiento de imágenes digitales de perfiles personales (PFP) y tokens no fungibles (NFT).

Compresión de imágenes TiTok

Desarrollado por investigadores de ByteDance y la Universidad Técnica de Munich, TiTok comprime imágenes en 32 pequeños fragmentos de datos (bits) sin perder calidad.

Según el artículo de investigación de TiTok, la compresión de imágenes avanzada de inteligencia artificial (IA) permite a TiTok comprimir una imagen de 256x256 píxeles en "32 marcadores discretos".

TiTok es un marco de tokenización de imágenes unidimensional (1D) que "rompe las limitaciones de la cuadrícula presentes en los métodos de tokenización 2D", lo que da como resultado imágenes más flexibles y compactas.

"Como resultado, puede acelerar significativamente el proceso de muestreo (por ejemplo, 410 veces más rápido que DiT-XL/2) y al mismo tiempo lograr una calidad de generación competitiva".

Un artículo de investigación de TikTok muestra una comparación de los tamaños de compresión de imágenes. Fuente: TikTok

Imágenes de aprendizaje automático

TiTok aprovecha el aprendizaje automático y la inteligencia artificial avanzada para convertir imágenes en representaciones tokenizadas utilizando un modelo basado en transformadores.

El método utiliza redundancia regional, lo que significa que identifica y utiliza información redundante en diferentes áreas de la imagen para reducir el tamaño general de los datos del producto final.

"Los avances recientes en modelos generativos resaltan el importante papel del etiquetado de imágenes en la síntesis eficiente de imágenes de alta resolución".

Según el artículo de investigación, la "representación latente compacta" de TiTok puede producir "representaciones más eficientes y efectivas que las técnicas tradicionales".

Ilustración de la reconstrucción de imágenes (a) y generación (b) utilizando el marco TiTok (c). Fuente: TikTok

TikTok, no TikTok

A pesar del nombre similar, la plataforma de redes sociales TikTok no cuenta con el respaldo de Buterin.

El cofundador de Ethereum destacó el potencial de la cadena de bloques de TiTok, dando credibilidad al nuevo método de compresión de imágenes impulsado por IA.

"A diferencia de los modelos 2D VQ existentes que tratan el espacio latente de la imagen como una cuadrícula 2D, proporcionamos una formulación más compacta para etiquetar imágenes como secuencias latentes 1D".

El nuevo método propuesto puede "representar imágenes con entre 8 y 64 veces menos marcadores que el "marcador 2D", y el equipo espera que la investigación arroje luz sobre una "representación de imágenes más eficiente".