作者:Josh O'Sullivan,CoinTelegraph;編譯:白水,金色財經

以太坊聯合創始人 Vitalik Buterin 已認可新的 Token for Image Tokenizer (TiTok) 壓縮方法,用於其潛在的區塊鏈應用。

不要與社交媒體平臺 TikTok 混淆,新的 TiTok 壓縮方法顯著減小了圖像大小,使其更適合存儲在區塊鏈上。

Buterin 在去中心化社交媒體平臺 Farcaster 上強調了 TiTok 的區塊鏈潛力,稱“320 位基本上是一個哈希值。小到足以讓每個用戶上鍊。”

這一發展可能對個人資料圖片 (PFP) 和非同質化代幣 (NFT) 的數字圖像存儲產生重大影響。

TiTok 圖像壓縮

TiTok 由字節跳動和慕尼黑工業大學的研究人員共同開發,可以在不損失質量的情況下將圖像壓縮爲 32 個小數據塊(位)。

根據 TiTok 研究論文,先進的人工智能 (AI) 圖像壓縮使 TiTok 能夠將 256x256 像素的圖像壓縮爲“32 個離散標記”。

TiTok 是一個一維 (1D) 圖像標記化框架,它“打破了 2D 標記化方法中存在的網格約束”,從而產生更靈活、更緊湊的圖像。

“因此,它可以顯著加快採樣過程(例如,比 DiT-XL/2 快 410 倍),同時獲得具有競爭力的生成質量。”

TikTok 研究論文展示了圖像壓縮大小的比較。資料來源:TikTok

機器學習圖像

TiTok 利用機器學習和先進的人工智能,使用基於變換器的模型將圖像轉換爲標記化表示。

該方法使用區域冗餘,這意味着它識別並使用圖像不同區域中的冗餘信息來減少最終產品的整體數據大小。

“生成模型的最新進展凸顯了圖像標記在高分辨率圖像有效合成中的重要作用。”

根據研究論文,TiTok 的“緊湊潛在表示”可以產生“比傳統技術更高效、更有效的表示”。

使用 TiTok 框架 (c) 進行圖像重建 (a) 和生成 (b) 的圖示。來源:TiTok

TikTok,不是TikTok

儘管名字相似,但社交媒體平臺 TikTok 並未獲得 Buterin 的認可。

以太坊聯合創始人強調了 TiTok 的區塊鏈潛力,爲這種新的人工智能驅動的圖像壓縮方法增添了可信度。

“與將圖像潛在空間視爲 2D 網格的現有 2D VQ 模型不同,我們提供了一種更緊湊的公式來將圖像標記爲 1D 潛在序列。”

提出的新方法可以“用比“2D 標記器”少 8 到 64 倍的標記來表示圖像”,該團隊希望這項研究能夠爲“更有效的圖像表示”提供啓示。