Apple 發佈了 OpenELM,這是一種生成式 AI 模型,其表現優於在公共數據集上訓練的其他語言模型,準確率提高了 2.36%,預訓練 token 數量減少了 2 倍。

OpenELM 採用逐層縮放來優化 Transformer 模型參數分配,從而提高了基準測試的準確率,因爲每個層的配置和參數都不同。

#Apple #openELM #AI #BullorBear #Megadrop