Apple 发布了 OpenELM,这是一种生成式 AI 模型,其表现优于在公共数据集上训练的其他语言模型,准确率提高了 2.36%,预训练 token 数量减少了 2 倍。
OpenELM 采用逐层缩放来优化 Transformer 模型参数分配,从而提高了基准测试的准确率,因为每个层的配置和参数都不同。
#Apple #openELM #AI #BullorBear #Megadrop