在 3 月 29 日的一篇部落格文章中,马斯克宣布下周发布 Grok 聊天机器人的升级版。该版本将提前向社交媒体平台上的早期测试者和现有 Grok 用户开放。

Grok-1.5 是 Grok-1 的增强版本,改进了推理能力,可以处理长达 128,000 个单字的上下文。 xAI 分析还表明,聊天机器人在与编码和数学相关的任务中也表现出了卓越的表现。

然而,Grok-1.5 仍然不如 Google 的 Gemini Pro 1.5 和 OpenAI 的 GPT-4。据研究,Grok-1.5 在 MATH 基准上仅得分 50.6%,在 GSM8K 基准上仅得分 90%,这是评估从小学到高中水平的数学解决能力的两个基准。

此外,该虚拟助手在用于评估代码创建和解决问题能力的 HumanEval 基准测试中仅得分 74.1%。

人工智能聊天机器人分析。 (来源:xAI)

xAI 补充说,Grok-1.5 构建在基于 JAX、Rust 和 Kubernetes 的定制分布式训练平台上,使 xAI 团队可以轻松地产生想法并大规模训练新架构。

本月早些时候,xAI 通过开源 Grok-1 代码库向前迈出了重要一步。这一决定源于马斯克针对他曾经共同创立的组织 OpenAI 提起的法律诉讼。马斯克指责 OpenAI 背离了最初的承诺,即优先考虑开源开发而不是股东利益。

发布的源代码是 Grok-1 预训练阶段的粗略基础模型测试,于 2023 年 10 月完成。这意味着该模型没有针对任何特定应用(例如对话)进行微调。