阿里巴巴最新的 AI 模型 QwQ-32B-Preview 在某些基准测试中超越了 OpenAI 的 O1

随著 AI 领域竞争的加剧，中国零售巨头阿里巴巴推出了其 QwQ-32B-Preview，据报导其性能超过了 OpenAI 的 o1 系列。
最新模型据报导在一些特定基准上超过了 OpenAI 的 o1-preview 和 o1-mini 模型，例如 AIME 和 MATH 测试，这些测试评估 AI 模型在逻辑谜题和数学问题中的表现。
阿里巴巴已经发布了 QwQ-32B-Preview 供下载。
根据这家零售巨头的说法，阿里巴巴的新模型能够解决比正常的大型语言模型（LLMs）如 ChatGPT-4 和 Claude 3.5 更复杂和精细的问题。
Benzinga 的一篇文章指出，QwQ-32B-Preview 是少数几个可在宽松许可下获得的模型之一，使得用户可以下载和使用。该模型现在可在 AI 开发平台 Hugging Face 上获得。
然而，阿里巴巴发布了模型的某些组件以限制模型的完全复制或对其运作的洞察。
阿里巴巴的最新模型拥有 325 亿个参数，使其能够处理最多 32000 字的提示。凭借模型的显著能力和半开放的可访问性，阿里巴巴的新参与者为 AI 推理技术的变革性飞跃奠定了基础。
阿里巴巴的透明公告突显了其模型的复杂性，而 OpenAI 则保持其参数计数的保密。
这个模型的到来正值 OpenAI 在 AI 领域取得重大进展之际。去年十月，OpenAI 的估值在一次成功的融资后飙升至 1570 亿美元。
本周早些时候，软银集团 SFTBF 据报导通过 15 亿美元的员工股份回购增加了对 ChatGPT 制造商的持股。
据说 OpenAI 也在探索开发自己的浏览器，以挑战 Alphabet 的子公司 Google Chrome 浏览器，此举是因为美国司法部的压力要求其剥离。
阿里巴巴也承认该模型存在缺陷
虽然它拥有一些独特的优势，但新模型也有其局限性。根据该团体的说法，QwQ-32B-Preview 存在意外的语言切换等问题，这可能会使用户感到困惑。该模型在需要常识推理的任务中表现不佳，这在许多 AI 系统中是常见的。
根据 AutoGPT 的说法，该模型可能会陷入逻辑循环，延迟回应。
尽管存在缺陷，其推理能力使其能够自我事实检查，因此减少错误但增加解决时间。
通过推理任务和计划步骤，阿里巴巴的模型避免了一些影响传统 AI 系统的陷阱。但这种方法需要额外的时间，这可能限制了实时应用。
根据 Benzinga 的报导，QwQ-32B-Preview 的回应符合中国的监管标准，避免了政治敏感话题。
例如，像台湾这样的政治敏感话题将给出与中国政府立场一致的回应。
此外，对于像天安门广场这样的事件的提示不会产生任何回应，显示出该模型的谨慎设计。
虽然这对中国市场来说可能是理想的，但也可能限制其在全球市场上的吸引力。然而，该模型是在推理 AI 世界中的一个重要步骤。虽然其局限性可能会缩小其全球吸引力，但其逻辑和半开放性等其他组件使其成为 OpenAI 的一个强大竞争者。
根据 AutoGPT 的说法，QwQ-32B-Preview 突显了这一激动人心的前沿的潜力和挑战，全球的 AI 实验室正在努力完善推理技术。
从零到 Web3 专业：您的 90 天职业启动计划

阿里巴巴最新的 AI 模型 QwQ-32B-Preview 在某些基准测试中超越了 OpenAI 的 O1

创作者的更多内容

实时新闻

阿里巴巴最新的 AI 模型 QwQ-32B-Preview 在某些基准测试中超越了 OpenAI 的 O1

创作者的更多内容

实时新闻

热门文章