Odaily星球日报讯 OpenAI 周二发布了一组改进的编码挑战,人工智能公司可以使用这些挑战来测试其模型的编程能力。这些挑战来自一组被称为 SWE-bench(软件工程基准的缩写)的真实编程问题,而这些问题对人工智能来说很有难度。(The Information)