据Odaily星球日报报道,OpenAI 周二发布了一组改进的编码挑战,人工智能公司可以使用这些挑战来测试其模型的编程能力。这些挑战来自一组被称为 SWE-bench 的真实编程问题,而这些问题对人工智能来说很有难度。