根據 Odaily 報導,OpenAI 推出了一系列改進的編碼挑戰,旨在評估人工智慧模型的程式設計能力。這些挑戰源自於一系列現實世界的程式設計問題,稱為 SWE-bench,它代表軟體工程基準。這些問題的複雜性對人工智慧系統提出了重大挑戰。