Згідно з Odaily, OpenAI представив набір покращених проблем кодування, спрямованих на оцінку можливостей програмування моделей штучного інтелекту. Ці виклики випливають із набору реальних проблем програмування, відомих як SWE-bench, що розшифровується як Software Engineering Benchmark. Складність цих проблем є серйозною проблемою для систем ШІ.