Podle Odailyho představila OpenAI sadu vylepšených kódovacích výzev zaměřených na vyhodnocení programovacích schopností modelů umělé inteligence. Tyto výzvy jsou odvozeny ze souboru reálných programovacích problémů známých jako SWE-bench, což je zkratka pro Software Engineering Benchmark. Složitost těchto problémů představuje pro systémy umělé inteligence významnou výzvu.