De acordo com a Odaily, a OpenAI introduziu um conjunto de desafios de codificação aprimorados com o objetivo de avaliar as capacidades de programação de modelos de inteligência artificial. Esses desafios são derivados de uma coleção de problemas de programação do mundo real conhecidos como SWE-bench, que significa Software Engineering Benchmark. A complexidade desses problemas apresenta um desafio significativo para sistemas de IA.