Laut BlockBeats kündigte OpenAI am 31. Oktober die Einführung eines neuen Benchmarks namens SIMPLEQA an. Diese Initiative zielt darauf ab, die faktische Genauigkeit von Sprachmodellen zu bewerten. OpenAI hat diesen Benchmark ebenfalls als Open Source veröffentlicht.