ę® PANews ꊄ道ļ¼ŒOpenAI ęŽØå‡ŗäŗ†åäøŗ MLE-bench ēš„ę–°åŸŗ准ļ¼Œę—ØåœØčƄ估 AI 代ē†åœØęœŗå™Øå­¦ä¹ č§£å†³ę–¹ę”ˆå¼€å‘äø­ēš„č”ØēŽ°ć€‚čÆ„åŸŗå‡†ę¶µē›– 75 锹 Kaggle ē«žčµ›ļ¼Œé‡ē‚¹čƄ估当前ęœŗå™Ø学习开发ēš„ęŒ‘ęˆ˜ę€§ä»»åŠ”ļ¼Œå¹¶å°† AI ē»“ęžœäøŽäŗŗē±»č”ØēŽ°čæ›č”ŒęÆ”č¾ƒć€‚

åˆę­„ęµ‹čƕäø­ļ¼Œo1-preview ęؔ型äøŽ AIDE ꔆꞶē»“合č”ØēŽ°ęœ€ä½³ļ¼ŒåœØ 16.9% ēš„ē«žčµ›äø­čŽ·å¾—é“œē‰Œļ¼Œč¶…čæ‡äŗ† Anthropic ēš„ Claude 3.5 Sonnet怂通čæ‡å¢žåŠ å°čÆ•ę¬”ę•°ļ¼Œo1-preview ēš„ęˆåŠŸēŽ‡ēæ»å€č‡³ 34.1%怂

OpenAI 认äøŗļ¼ŒMLE-bench ęœ‰åŠ©äŗŽčƄ估ę øåæƒ ML å·„ēØ‹ęŠ€čƒ½ļ¼Œå°½ē®”它并ęœŖ궵ē›–ę‰€ęœ‰ AI ē ”ē©¶é¢†åŸŸć€‚