Odaily Planet Daily News OpenAI ha annunciato il lancio di o1, un modello di intelligenza artificiale con capacità di ragionamento, nome in codice interno "Strawberry". OpenAI o1 può ragionare su compiti complessi e risolvere problemi più difficili rispetto ai precedenti modelli scientifici, di codifica e matematici. Nei test, OpenAI o1 si è comportato come uno studente di dottorato in impegnativi compiti di riferimento in fisica, chimica e biologia ed eccelleva in matematica e programmazione. Nell'esame di qualificazione delle Olimpiadi Internazionali di Matematica (IMO), GPT-4o ha risolto correttamente solo il 13% dei problemi, mentre il modello di inferenza ha ottenuto l'83% e la capacità di codifica di OpenAI o1 ha raggiunto l'89° percentile nella competizione Codeforces. Mentre OpenAI o1, uno dei primi modelli, non ha ancora molte delle funzionalità utili di ChatGPT, come la navigazione sul Web per informazioni e il caricamento di file e immagini, GPT-4o sarà più potente a breve termine. Ma per compiti di ragionamento complessi, questo rappresenta un progresso significativo e rappresenta un nuovo livello di capacità dell’intelligenza artificiale. Per questo motivo il contatore viene resettato a 1 e la serie si chiama OpenAI o1. I ricercatori sanitari possono utilizzare o1 per annotare i dati di sequenziamento cellulare, i fisici possono utilizzare o1 per generare le complesse formule matematiche richieste per l’ottica quantistica e gli sviluppatori in tutti i campi possono utilizzare o1 per creare ed eseguire flussi di lavoro in più fasi. OpenAI ha anche rilasciato OpenAI o1-mini, un modello di inferenza conveniente. o1-mini eccelle nelle discipline STEM, in particolare in matematica e codifica, con prestazioni quasi pari a quelle di OpenAI o1 su benchmark di valutazione come AIME e Codeforces. OpenAI prevede che o1-mini sarà un modello più veloce ed economico, più economico dell'80% rispetto a o1-preview per le applicazioni che richiedono inferenza senza una conoscenza approfondita del mondo. Gli utenti ChatGPT Plus, Team, Enterprise ed Edu possono utilizzare o1-mini come alternativa a o1-preview con limiti di velocità più elevati e latenza inferiore.