OpenAI ha rilasciato diversi nuovi modelli di intelligenza artificiale con uno schema di denominazione rivisto, a partire dal suo ultimo modello OpenAI o1 che, a suo dire, può "pensare prima di rispondere".
"Per compiti di ragionamento complessi, questo è un progresso significativo e rappresenta un nuovo livello di capacità di intelligenza artificiale", ha affermato OpenAI in un post del blog del 12 settembre. "Dato questo, stiamo reimpostando il contatore a uno e chiamando questa serie OpenAI o1".
I nuovi modelli possono prendersi il tempo necessario per pensare e utilizzare il ragionamento "a catena di pensiero" per risolvere compiti complessi, in particolare nei compiti STEM (scienza, tecnologia, ingegneria e matematica) e correlati alla codifica, ha affermato OpenAI.
Fonte: OpenAI
L'azienda di intelligenza artificiale ha condiviso video di OpenAI o1 che codifica un videogioco partendo da un prompt e risolvendo, tra le altre cose, un complesso puzzle logico.
I modelli "anteprima" e "mini" di OpenAI o1 sono stati resi disponibili agli abbonati a ChatGPT Plus e l'azienda prevede di rilasciare versioni migliorate nei prossimi mesi.
OpenAI ha condiviso dati che suggeriscono che OpenAI o1 sconfigge GPT-4o in diversi benchmark, tra cui argomenti scientifici a livello di dottorato in biologia, chimica e fisica e alcuni esami delle scuole superiori degli Stati Uniti.
Modello di miglioramento OpenAI o1 confrontato con GPT-4o su diversi benchmark. Fonte: OpenAI
A causa dell'attenzione di OpenAI o1 mini sulle capacità di ragionamento STEM, non è altrettanto competente in altre aree al di fuori del suo focus ristretto, ha affermato OpenAI.
“[La sua] conoscenza fattuale su argomenti non STEM come date, biografie e curiosità è paragonabile a quella di piccoli LLM come GPT-4o mini.”
"Miglioreremo queste limitazioni nelle versioni future e sperimenteremo l'estensione del modello ad altre modalità e specialità al di fuori di STEM", ha aggiunto.
Gli esperti del settore si aspettavano che OpenAI avrebbe rilasciato a settembre un modello di intelligenza artificiale incentrato sul ragionamento, denominato Strawberry.
Tuttavia, OpenAI non rivela le distinzioni tra i diversi modelli in fase di sviluppo.
Rivista: la scommessa da 1 milione di dollari su ChatGPT non porterà ad AGI, l'uso dell'intelligenza artificiale intelligente di Apple, l'aumento dei milionari dell'intelligenza artificiale: AI Eye