DeepSeek, un'azienda AI con sede in Cina, ha lanciato DeepSeek-R1-Lite-Preview per migliori capacità di ragionamento e risoluzione dei problemi. Annunciato in un post su X, il sistema è posizionato come un concorrente dei leader del settore come OpenAI.
I commentatori credono che la trasparenza di DeepSeek sia ironica quando le aziende in Occidente non hanno affrontato queste lacune.
Il nuovo lancio di DeepSeek AI può fare meglio in matematica
DeepSeek, un'azienda AI con sede in Cina, ha introdotto una nuova versione del suo sistema AI chiamata DeepSeek-R1-Lite-Preview. In un post su X, ha affermato che il nuovo sistema AI ha migliorato le capacità di ragionamento e risoluzione dei problemi.
Secondo DeepSeek, il preview si comporta bene su benchmark come AIME (American Invitational Mathematics Examination) e MATH, che misurano le abilità di risoluzione dei problemi e ragionamento. Poiché l'AI sembra esperta nella gestione di problemi matematici e logici complessi, potrebbe essere pronta a competere con ChatGPT di OpenAI e specificamente con OpenAI o1.
Questa settimana, Le Chat di Mistral AI ha anche annunciato aggiornamenti per consentire accesso gratuito a nuove funzionalità. I lanci stanno apparentemente creando una concorrenza intensa nel mercato dell'AI generativa, superando le carenze degli altri.
DeepSeek pensa ad alta voce a differenza di ChatGPT
DeepSeek afferma che la sua AI può mostrare un ragionamento passo dopo passo in tempo reale per rendere il suo processo di pensiero più trasparente. Nel frattempo, l'azienda AI ha anche dichiarato che rilasceranno il modello open-source e gli strumenti per sviluppatori API nei prossimi giorni.
Secondo un grafico di confronto citato dal commentatore AI e tecnologico Andrew Curran, DeepSeek-R1-Lite-Preview ottiene il punteggio più alto in parametri come AIME (52.5) e Codeforces (1450), superando concorrenti come OpenAI o1-preview e Claude 3.5 Sonnet.
Guida anche in MATH-500 (91.6), indicando alte performance in compiti avanzati di risoluzione dei problemi. Tuttavia, è in ritardo in GPQA Diamond (58.5) e Zebra Logic (56.6) rispetto a modelli come OpenAI o1-preview (73.3 e 71.4, rispettivamente). Le cifre significano che c'è spazio per miglioramenti nei segmenti di conoscenza generale e ragionamento logico.
Due mesi dopo l'annuncio dell'o1-preview, e il suo ragionamento Chain-of-Thought è stato replicato. La Balena ora può ragionare. DeepSeek afferma che la versione ufficiale di DeepSeek-R1 sarà completamente open source. https://t.co/Ya9mVyLvDP pic.twitter.com/6wZ8xoAyyz
— Andrew Curran (@AndrewCurran_) 20 novembre 2024
Cryptopolitan ha provato le funzionalità del lancio per una recensione imparziale. Innanzitutto, la chat di DeepSeek richiede un accesso utente. La chat sotto la funzione ‘Deep Think’ limita le conversazioni a un massimo di 50 messaggi al giorno. Possiamo dire che Deepseek pensa ad alta voce mentre stima anche il suo tempo di risposta. Ha anche risolto il problema matematico che abbiamo presentato in un ordine logico. In confronto, ChatGPT 4o ha impiegato meno tempo per la soluzione ma non ha presentato un ragionamento passo dopo passo per la stessa.
Come DeepSeek risponde ai problemi matematici Come ChatGPT-4o risponde ai problemi matematici
L'influencer Bilawal Sidhu ha preso in giro o1 e ha dichiarato: “Ironico che il modello o1 di OpenAI nasconda il suo ragionamento chain-of-thought, mentre il DeepSeek-R1 cinese lo rende trasparente per gli utenti. Non dovrebbe essere il contrario?”
Detto ciò, la Cina ha un quadro complessivo attorno all'AI. Il 13 luglio 2023, diverse autorità cinesi, tra cui l'Amministrazione del cyberspazio della Cina (CAC) e il Ministero dell'Istruzione, hanno introdotto nuove normative per le tecnologie AI generative. Queste regole, chiamate Regolamento sull'AI Generativa, sono entrate ufficialmente in vigore lo scorso anno il 15 agosto.
L'ambito del regolamento copre a quanto pare l'uso di algoritmi, tecnologie di sintesi profonda, l'uso di tutte le tecnologie AI generative e diverse altre attività tecnologiche. E con il suo approccio di ragionamento trasparente, prestazioni elevate su benchmark competitivi e piani per rilasciare strumenti open-source, DeepSeek sta spingendo i confini dell'AI generativa in Cina e tra i suoi concorrenti a livello globale.
Un sistema passo dopo passo per avviare la tua carriera Web3 e ottenere lavori ben retribuiti nel settore crypto in 90 giorni.