DeepSeek, o companie AI cu sediul în China, a lansat DeepSeek-R1-Lite-Preview pentru capacități mai bune de raționare și rezolvare a problemelor. Anunțat într-o postare pe X, sistemul este poziționat ca un competitor pentru liderii din industrie, precum OpenAI.
Comentatorii cred că transparența DeepSeek este ironică atunci când companiile din Vest nu au abordat aceste lacune.
Noua lansare a DeepSeek AI poate face matematică mai bună
DeepSeek, o companie AI cu sediul în China, a introdus o nouă versiune a sistemului său AI numită DeepSeek-R1-Lite-Preview. Într-o postare pe X, s-a spus că noul sistem AI are abilități îmbunătățite de raționare și rezolvare a problemelor.
Conform DeepSeek, previzualizarea performează bine în benchmark-uri precum AIME (Examenul Invitațional American de Matematică) și MATH, care măsoară abilitățile de rezolvare a problemelor și raționamentului. Deoarece AI-ul pare a fi iscusit în gestionarea problemelor matematice și logice complexe, ar putea fi pregătit să concureze cu ChatGPT de la OpenAI și specific cu OpenAI o1.
În această săptămână, Le Chat de Mistral AI a anunțat de asemenea actualizări pentru a permite accesul gratuit la noi caracteristici. Lansările par să creeze o competiție intensă pe piața AI generative, depășind neajunsurile celorlalte.
DeepSeek gândește cu voce tare, spre deosebire de ChatGPT
DeepSeek spune că AI-ul său poate arăta raționament pas cu pas în timp real pentru a face procesul său de gândire mai transparent. Între timp, compania AI a mai spus că va lansa modelul open-source și uneltele pentru dezvoltatori API în zilele următoare.
Conform unui grafic de comparație citat de comentatorul AI și tech Andrew Curran, DeepSeek-R1-Lite-Preview atinge cel mai mare scor în parametrii precum AIME (52.5) și Codeforces (1450), depășind concurenți precum OpenAI o1-preview și Claude 3.5 Sonnet.
De asemenea, conduce în MATH-500 (91.6), indicând o performanță ridicată în sarcini avansate de rezolvare a problemelor. Cu toate acestea, se află în urma GPQA Diamond (58.5) și Zebra Logic (56.6) comparativ cu modele precum OpenAI o1-preview (73.3 și 71.4, respectiv). Aceste cifre înseamnă că există loc pentru îmbunătățire în segmentele de cunoștințe generale și raționament logic.
Două luni după anunțul o1-preview, și raționamentul său Chain-of-Thought a fost replicat. Balena poate acum să raționeze. DeepSeek spune că versiunea oficială a DeepSeek-R1 va fi complet open source. https://t.co/Ya9mVyLvDP pic.twitter.com/6wZ8xoAyyz
— Andrew Curran (@AndrewCurran_) 20 noiembrie 2024
Cryptopolitan a încercat caracteristicile lansării pentru o recenzie imparțială. În primul rând, chatul DeepSeek necesită un login de utilizator. Chatul sub caracteristica 'Deep Think' limitează conversațiile la maximum 50 de mesaje pe zi. Putem spune că Deepseek gândește cu voce tare în timp ce estimează și timpul de răspuns. De asemenea, a rezolvat problema de matematică pe care am prezentat-o într-o ordine logică. În comparație, ChatGPT 4o a avut nevoie de mai puțin timp pentru soluție, dar nu a prezentat un raționament pas cu pas pentru aceeași.
Cum răspunde DeepSeek la problemele de matematică Cum răspunde ChatGPT-4o la problemele de matematică
Influencerul Bilawal Sidhu a ironizat o1 și a spus: „Este ironic că modelul o1 de la OpenAI ascunde raționamentul său chain-of-thought, în timp ce DeepSeek-R1 din China îl face transparent pentru utilizatori. Nu ar trebui să fie invers?”
Asta spus, China are un cadru cuprinzător în jurul AI-ului. Pe 13 iulie 2023, mai multe autorități chineze, inclusiv Administrația Cibernetică a Chinei (CAC) și Ministerul Educației, au introdus reguli noi pentru tehnologiile AI generative. Aceste reguli, numite Regulamentul AI Generativ, au intrat oficial în vigoare anul trecut pe 15 august.
Aria de aplicare a regulamentului acoperă, conform raportărilor, utilizarea algoritmilor, tehnologiilor de sinteză profundă, utilizarea tuturor tehnologiilor AI generative și mai multe alte activități tehnologice. Și cu abordarea sa transparentă de raționare, performanța puternică în benchmark-uri competitive și planurile de a lansa unelte open-source, DeepSeek împinge limitele AI-ului generativ în China și printre competitorii săi la nivel global.
Un sistem pas cu pas pentru lansarea carierei tale Web3 și obținerea de locuri de muncă bine plătite în crypto în 90 de zile.