Pe măsură ce competiția se intensifică în domeniul AI, gigantul chinez din retail Alibaba a dezvăluit QwQ-32B-Preview, care, conform rapoartelor, depășește seria o1 a OpenAI.

Cel mai recent model se spune că strălucește față de modelele o1-preview și o1-mini ale OpenAI pe anumite referințe specifice, cum ar fi testele AIME și MATH, care evaluează performanța modelelor AI în puzzle-uri logice și probleme de matematică.

Alibaba a făcut QwQ-32B-Preview disponibil pentru descărcare.

Conform gigantului din retail, noul model Alibaba este capabil să abordeze probleme complexe și intricate comparativ cu modelele mari de limbaj normale (LLMs) precum ChatGPT-4 și Claude 3.5.

Un articol de Benzinga indică faptul că QwQ-32B-Preview este unul dintre puținele disponibile sub o licență permisivă, permițând utilizatorilor să-l descarce și să-l folosească. Modelul este acum disponibil pe platforma de dezvoltare AI Hugging Face.

Cu toate acestea, Alibaba a lansat anumite componente ale modelului pentru a limita replicarea completă a modelului sau a informațiilor despre funcționarea sa.

Cel mai recent model al Alibaba are 32,5 miliarde de parametri, ceea ce îi permite să gestioneze solicitări de până la 32.000 de cuvinte. Cu capacitățile semnificative ale modelului și accesibilitatea semi-deschisă, noul venit al Alibaba pregătește scena pentru un salt transformator în tehnologiile de raționare AI.

Anunțul transparent al Alibaba, care subliniază sofisticarea modelului său, OpenAI și-a păstrat numărul de parametri sub tăcere.

Apariția acestui model vine într-un moment în care OpenAI face progrese semnificative în sectorul AI. În octombrie, evaluarea OpenAI a crescut la 157 miliarde de dolari în urma unei runde de finanțare de succes.

La începutul acestei săptămâni, SoftBank Group SFTBF a crescut raportat participația sa în creatorul ChatGPT printr-o răscumpărare de acțiuni pentru angajați de 1,5 miliarde de dolari.

Se spune că OpenAI explorează de asemenea dezvoltarea propriului browser web pentru a provoca browserul Google Chrome al subsidiarei Alphabet, după presiuni venite din partea Departamentului de Justiție al SUA pentru a se dezvăța de el.

Alibaba admite că modelul are și defecte

Deși posedă unele puncte forte unice, noul model are și limitări. Conform grupului, QwQ-32B-Preview are probleme precum schimbările neașteptate de limbaj, care ar putea confunda utilizatorii. Modelul de asemenea subperformează în sarcini care necesită raționament de bun simț, ceea ce este comun pentru multe sisteme AI.

Conform AutoGPT, modelul poate fi prins în bucle logice, întârziind răspunsurile.

În ciuda defectelor sale, capacitățile sale de raționare îi permit să se verifice pe sine, reducând astfel erorile, dar crescând timpul de rezolvare.

Prin raționarea asupra sarcinilor și planificarea pașilor, modelul Alibaba evită unele capcane care afectează sistemele AI tradiționale. Dar această abordare necesită timp suplimentar care ar putea limita aplicațiile în timp real.

Conform Benzinga, răspunsurile QwQ-32B-Preview sunt aliniate cu standardele de reglementare chineze, evitând subiectele politice sensibile.

De exemplu, subiectele politice sensibile precum Taiwan vor da răspunsuri care sunt aliniate cu poziția guvernului chinez.

În plus, solicitările despre evenimente precum Piața Tiananmen nu generează răspunsuri, arătând designul prudent al modelului.

Deși aceasta ar putea fi ideal pentru piața chineză, poate limita de asemenea atractivitatea sa pe piața globală. Cu toate acestea, modelul este un pas semnificativ în lumea AI-ului rațional. Deși limitările sale pot restrânge atractivitatea globală, celelalte componente precum logica și natura semi-deschisă îl fac un competitor important pentru OpenAI.

Conform AutoGPT, QwQ-32B-Preview evidențiază potențialul și provocările acestei frontiere interesante în care laboratoarele AI din întreaga lume lucrează pentru a rafina tehnologia de raționare.

De la Zero la Web3 Pro: Planul tău de lansare a carierei în 90 de zile