Ce se așteaptă să fie lansat în cele 12 zile de prezentări OpenAI

OpenAI a anunțat că, începând cu 5 decembrie 2024, la ora locală, va avea loc un eveniment de lansare sau demonstrație timp de 12 zile (câte un eveniment în fiecare zi lucrătoare). Deși în prezent nu se știe exact conținutul fiecărui eveniment, conform mai multor surse și speculații, este posibil să includă următoarele:
1. Lansarea publică a instrumentului de transformare a textului în video Sora
Sora este un nou produs OpenAI lansat la începutul anului, care se află în prezent în starea de testare internă pe bază de invitație. Fostul CTO al companiei, Mira Murati, a afirmat că Sora ar putea fi lansat public utilizatorilor până la sfârșitul anului, astfel încât există șanse mari ca Sora să fie lansat public în cadrul celor 12 evenimente. În domeniul inteligenței artificiale, tehnologia de transformare a textului în video este o direcție de cercetare foarte populară. De exemplu, Google a lansat, de asemenea, modelul său de video generativ numit Veo. Lansarea Sora va oferi utilizatorilor noi modalități de creare de conținut, cum ar fi utilizarea unei povești ca scenariu, Sora generând conținut video corespunzător, având perspective largi de aplicare în producția de film, creația de reclame, producția de videoclipuri educaționale etc.
2. Un nou model de raționare
Conform unor rapoarte din media precum The Verge, noul produs va include un nou model de raționare, care ar putea fi o versiune completă a modelului o1 sau modele AI similare de raționare. Capacitatea de raționare este esențială în inteligența artificială, cum ar fi în rezolvarea problemelor științifice și matematice complexe, analiză logică etc. Anterior, OpenAI a avut planuri de a lansa modele axate pe raționare, cum ar fi modelul „căpșune” menționat anterior, care este, de asemenea, un produs AI axat pe raționare. Noua capacitate de raționare ar putea performa mai eficient și precis în gestionarea sarcinilor complexe, ajutând la îmbunătățirea competitivității OpenAI în domeniul raționării AI, dar ar putea fi aplicată și în domenii precum medicina, cercetarea etc., unde sunt necesare raționări logice complexe.
3. Îmbunătățiri ale noilor voci și funcționalități ale modulului de voce ChatGPT
1. Voce nouă
OpenAI ar putea adăuga un sunet special modulului de voce ChatGPT (există informații că ar putea fi un sunet de Moș Crăciun), iar utilizatorii au descoperit deja că butonul modulului de voce poate lua forma unui fulg de nea în cod, ceea ce ar putea fi un indiciu legat de noul sunet. Adăugarea unei noi voci poate oferi utilizatorilor o experiență de interacțiune mai diversificată, cum ar fi, în anumite sărbători sau teme, o voce specială care poate adăuga o notă de distracție și imersiune.
2. Îmbunătățiri ale funcționalităților
Modul avansat de voce al ChatGPT are spațiu pentru îmbunătățiri, ar putea realiza conectarea la căutări pe internet în timp real și analiza lumii reale prin intermediul camerei. Dacă va fi realizată conectarea la căutări pe internet în timp real, ChatGPT va putea oferi informații mai precise și actualizate, nefiind limitat la cunoștințele din datele anterioare de antrenament; conectarea la cameră pentru analiza lumii reale ar putea extinde aplicațiile sale în scenarii precum Internetul lucrurilor, case inteligente etc., cum ar fi identificarea stării mediului interior, monitorizarea securității etc.
4. Alte conținuturi potențiale de lansare
1. Deblocarea funcției de generare a imaginilor a modelului GPT - 4o
Funcția de generare a imaginilor a modelului GPT - 4o, care a fost blocată, a demonstrat rezultate impresionante și capacități de control în demonstrațiile timpurii, iar acest model are și capacități native de analiză video. Dacă funcția de generare a imaginilor este deblocată, atunci GPT - 4o va avea capacități mai cuprinzătoare în generarea de conținut multimedia, utilizatorii putând utiliza acest lucru pentru creația de imagini, design etc.
2. Previzualizare a modelului o2 sau GPT - 5o
Utilizatorii sunt foarte așteptând previzualizarea modelului o2 sau GPT - 5o. Dacă va fi posibil să vedem o previzualizare relevantă la eveniment, utilizatorii și dezvoltatorii vor putea înțelege în avans direcția de dezvoltare a viitoarelor modele OpenAI, care ar putea include informații despre arhitectura modelului, îmbunătățiri de performanță, funcții noi etc., având de asemenea un impact asupra tendințelor în dezvoltarea industriei.
3. Instrumentul de transformare a textului în voce și cadrul AI numit „operator” vor fi prezentate în avans
Instrumentul de transformare a textului în voce al OpenAI și cadrul AI numit „operator” se așteaptă să fie lansate anul viitor, dar ar putea apărea și în următoarele două săptămâni. Instrumentul de transformare a textului în voce poate fi utilizat în interacțiuni vocale, producția de cărți audio etc.; cadrul AI ajută la construirea de agenți AI mai inteligenți și eficienți, care pot fi aplicați în asistența clienților inteligente, gestionarea proceselor automatizate etc.
$IOTX