Dezvoltatorul de inteligență artificială OpenAI a intrat în octombrie cu mai multe actualizări ale modelelor sale, ajutând modelele sale AI să se angajeze în conversații mai bune și să îmbunătățească recunoașterea imaginilor.
Pe 1 octombrie, OpenAI a dezvăluit patru actualizări care introduc noi instrumente concepute pentru a facilita dezvoltatorilor să construiască pe modelele sale AI.
Vorbeste!
O actualizare majoră este API-ul în timp real, care permite dezvoltatorilor să creeze aplicații vocale generate de AI folosind un singur prompt.
Instrumentul, disponibil pentru testare, acceptă experiențe multimodale cu latență scăzută prin streaming de intrări și ieșiri audio, permițând conversații naturale similare modului vocal avansat al ChatGPT.
Anterior, dezvoltatorii trebuiau să „împletească” mai multe modele pentru a crea aceste experiențe. De obicei, intrarea audio ar trebui să fie încărcată și procesată complet înainte de a primi un răspuns, ceea ce a însemnat o latență mai mare pentru aplicațiile în timp real, cum ar fi conversațiile de la vorbire la vorbire.
Cu capacitatea de streaming a Realtime API, dezvoltatorii pot acum activa interacțiuni imediate, naturale, la fel ca asistenții vocali. API-ul rulează pe GPT-4, lansat în mai 2024, care poate raționa audio, viziune și text în timp real.
AI poate vedea clar acum
O altă actualizare include un instrument de reglare fină pentru dezvoltatori, permițându-le să îmbunătățească răspunsurile AI generate din imagini și intrări de text.
Reglajele fine bazate pe imagini permit inteligenței artificiale să aibă o capacitate mai bună de a înțelege imaginile, îmbunătățind la rândul său capacitățile de căutare vizuală și de detectare a obiectelor, potrivit dezvoltatorului. Procesul include feedback de la oameni care oferă exemple de răspunsuri bune și rele.
Pe lângă actualizările de voce și viziune, OpenAI a lansat și „distilarea modelului” și „memorizarea rapidă în cache”, care permit modelelor mai mici să învețe de la cele mai mari și să reducă costurile și timpul de dezvoltare prin reutilizarea textului deja procesat.
Capacitățile avansate ale modelelor sale sunt un punct cheie de vânzare, deoarece o parte majoră a veniturilor OpenAI provine din companiile care își construiesc propriile aplicații pe deasupra tehnologiei OpenAI.
Potrivit Reuters, OpenAI estimează că veniturile sale vor crește la 11,6 miliarde de dolari anul viitor, față de aproximativ 3,7 miliarde de dolari în 2024.
Magazine: AI poate folosi deja mai multă putere decât Bitcoin - și amenință mineritul Bitcoin