Pirmdien OpenAI atklāja savu jaunāko vadošo modeli ar nosaukumu GPT-4o (“o” nozīmē “omni”), un šķiet, ka tas ir vistuvāk inteliģentam palīgam kā “Džārviss” filmā Iron Man.

Pārdošanas punkts ir tāds, ka ChatGPT-4o var rīkoties ar dažādām modalitātēm, ko nevar izdarīt lielākā daļa esošo AI modeļu. Tas nozīmē, ka GPT-4o var pieņemt un ģenerēt jebkuru teksta, audio un attēlu pieprasījumu kombināciju.

Iestudētā demonstrācija, ko komanda prezentēja vietnē X (agrāk Twitter), bija tik iespaidīga, ka daudzi cilvēki to uzmundrināja. Viens liels sasniegums ir tas, ka GPT-4o reaģē uz audio ieejām tikai 232 milisekundēs, kas ir līdzīgs cilvēka reakcijas laikam sarunas laikā.

“Šķiet, ka AI no filmām; un man joprojām ir mazliet pārsteidzoši, ka tas ir īsts," pirmdien savā emuāra ierakstā rakstīja OpenAI izpilddirektors Sems Altmens. "Nonākšana uz cilvēka līmeņa reakcijas laiku un izteiksmīgumu izrādās lielas pārmaiņas."

OpenAI ir sācis lietotājiem piedāvāt GPT-4o teksta un attēlu funkcijas. Tuvāko nedēļu laikā audio un video iespējas tiks izlaistas "nelielai uzticamu API partneru grupai", paziņoja uzņēmums. 

Tomēr šeit ir dažas lietas, ko varat darīt ar ChatGPT-4o modeli. 

Lietas, ko varat darīt ar GPT-4o

Izveidojiet attēlus ar salasāmiem tekstiem

Līdz šim daži AI attēlu ģeneratori, piemēram, Midjourney, joprojām cīnās, lai izveidotu attēlus ar lasāmiem tekstiem. OpenAI teica, ka GPT-4o tagad daudz labāk saprot teksta aprakstus un var padarīt attēlus salasāmus tekstus. 

Attēla avots: OpenAI Real-Time Translation

Situācijā, kad nepieciešams tulks, GPT-4o var darboties kā tulks. Video demonstrācijā OpenAI komanda parādīja, ka GPT-4o var atkārtot kaut ko angļu valodā spāņu valodā, iespējams, citās valodās un no spāņu valodas angļu valodā.

Tulkojums reāllaikā, izmantojot GPT-4o pic.twitter.com/J1BsrxwYdE

— OpenAI (@OpenAI) 2024. gada 13. maijs

Skaties un pastāsti

Cilvēkiem ar redzes traucējumiem vai tikai sava prieka pēc ChatGPT-4o var apskatīt un pastāstīt, kas notiek jūsu apkārtnē, izmantojot tālruņa kameru. Vienā gadījumā modele varēja pateikt, ka kāds svin dzimšanas dienu, kad pamanīja istabā kūku un sveci.

@BeMyEyes ar GPT-4o pic.twitter.com/nWb6sEWZlo

— OpenAI (@OpenAI) 2024. gada 13. maijs

Atrisiniet matemātikas uzdevumus

GPT-4o var arī apskatīt matemātikas uzdevumus papīra lapā vai displeja ekrānā un sniegt uz tiem atbildi. Ne tikai tas, tas var arī apmācīt un palīdzēt jums uzzināt, kā atrisināt problēmu.

Matemātikas problēmas ar GPT-4o un @khanacademy pic.twitter.com/RfKaYx5pTJ

— OpenAI (@OpenAI) 2024. gada 13. maijs

AI vizuālajā sanāksmē

GPT-4o var pievienoties vizuālām sanāksmēm un rīkot saglabāšanu ar dalībniekiem. Tas var arī palīdzēt lietotājiem sagatavoties darba interviju sanāksmēm. 

AI tikšanās ar GPT-4o pic.twitter.com/rHkQ316MYj

— OpenAI (@OpenAI) 2024. gada 13. maijs