ChatGPT veidotājs OpenAI ir paziņojis par savu jaunāko AI modeli GPT-4o, kas ir pļāpīgāks, cilvēciskāks AI tērzēšanas robots, kas var interpretēt lietotāja audio un video un reaģēt reāllaikā.

Uzņēmuma izdoto demonstrāciju sērija parāda, ka GPT-4 Omni palīdz potenciālajiem lietotājiem, piemēram, sagatavoties intervijai, pārliecinoties, ka tie izskatās reprezentabli intervijai, un zvanot klientu apkalpošanas aģentam, lai iegūtu iPhone nomaiņu, tulkot bilingvālu sarunu reāli. laiks.

Demonstrācijas liecina, ka tā var dalīties ar tēva jokiem, būt tiesnesim akmeņu, papīra un šķēru spēlē starp diviem lietotājiem un atbildēt ar sarkasmu, kad tas tiek jautāts. Vienā demonstrācijā pat parādīts, ka ChatGPT pirmo reizi tiek iepazīstināts ar lietotāja kucēnu.

"Nu sveiks, Bowser! Vai tu neesi tikai pats burvīgākais sīkums?" čatbots iesaucās.

Sasveicinieties ar GPT-4o — mūsu jauno vadošo modeli, kas var reāllaikā izmantot audio, attēlu un tekstu: https://t.co/MYHZB79UqNTTeksta un attēla ievade šodien tiek ieviesta API un ChatGPT ar balsi un video. nākamās nedēļas. pic.twitter.com/uuthKZyzYx

— OpenAI (@OpenAI) 2024. gada 13. maijs

“Šķiet, ka AI no filmām; un man joprojām ir mazliet pārsteidzoši, ka tas ir īsts,” 13. maija emuāra ierakstā sacīja uzņēmuma izpilddirektors Sems Altmens.

"Ir liela pārmaiņa, lai sasniegtu cilvēka līmeņa reakcijas laiku un izteiksmīgumu."

Tikai teksta un attēlu ievades versija tika palaista 13. maijā, un pilnā versija tiks izlaista tuvāko nedēļu laikā, OpenAI teica nesenajā X ierakstā.

GPT-4o būs pieejams gan maksas, gan bezmaksas ChatGPT lietotājiem un būs pieejams no ChatGPT API.

OpenAI teica, ka “o” GPT-4o nozīmē “omni”, kas mēģina iezīmēt soli ceļā uz dabiskāku cilvēka un datora mijiedarbību.

Iepazīstinām ar GPT-4o — mūsu jauno modeli, kas var izmantot tekstu, audio un video reāllaikā. Tas ir ļoti daudzpusīgs, ar to ir jautri spēlēties, un tas ir solis ceļā uz daudz dabiskāku cilvēka un datora (un pat cilvēka) mijiedarbības veidu. -datora un datora mijiedarbība): pic.twitter.com/VLG7TJ1JQx

— Gregs Brokmens (@gdb) 2024. gada 13. maijs

GPT-4o spēja vienlaikus apstrādāt jebkuru teksta, audio un attēla ievadi ir ievērojams sasniegums salīdzinājumā ar OpenAI agrākajiem AI rīkiem, piemēram, ChatGPT-4, kas bieži “zaudē daudz informācijas”, ja ir spiests veikt vairākus uzdevumus. .

Saistīts: Apple pabeidz darījumu ar OpenAI ChatGPT iPhone integrācijai: ziņojums

OpenAI teica, ka “GPT-4o ir īpaši labāka redzes un audio izpratne salīdzinājumā ar esošajiem modeļiem”, kas pat ietver lietotāja emociju un elpošanas modeļu uztveršanu.

Tas ir arī “daudz ātrāks” un “par 50% lētāks” nekā GPT-4 Turbo OpenAI API.

Jaunais AI rīks var reaģēt uz audio ievadi tikai 2,3 sekundēs, un vidējais laiks ir 3,2 sekundes, apgalvo OpenAI, kas, pēc tā teiktā, ir līdzīgs cilvēka reakcijas laikiem parastā sarunā.

Žurnāls: Kā apturēt mākslīgā intelekta apokalipsi: Deivids Brins, Uplift autors