OpenAI a dezvăluit luni cel mai recent model emblematic numit GPT-4o („o” pentru „omni”) și se pare că este cel mai aproape de a avea un asistent inteligent ca „Jarvis” în filmul Iron Man.

Momentul de vânzare este că ChatGPT-4o poate gestiona diferite modalități, ceea ce majoritatea modelelor AI existente nu le pot face. Acest lucru înseamnă că GPT-4o poate accepta și genera orice combinație de solicitări de text, audio și imagini.

Demo-ul în scenă prezentat de echipă pe X (fostul Twitter) a fost atât de impresionant încât mulți oameni l-au entuziasmat. O mare performanță este că GPT-4o răspunde la intrările audio în doar 232 de milisecunde, ceea ce este similar cu timpul de răspuns uman în timpul conversației.

„Se simte ca AI din filme; și încă este un pic surprinzător pentru mine că este real”, a scris Sam Altman, CEO-ul OpenAI, într-o postare pe blog luni. „Ajungerea la timpi de răspuns și expresivitate la nivel uman se dovedește a fi o schimbare majoră.”

OpenAI a început să lanseze pentru utilizatori funcțiile de text și imagine ale GPT-4o. În săptămânile următoare, capacitățile audio și video vor fi lansate pentru „un grup mic de parteneri de încredere în API”, a spus compania. 

Cu toate acestea, iată câteva dintre lucrurile pe care le puteți face cu modelul ChatGPT-4o. 

Lucruri pe care le puteți face cu GPT-4o

Creați imagini cu texte lizibile

Până acum, unii generatori de imagini AI, cum ar fi Midjourney, încă se luptă să creeze imagini cu texte lizibile. OpenAI a spus că GPT-4o înțelege acum descrierile de text mult mai bine și poate face texte lizibile pe imagini. 

Sursa imaginii: Traducere în timp real OpenAI

Într-o situație în care este nevoie de un traducător, GPT-4o poate acționa ca unul. Într-o demonstrație video, echipa OpenAI a arătat că GPT-4o ar putea repeta ceva spus în engleză în spaniolă, poate în alte limbi, și înapoi din spaniolă în engleză.

Traducere în timp real cu GPT-4o pic.twitter.com/J1BsrxwYdE

— OpenAI (@OpenAI) 13 mai 2024

Privește și Spune

Pentru persoanele cu deficiențe de vedere sau doar pentru distracția, ChatGPT-4o poate privi și spune ce se întâmplă în jurul tău prin intermediul camerei telefonului. Într-un caz, modelul a putut spune că cineva avea o sărbătoare de naștere când a observat un tort și o lumânare în cameră.

@BeMyEyes cu GPT-4o pic.twitter.com/nWb6sEWZlo

— OpenAI (@OpenAI) 13 mai 2024

Rezolva probleme de matematică

GPT-4o poate, de asemenea, să analizeze problemele de matematică pe o foaie de hârtie sau pe un ecran de afișare și să dea răspunsul la ele. Nu doar atât, te poate îndruma și te poate ghida pentru a învăța cum să rezolvi problema.

Probleme de matematică cu GPT-4o și @khanacademy pic.twitter.com/RfKaYx5pTJ

— OpenAI (@OpenAI) 13 mai 2024

AI în întâlnirea vizuală

GPT-4o poate participa la întâlniri vizuale și poate organiza conservări cu participanții. De asemenea, poate ajuta utilizatorii să se pregătească pentru întâlnirile interviului de angajare. 

Întâlnesc AI cu GPT-4o pic.twitter.com/rHkQ316MYj

— OpenAI (@OpenAI) 13 mai 2024