Firma #ChartoftheDay #OpenAI zaprezentowała w poniedziałek swój najnowszy model sztucznej inteligencji, #GPT4o , w którym „o” oznacza „omni”. GPT-4o akceptuje dowolną kombinację tekstu, dźwięku i obrazu jako dane wejściowe i może reagować na sygnały wejściowe audio w ciągu zaledwie 232 milisekund, z nadwyżką 320 milisekund, co jest podobne do czasu reakcji człowieka podczas rozmowy.
GPT-4o osiąga wydajność na poziomie GPT-4 Turbo w zakresie tekstu, rozumowania i inteligencji kodowania, jednocześnie wyznaczając nowe standardy w zakresie możliwości wielojęzycznych, audio i wizyjnych. Poniższy wykres pokazuje, że GPT-4o wyznacza nowy poziom w dziedzinie tłumaczenia mowy i przewyższa Whisper-v3 w teście MLS.
Co ważniejsze, GPT-4o będzie bezpłatny dla wszystkich użytkowników, a płatni użytkownicy będą mieli do pięciu razy większą pojemność niż użytkownicy darmowi.
W przestrzeni #crypto, gdzie wiele projektów integruje#AIdla #chatbotów i wirtualnych asystentów napędzanych sztuczną inteligencją, wydanie GPT-4o ma przyspieszyć rozwój nowych aplikacji i rozwój rynku. Zaostrzy się także konkurencja we wszystkich obszarach. Pozyskiwanie użytkowników do projektów ze złożonymi doświadczeniami użytkownika stanie się trudniejsze.