Po několika zpožděních údajně souvisejících s bezpečností a doladěním je nyní velmi očekávaný „pokročilý hlasový režim“ (AVM) OpenAI pro ChatGPT k dispozici v alfa verzi pro vybrané uživatele.

Funkce AVM byla oznámena a předvedena již v květnu. Umožňuje uživatelům konverzovat v reálném čase s modelem umělé inteligence ChatGPT prostřednictvím modulu syntézy tech-to-speech.

Pamatujete na Duplex?

Ti, kteří jsou obeznámeni s tímto konceptem, si možná pamatují oznámení společnosti Google z roku 2018, že jeho služba „Duplex“ AI bude k dispozici „brzy“. Na své IO vývojářské akci společnost předvedla systém umělé inteligence, který je schopen volat podniky vaším jménem a naplánovat si schůzky v reálném čase s lidmi.

Velkou myšlenkou podle Googlu bylo, že AI bude dostatečně robustní, aby zvládla neformální konverzaci a potvrdila správné informace.

Projekt Duplex byl nakonec uzavřen, ale jeho dědictví zřejmě žije v ChatGPT OpenAI.

Pokročilý hlasový režim

AVM nabízí komunikaci v reálném čase, která se pokouší napodobit diskuse mezi lidmi. ChatGPT odpovídá na uživatelské dotazy lidským hlasem, který má přirozenou kadenci. Uživatelé mohou chatbota přerušit uprostřed věty a na základě ukázky může sledovat, co bylo řečeno.

Společnost spouští tuto funkci v omezené verzi alfa, aby mohla pokračovat ve vyhodnocování jejích schopností a bezpečnostních důsledků. Zatímco květnové ukázky byly působivé, bylo tam několik závadových momentů a není těžké si představit scénáře, kde by mohla být technologie zneužita.

Podle OpenAI byla bezpečnost prvořadým zájmem společnosti. V příspěvku na X, který oznamuje spuštění funkce, společnost napsala:

„Testovali jsme hlasové schopnosti GPT-4o s více než 100 externími červenými týmy ve 45 jazycích. Abychom ochránili soukromí lidí, vycvičili jsme model tak, aby mluvil pouze čtyřmi přednastavenými hlasy, a vytvořili jsme systémy pro blokování výstupů, které se od těchto hlasů liší. Implementovali jsme také zábrany, které blokují žádosti o násilný obsah nebo obsah chráněný autorským právem.“

Časované zavádění AVM již začalo, podle OpenAI, a bude pokračovat a další uživatelé budou přidáváni „průběžně“. Společnost očekává, že tato funkce bude dostupná všem předplatitelům Plus na podzim.

Související: OpenAI pozastavuje hlas ChatGPT obviněný z napodobování Scarlett Johansson