OpenAI poate reproduce voci umane, dar nu a lansat încă tehnologia

Tehnologia de sinteză a vorbirii a parcurs un drum lung de la introducerea jucăriilor Speak & Spell în 1978. Acum, folosind modele de inteligență artificială de deep learning, software-ul poate nu numai să creeze sunete realiste, ci și să imite în mod convingător sunetele existente folosind mostre audio mici. OpenAI a lansat în această săptămână Speech Engine, un model de inteligență artificială text-to-speech folosit pentru a crea vorbire sintetică din clipuri audio înregistrate de 15 secunde. Dar OpenAI nu este încă pregătit pentru o lansare largă a tehnologiei sale, iar compania a plănuit inițial să lanseze un program pilot la începutul acestei luni pentru ca dezvoltatorii să se înscrie pentru API-ul motorului de vorbire. Dar după ce s-a gândit mai mult la implicațiile etice, compania a decis să-și reducă ambițiile pentru moment. Compania a spus că speră că previzualizarea demonstrează potențialul motoarelor de vorbire și inspiră nevoia de a construi rezistență socială la provocările generate de modelele generative din ce în ce mai convingătoare. În general, tehnologia de clonare a vocii nu este deosebit de nouă, dar ideea că OpenAI permite treptat pe oricine să folosească marca sa particulară de tehnologie vocală este demnă de remarcat. Compania spune că beneficiile tehnologiei vocale includ furnizarea de asistență pentru citire prin voci naturale, oferirea creatorilor o acoperire globală, oferirea de opțiuni vocale personalizate pentru persoanele non-verbale și ajutarea pacienților să-și recapete vocea după operație. Dar înseamnă, de asemenea, că oricine are 15 secunde de voce înregistrată a cuiva o poate clona eficient, ceea ce are implicații evidente pentru potențialul abuz. Așadar, OpenAI ne avertizează pe toți în mod responsabil cu privire la această tehnologie deja existentă, spunând că încearcă să elimine treptat autentificarea contului bancar pe bază de voce și să educe publicul despre „potențialul de conținut AI înșelător.” și soluții precum accelerarea dezvoltării tehnologiei care poate urmări originea conținutului audio.

$ARS

$AIGX

$FET $SOL $BTC #Ai赛道