AssemblyAI ha introdotto il suo ultimo modello di riconoscimento vocale, Universal-1, progettato per raggiungere un'accuratezza di trascrizione quasi umana in ambienti audio difficili. Questo modello è ora accessibile tramite la stessa API web dei precedenti modelli ASR. Insieme al lancio di Universal-1, AssemblyAI ha introdotto due nuovi livelli di prezzo: Best e Nano.

Il livello Best è ottimizzato per la massima accuratezza, mentre il livello Nano offre una soluzione economica che supporta la trascrizione in 99 lingue diverse. Per semplificare il processo di trascrizione, AssemblyAI offre un SDK ufficiale per Python. Gli sviluppatori possono installare l'SDK utilizzando il comando: `pip install –upgrade assemblyai`.

Dopo l'installazione, gli utenti devono registrarsi per un account AssemblyAI per ottenere una chiave API, necessaria per autorizzare le chiamate API negli script Python. Per le trascrizioni, gli sviluppatori possono creare uno script Python in cui l'SDK utilizza il livello Best per impostazione predefinita. Il processo prevede l'importazione dell'SDK, la configurazione del client API con la chiave API e la specifica dell'URL del file audio o del percorso locale.

Eseguendo lo script verranno restituiti i risultati della trascrizione nel terminale. Il livello Nano offre un'alternativa economica, e gli sviluppatori possono passare al modello Nano modificando l'oggetto TranscriptionConfig. Le offerte di AssemblyAI vanno oltre la semplice trascrizione, fornendo funzionalità avanzate come il riconoscimento delle entità, la moderazione dei contenuti, la redazione delle informazioni personali (PII) e l'applicazione di grandi modelli linguistici ai dati audio.

Gli sviluppatori interessati a sfruttare queste funzionalità possono esplorare la documentazione e le risorse di ricerca di AssemblyAI.

Fonte

<p>Il post Master Audio Transcription with AssemblyAI’s Ultimate-1: Unveiling New Pricing Tiers and Python Integration è apparso per la prima volta su CoinBuzzFeed.</p>