AssemblyAI ha introdotto Universal-1, un nuovo modello di riconoscimento vocale che offre un'accuratezza quasi umana per il riconoscimento vocale automatizzato (ASR). È progettato per trascrivere file audio con accenti, rumore di fondo e frasi complesse. Il modello è accessibile attraverso la stessa API web dei modelli ASR precedenti.
Per aiutare gli sviluppatori, AssemblyAI offre un SDK ufficiale per Python per un'installazione facile, richiedendo un account registrato per una chiave API. L'SDK include due livelli di prezzo: Migliore per massima accuratezza e Nano, una soluzione economica che supporta la trascrizione in 99 lingue. Per impostazione predefinita, l'SDK utilizza il livello Migliore.
Per passare al livello Nano, gli sviluppatori possono modificare l'oggetto TranscriptionConfig. Oltre alla trascrizione, AssemblyAI offre funzionalità avanzate come il rilevamento delle entità, la moderazione dei contenuti, la redazione di PII e applicazioni di Modelli di Linguaggio di Grandi Dimensioni (LLM) per i dati audio. Queste funzionalità rendono il servizio di trascrizione adatto a una vasta gamma di applicazioni.
Fonte
<p>Il post Trascrivere file audio con Universal-1 di AssemblyAI: accuratezza quasi umana & prezzi accessibili è apparso per la prima volta su CoinBuzzFeed.</p>