AssemblyAI a introduit Universal-1, un nouveau modèle de reconnaissance vocale qui offre une précision proche de celle des humains pour la reconnaissance vocale automatisée (ASR). Il est conçu pour transcrire des fichiers audio avec des accents, du bruit de fond et des phrases complexes. Le modèle est accessible via la même API web que les modèles ASR précédents.

Pour aider les développeurs, AssemblyAI propose un SDK Python officiel pour une installation facile, nécessitant un compte enregistré pour obtenir une clé API. Le SDK comprend deux niveaux de tarification : Meilleur pour une précision maximale et Nano, une solution économique prenant en charge la transcription dans 99 langues. Par défaut, le SDK utilise le niveau Meilleur.

Pour passer au niveau Nano, les développeurs peuvent ajuster l'objet TranscriptionConfig. Au-delà de la transcription, AssemblyAI propose des fonctionnalités avancées telles que la détection d'entités, la modération de contenu, la suppression d'informations personnelles (PII) et des applications de grands modèles linguistiques (LLM) pour les données audio. Ces fonctionnalités rendent le service de transcription adapté à une large gamme d'applications.

Source

<p>Le post Transcrire des fichiers audio avec Universal-1 d'AssemblyAI : Précision proche de celle des humains & Tarification abordable est apparu en premier sur CoinBuzzFeed.</p>