AssemblyAI ha introducido Universal-1, un nuevo modelo de reconocimiento de voz que ofrece una precisión casi humana para el reconocimiento de voz automatizado (ASR). Está diseñado para transcribir archivos de audio con acentos, ruido de fondo y frases complejas. El modelo es accesible a través de la misma API web que los modelos ASR anteriores.
Para ayudar a los desarrolladores, AssemblyAI ofrece un SDK oficial de Python para una fácil instalación, requiriendo una cuenta registrada para obtener una clave API. El SDK incluye dos niveles de precios: Mejor para máxima precisión y Nano, una solución rentable que admite transcripciones en 99 idiomas. Por defecto, el SDK utiliza el nivel Mejor.
Para cambiar al nivel Nano, los desarrolladores pueden ajustar el objeto TranscriptionConfig. Además de la transcripción, AssemblyAI ofrece características avanzadas como detección de entidades, moderación de contenido, redacción de PII y aplicaciones de Modelos de Lenguaje Grande (LLM) para datos de audio. Estas características hacen que el servicio de transcripción sea adecuado para una amplia gama de aplicaciones.
Fuente
<p>La publicación Transcribe Audio Files with AssemblyAI’s Universal-1: Near-Human Accuracy & Affordable Pricing apareció primero en CoinBuzzFeed.</p>