AssemblyAI a introdus Universal-1, un nou model de recunoaștere vocală care oferă o precizie aproape umană pentru recunoașterea automată a vorbirii (ASR). Este conceput pentru a transcrie fișiere audio cu accente, zgomot de fundal și fraze complexe. Modelul este accesibil prin aceeași API web ca modelele ASR anterioare.
Pentru a ajuta dezvoltatorii, AssemblyAI oferă un SDK oficial Python pentru o instalare ușoară, necesitând un cont înregistrat pentru un API key. SDK-ul include două niveluri de prețuri: Cel mai bun pentru precizie maximă și Nano, o soluție rentabilă care suportă transcrierea în 99 de limbi. Implicit, SDK-ul folosește nivelul Cel mai bun.
Pentru a trece la nivelul Nano, dezvoltatorii pot ajusta obiectul TranscriptionConfig. Pe lângă transcriere, AssemblyAI oferă funcții avansate precum detectarea entităților, moderarea conținutului, redactarea PII și aplicații de Model de Limbaj Mare (LLM) pentru date audio. Aceste funcții fac ca serviciul de transcriere să fie potrivit pentru o gamă largă de aplicații.
Sursă
<p>Postarea Transcriere Fișiere Audio cu Universal-1 al AssemblyAI: Precizie Aproape Umană & Prețuri Accesibile a apărut prima dată pe CoinBuzzFeed.</p>