AssemblyAI telah memperkenalkan Universal-1, model pengenalan suara baru yang menawarkan akurasi mendekati manusia untuk pengenalan suara otomatis (ASR). Ini dirancang untuk mentranskripsikan file audio dengan aksen, kebisingan latar belakang, dan frasa kompleks. Model ini dapat diakses melalui API web yang sama dengan model ASR sebelumnya.
Untuk membantu pengembang, AssemblyAI menawarkan SDK Python resmi untuk instalasi yang mudah, memerlukan akun yang telah terdaftar untuk kunci API. SDK ini mencakup dua tingkat harga: Terbaik untuk akurasi maksimum dan Nano, solusi hemat biaya yang mendukung transkripsi dalam 99 bahasa. Secara default, SDK menggunakan tingkat Terbaik.
Untuk beralih ke tingkat Nano, pengembang dapat menyesuaikan objek TranscriptionConfig. Selain transkripsi, AssemblyAI menawarkan fitur canggih seperti deteksi entitas, moderasi konten, penghapusan PII, dan aplikasi Model Bahasa Besar (LLM) untuk data audio. Fitur-fitur ini menjadikan layanan transkripsi cocok untuk berbagai aplikasi.
Sumber
<p>Postingan Transcribe Audio Files with AssemblyAI’s Universal-1: Near-Human Accuracy & Affordable Pricing pertama kali muncul di CoinBuzzFeed.</p>