Theo một báo cáo gần đây, mô hình Speech-to-Text Universal-2 của AssemblyAI vượt trội hơn các mô hình Whisper của OpenAI về độ chính xác, khả năng phát hiện danh từ riêng và tỷ lệ ảo giác giảm. Universal-2 ghi nhận Tỷ lệ lỗi từ (WER) thấp nhất là 6,68%, cải thiện 3% so với mô hình tiền nhiệm Universal-1, trong khi các mô hình Whisper có tỷ lệ lỗi cao hơn một chút.

Mô hình Universal-2 cũng có hiệu suất tốt hơn trong việc nhận dạng danh từ riêng và định dạng văn bản. Tuy nhiên, Whisper large-v3 cho thấy sức mạnh trong phiên âm chữ số. Mặc dù có sức mạnh, nhưng khả năng dễ bị ảo giác của Whisper khiến nó kém tin cậy hơn khi sử dụng trong thế giới thực.

Nguồn

<p>Bài đăng Universal-2 vượt trội hơn Whisper Models về độ chính xác chuyển giọng nói thành văn bản lần đầu tiên xuất hiện trên CoinBuzzFeed.</p>