Model Universal-2 Speech-to-Text firmy AssemblyAI przewyższa modele Whisper firmy OpenAI pod względem dokładności, wykrywania nazw własnych i zmniejszonych wskaźników halucynacji, zgodnie z niedawnym raportem. Universal-2 odnotował najniższy wskaźnik błędów słów (WER) na poziomie 6,68%, co stanowi poprawę o 3% w porównaniu z poprzednikiem Universal-1, podczas gdy modele Whisper miały nieco wyższe wskaźniki błędów.
Model Universal-2 miał również lepsze wyniki w rozpoznawaniu nazw własnych i formatowaniu tekstu. Jednak Whisper large-v3 wykazał się siłą w transkrypcji alfanumerycznej. Pomimo swoich zalet, podatność Whisper na halucynacje sprawia, że jest mniej niezawodny w zastosowaniach w świecie rzeczywistym.
Źródło
<p>Artykuł Universal-2 przewyższa modele Whisper w zakresie dokładności zamiany mowy na tekst pojawił się po raz pierwszy na CoinBuzzFeed.</p>