Laut einem aktuellen Bericht übertrifft das Universal-2 Speech-to-Text-Modell von AssemblyAI die Whisper-Modelle von OpenAI in puncto Genauigkeit, Eigennamenerkennung und reduzierter Halluzinationsrate. Universal-2 verzeichnete mit 6,68 % die niedrigste Wortfehlerrate (WER), eine Verbesserung um 3 % gegenüber seinem Vorgänger Universal-1, während die Whisper-Modelle etwas höhere Fehlerraten aufwiesen.
Das Universal-2-Modell zeigte auch bessere Ergebnisse bei der Erkennung von Eigennamen und der Textformatierung. Whisper large-v3 zeigte jedoch Stärken bei der alphanumerischen Transkription. Trotz dieser Stärken ist Whisper aufgrund seiner Anfälligkeit für Halluzinationen für den Einsatz in der realen Welt weniger zuverlässig.
Quelle
<p>Der Beitrag „Universal-2 übertrifft Flüstermodelle bei der Spracherkennungsgenauigkeit“ erschien zuerst auf CoinBuzzFeed.</p>