Modelul Universal-2 Speech-to-Text de la AssemblyAI depășește modelele Whisper de la OpenAI în ceea ce privește acuratețea, detectarea substantivelor adecvate și ratele reduse de halucinație, potrivit unui raport recent. Universal-2 a înregistrat cea mai mică rata de eroare a cuvintelor (WER) la 6,68%, o îmbunătățire cu 3% față de predecesorul său Universal-1, în timp ce modelele Whisper au avut rate de eroare puțin mai mari.
Modelul Universal-2 a avut, de asemenea, performanțe mai bune în recunoașterea substantivelor adecvate și formatarea textului. Cu toate acestea, Whisper large-v3 a arătat puterea transcripției alfanumerice. În ciuda punctelor sale forte, susceptibilitatea lui Whisper la halucinații îl face mai puțin fiabil pentru utilizări în lumea reală.
Sursă
<p>Postarea Universal-2 depășește modelele de șoaptă în acuratețea vorbirii în text a apărut prima dată pe CoinBuzzFeed.</p>