Emner opprettet av tov.are.jacobsen

@tov-are-jacobsen Noko nytt hos deg og i NAV med bruk av Whisper?

Testa nett ut WhisperX med Nasjonalbiblioteket sin modell. Dei skal også ha kudos for å ha gjeve ein del tips i dokumentasjonen sin om korleis ein kan bruke modellen, enten det er Whisper CPP, WhisperX eller andre måtar.

Det fungerer mykje betre enn Whisper CPP. Typisk kom det hallusinasjonar når det var periodar utan tale i lydsporet:
ceca19c1-5c4b-4b87-81f9-aa2886dc03ef-image.png

WhisperX, og sikkert andre løysingar, omgår problemet ved å først analysere kva deler av lydsporet som inneheld tale og kun køyre transkribering der det er tale.

tov.are.jacobsen

Emner

Whisper - transkribering

Logo ved deling av lenke