Datalandsbyen Logo

    Datalandsbyen

    • Kategorier
    • Emneord
    • Siste
    • Populære
    • Kalender
    • Lenkeikon
    • Søk
    • Varslinger Logg inn / Registrer
    Community illustrasjon

    Datalandsbyen

    Velkommen til nettforumet Datalandsbyen! Vi er glade for at du har funnet frem til oss.

    Her kan du stille spørsmål om alt du måtte lure på om deling og bruk av data, eksempelvis datasett, API-er, begreper, informasjonsmodeller og juss, videre kan du delta i diskusjoner, vise frem prosjektene dine, knytte nye kontakter og finne nye samarbeid. Nettforumet er åpent for alle, men for å skrive innlegg må du først registrere deg. Formålet med forumet er å legge til rette for at data skal bli en verdiskapende ressurs for hele samfunnet – bli med og bidra til økt kunnskap, åpenhet og innovasjon. Vi oppfordrer til en konstruktiv og saklig dialog i nettforumet.

    Whisper - transkribering

    Tips og spørsmål
    2
    4
    133
    Laster flere innlegg
    • Eldste til nyeste
    • Nyeste til eldste
    • Flest stemmer
    Denne tråden har blitt slettet. Bare brukere med trådhåndterings-privilegier kan se den.
    • T
      tov.are.jacobsen sist endret av tov.are.jacobsen

      Hei,

      Jeg har brukt Whisper.cpp en del de siste dagene og har hatt god nytte av det, selv om det blir en god del feil som må rettes.

      Vår IT-avdeling har laget noen enkle nytte-scripts for å jobbe med whisper lokalt på maskinen fra shell (Mac): https://github.com/navikt/whisper-transcribe-shell

      For å få det hele til å fungere må whisper legges i katalogen under:
      https://github.com/ggerganov/whisper.cpp

      • init.sh for å kompilere og laste ned den største modellen.
      • Legg mp4-filen i data-mappen.
      • Kjør med run.sh

      Dette er samme teknologi som UiO har laget som en intern tjeneste. Det er kjempespennende at slik teknologi har blitt mer tilgjengelig.

      1 Svar Siste svar Svar Siter 0
      • L
        livar.bergheim sist endret av

        Takk for deling! Kanskje til nytte for å tekste og legge ut fleire møter, webinarer og liknande. Skal tipse kollegaer internt i Digdir.

        Såg artikkel i Digi.no om liknande arbeid ved Universitetet i Oslo (UiO).
        17.02.2023: «Bygde tjeneste som sparer dem for 20 millioner i året: − Dette er ny og sjokkerende teknologi» (krev abonnement)

        Dei skryt av at dei utvikla dette på rekordtid fordi Whisper er gjort tilgjengeleg som open kjeldekode, og at tekstane som blir generert frå lyd er på eit mykje høgare nivå enn med tidlegare løysingar, og handterer dialekter godt.

        Korleis er køyretida på dette når ein køyrer lokalt på eiga maskin?

        T 2 Svar Siste svar Svar Siter 0
        • T
          tov.are.jacobsen Svar til @livar.bergheim sist endret av tov.are.jacobsen

          @livar-bergheim Her er ett eksempel fra et møte på 56 minutter. Dette tok 96 minutter (Jeg har en 2018-modell av macbook pro med Core i5, så det går nok kjappere på noe nyere)

          whisper_print_timings:     fallbacks =   1 p /   1 h
          whisper_print_timings:     load time =  5637.30 ms
          whisper_print_timings:      mel time = 15318.44 ms
          whisper_print_timings:   sample time = 13265.51 ms / 15886 runs (    0.84 ms per run)
          whisper_print_timings:   encode time = 3197293.50 ms /   131 runs (24406.82 ms per run)
          whisper_print_timings:   decode time = 2556895.50 ms / 15882 runs (  160.99 ms per run)
          whisper_print_timings:    total time = 5788981.00 ms
          
          1 Svar Siste svar Svar Siter 1
          • T
            tov.are.jacobsen Svar til @livar.bergheim sist endret av tov.are.jacobsen

            VG sin Mac-applikasjon er nå gratis tilgjengelig i AppStore:

            https://www.linkedin.com/posts/jannifk_exciting-news-we-at-vg-verdens-gang-as-activity-7039562216194355200-ursM/?utm_source=share&utm_medium=member_ios

            Skal ha spart de over 3000 timer siden rett før jul.

            Det som er bra med denne applikasjonen er støtten for å velge en linje i grensesnittet og høre det tilhørende lydsporet med mulighet til å rette opp feil i selve grensesnittet.

            1 Svar Siste svar Svar Siter 0
            Ikon Svar
            Ikon Logg inn for å besvare
            • Første innlegg
              Seneste innlegg
            • Datalandsbyen Logo
            • Våre partnere
            • Felles datakatalog Åpne
            • Datafabrikken Åpne
            • Transportportal Åpne
            • Om nettstedet
            • Digitaliseringsdirektoratet forvalter datalandsbyen.
            • Samtykke og brukervilkår
            • Personvernerklæring Åpne
            • Informasjonskapsler Åpne
            • Tilgjengelighetserklæring Åpne
            • Kontakt
            • Lenkeikonfellesdatakatalog@digdir.no