Skip to content

Velkommen til Datalandsbyen!

Her kan du stille spørsmål om data, delta i diskusjoner, dele prosjekter, knytte kontakter og finne samarbeid. Forumet er åpent for alle, men du må registrere deg for å poste. Bli med og bidra til kunnskap, åpenhet og innovasjon!

  • I denne gruppen kan du dele tips og spørre om alt du måtte lure på.

    83 Emner
    257 Innlegg
    M

    Flott 👍

  • Brukt data eller API-er til noe spennende? Del her!

    23 Emner
    33 Innlegg
    J

    Jeg har begynt å oppdatere mine Jupyter notebooks som viser hvordan bruke Python for å hente data fra SSBs APIer.
    Du finner eksemplene her:
    📂 GitHub-repoet mitt

    Samtidig har også R-pakken PxWebApiData, som gjør det enkelt å hente data fra ulike statistikkbankers APIer (inkl. Eurostat), nylig nådd versjon 1.0
    Mer om dette her:
    📦 CRAN-siden til PxWebApiData

    Disse verktøyene kan være nyttige for datadrevne prosjekter og analyser – uansett om du foretrekker Python eller R.

    Jan Bruusgaard
    Pensjonist (tidl. SSB)

  • Diskuter og tips om møter, arrangementer og konkurranser.

    232 Emner
    308 Innlegg
    T

    Det første møtet i det nye året har to innlegg. I det første innlegget
    09:00 "Orden i kulturmiljødata" vil vi få høre om arbeidet med informasjonsforvaltning hos Riksantikvaren som skal sørge for at kulturmiljødata er lett tilgjengelige og har høy kvalitet der det er viktig. En begrepskatalog er en sentral del av dette.
    I det neste innlegget
    10:00 " «Digitaliseringsrådets erfaringsrapport 2024: «Finne sin veg mot nye tider» får vi høre om den nyeste rapporten og om erfaringer fra den nye rådslederen
    Les mer om Digitaliseringsrådet og rådsmedlemmene

    Du kan logge deg på møte via vår Arrangementsside

  • Post om datasett og API-er du ønsker å få tilgang til eller har spørsmål om.

    55 Emner
    257 Innlegg
    L

    @Alf-Henning-Drage : For ordens skyld; Lenka fungerte ikkje for meg i går då eg svarte deg her i tråden. Fekk svar frå Brreg på e-post i går kl. 14:13:
    «Takk for tilbakemeldingen. Nå er feilen rettet, og lenka fungerer igjen.»
    Om det skulle vere feil seinare, skriv gjerne i kommentarfeltet på den relevante oppføringa i katalogane i data.norge.no.

  • Her kan du finne arenaer hvor du kan diskutere bestemte problemstillinger, eller se hvilke prosjekter andre holder på med.

    32 Emner
    85 Innlegg
    jens.andresen.osbergJ

    @maritbre Hei! Denne skulle du naturligvis fått svar på for veldig, veldig lenge siden. Så her er det all grunn til å beklage fra vår side.

    Vi kjenner ikke til at det finnes helt generelle retningslinjer for merking av KI-generert tekst. I KI-forordningens artikkel 50 stilles det krav til åpenhet for at brukeren av et KI-system må kunne forstå at de samhandler med et KI-system. I tilknytning til denne vil det nok komme standarder eller praksis for hvordan man merker KI-generert innhold.

    På et generelt grunnlag er dette med merking likevel krevende. En aktør kan oppgi at det er KI-generert, men det finnes ingen garanti for at denne informasjonen følger innholdet dersom det brukes videre i andre sammenhenger. På lengre sikt trenger man en annen tilnærming til denne problematikken. Vi kjenner til to ulike tilnærminger:

    Automatisert deteksjon av KI-materiale: Dette innebærer bruk av en KI-modell trent til å identifisere KI-generert materiale. Vi registrerer at det finnes ulike selskaper som tilbyr slike løsninger. Det er imidlertid utfordringer knyttet til nøyaktigheten av modellene, og hvordan de kan påvirke ulike grupper på en uheldig måte. I tillegg krever endringer i de store generative KI-systemer at deteksjonsverktøyene kontinuerlig oppdateres for å holde tritt. Til dette kommer også mulige teknikker for å omgå slike systemer. Dette kan du lese mer om hos Faktisk her: Kan vi stole på KI-detektorer? Vannmerking: Dette innebærer at det legges inn et usynlig vannmerke i det KI-genererte innholdet ved å påvirke sannsynlighetsfordelingen i genereringen av innholdet slik at det kan identifiseres senere. Denne artikkelen fra forskere ved universitetet i Maryland går inn på dette og jeg ser den er mye sitert: A Watermark for Large Language Models Artikkelen forklares ganske godt i denne videoen fra Universitetet i Nottingham: Ch(e)at GPT? - Computerphile
    Vi ser at Google Deepmind har kommet nokså langt med en slik tilnærming med sin Synth-ID som gjelder for flere modaliteter, inkludert bilder. Ser at dette arbeidet også henviser til artikkelen nevnt fra forskerne ved universitetet i Maryland.
    Selv om vannmerking høres ut som en god løsning, er det også noen utfordringer. Vannmerkingen må implementeres i de generative KI-modellene. Dette krever at alle leverandører av følger standarden, noe som skaper håndhevelses-utfordringer. For eksempel: Hvordan sikrer man at alle implementerer vannmerking, og hvordan gjør man dette med open-source-modeller?

    I dagens situasjon er det altså en del usikkerhet rundt merking av KI-innhold. I påvente av noen tekniske løsninger må vi da basere oss på en variant hvor vi med «good faith» opplyser om hva som er KI-generert. Spørsmålet da blir imidlertid når vi mener at vi bør opplyse om dette.

    Tekst: Vi har ikke gitt et generelt råd for merking av KI-generert tekst. Dette skyldes at vi er usikre på om et slikt generelt råd har noen verdi. Vi tror behovet for åpenhet varierer mellom ulike områder og kontekster. For eksempel har vi inntrykket av at visse grupper, slik som journalister og mediehus, har interne retningslinjer for hvordan dette skal gjøres. Vi tenker også at for enkelte offentlige virksomheter i visse sammenhenger vil det være viktig å opplyse om at innholdet er generert av KI. Fordi mer og mer tekst vil være helt eller delvis bearbeidet med et KI-verktøy, tror vi ikke det er så mye poeng å gi et generelt råd om dette, og så kan det heller være opp til de spesifikke områdene og kontekstene å vurdere dette.

    Kode: I den forrige utgaven av veiledningen fra 2023 ga vi et råd om å opplyse dersom kode var KI-generert. På dette tidspunktet var bruk av verktøy for KI-kodegenerering nokså nytt. Dette rådet er nå fjernet fordi det har blitt veldig vanlig og det mange som har innarbeidet dette i arbeidsflyten, eller som arbeider med det nå. På samme måte som med tekst, og kanskje i en enda større grad, er det usikkert hvor mye nytte brukerne har av å vite at kode er KI-generert.

    Bilder: For bilder har vi valgt å beholde rådet om merking. I tråd med tankene bak artikkel 50 i KI-forordningen, er det viktig at ingen blir forledet av innhold fra offentlige myndigheter. Med bilder fra en offentlig myndighet, er konteksten av å gi informasjon som offentlig myndighet i seg selv viktig. Derfor har dette verdi, selv om bildet kan bli flyttet og gjenbrukt uten at forbeholdet blir med videre.

  • Kommentarer på innhold i data.norge.no

    31 Emner
    116 Innlegg
    M

    Jepp, kom fram til at det var no slikt. Har lastet ned oppdatert datasett på tirsdager og det har fungert fint.

  • Kom med tilbakemeldinger på Datalandsbyen, Felles datakatalog og Transportportal.

    31 Emner
    60 Innlegg
    kjersti.stenerud.steienK
    Endringslogg uke 3 2025 Feilretting: Katalogoversikten for datasett i registreringsløsningen viser kun tittel hvis det finnes tittel på bokmål (https://github.com/Informasjonsforvaltning/fdk-issue-tracker/issues/1046) Feilretting: Ikke mulig å slette dato i feltet "Sist oppdatert" i registreringsskjemaet for datasett (https://github.com/Informasjonsforvaltning/fdk-issue-tracker/issues/1045) Oppdatert kube-prometheus-stack fra 0.70.0 til 0.79.2 (https://github.com/Informasjonsforvaltning/fdk-infra/issues/218) Oppdaterte mongodb-clusteret fra 7.0.14 til 8.0.4 (https://github.com/Informasjonsforvaltning/fdk-infra/issues/219) Oppgradert CMS Strapi fra 5.5.1. til 5.7.0. Sikkerhetsoppdateringer