Datapromiskuitet og Data Vaults
-
Hei alle! Dette er egentlig verken et tips eller et spørsmål, men heller for å dele noen tanker for å starte en debatt. For dem som ikke kjenner meg, så har jeg en ph.d. i informatikk fra UiO om desentraliserte semantiske teknologier, og inntil nylig jobbet jeg i Tim Berners-Lee sin startup Inrupt på Solid-prosjektet. Jeg sitter fortsatt i styringsgruppa "Solid Editors", men nå på vegne av Norad, der jeg jobber med normative teknologier i utviklingsperspektiv.
En ting som bekymrer meg mye nå er at vi ikke gir de sosiale aspektene ved teknologiutviklingen nok plass. At vi lager ting som vil skade befolkningens mulighet til å operasjonalisere rettigheter gitt i lovverket.
Individet har stått veldig svakt i det teknologiske landskapet, og vi teknologer har advart mot dette lenge. Vi har endt opp i en situasjon der man er i praksis er tvunget til datapromiskuitet. Man mister rett og slett så mange muligheter ved å ikke dele data ukritisk at det ikke er et reelt alternativ.
Det er derfor viktig og riktig at pendelen svinger tilbake, og det virker som det er bred politisk enighet om at individet skal stå i sentrum. EUs visjon inneholder også dette. I IT-verdenen har man lenge snakket om et "Data Vault", men man skal merke seg at det har to forskjellige betydninger, den ene brukes om en arkitektur i datavarehus, men det er den andre betydningen, at man legger dataene sine i en svært sikker lagringsplass og at man så er svært forsiktig med å ta dem ut. Det ser faktisk ut til at politikken og IT-verdenen er i ferd med å bli enige om at det er dit man skal.
Men det vil, etter min mening, være feil. Det er rom for "Data Vault"-tanken, men bare om svært sensitive data. Men et "Data Vault" er egentlig ganske enkel: Det er egentlig bare å kryptere dataene med en symmetrisk nøkkel, og lagre dem så de ikke forsvinner (integritet og konfidensialitet blir altoverskyggende).
Alt som er interessant ligger i det å dele data, mesteparten av dataene mine, men på en slik måte at det hjelper meg å gjøre det jeg har fore. Dette er et mye vanskeligere problem enn "Data Vault", fordi vi plutselig må be folk flest å ordne med tilgangskontroll på et nivå tidligere forbeholdt eksperter. Her må vi være dyktige og forsiktige. Det er et enormt designproblem mer enn et programvareproblem, men det vil måtte guide all utvikling.
Jeg ser spenninger her dukke opp om små detaljer, som f.eks. en diskusjon i Solid, som egentlig handler om om man skal si om en ressurs vil støtte skriving eller ikke uavhengig om man vil være autorisert til å skrive til den. I en Data Vault-verden teller konfidensialitet alt, og da vil man selvfølgelig ikke det, mens i en verden der mye skal være tilgjengelig, men er desentralisert under kontrollen til mange forskjellige institusjoner eller personer, så kan det være avgjørende for skalbarheten og ytelsen i systemet at man kan gjøre det, og den konfidensialiteten man mister har ingenting å si, fordi man kan jo bare prøve å skrive til den og se hva som skjer. Slike situasjoner dukker opp hele tiden i min verden.
Det jeg videre er engstelig for er at når myndighetene skal skape innsynsløsninger o.l., så legger man seg tett opp til Data Vault-tankegangen, fordi dette er tett opp til GDPR og opp til mye av ideene i human centric-bevegelsen. Men det er ikke Data Vaults som kommer til å få barna mine på bursdag eller på trening. For å virkelig operasjonalisere befolkningens kontroll over egne data, så er det faktisk use-casene der dataene ikke har særlig krav til konfidensialitet som er viktigst, det er nettopp det som er en av grunnene til at vi har havnet i denne triste situasjonen, folk vil dele, de trenger å dele, de trenger å opptre sammen for å gjøre ting sammen. Og vi trenger å løfte sammen i situasjoner som f.eks. korona uten at man må gå helt til datapromiskuitet.
I dette mener jeg den sentrale utfordringen for informasjonsforvaltning ligger, og kanskje mest utenfor govtech-domenet, men govtech-domenet er viktig både som premissleverandør, som bestiller i store prosjekter, som tilbyder av viktig infrastruktur (f.eks. eID) og som et domene som kan sette ugunstige begrensninger hvis man ikke ser utenfor det sektorielle.
-
Takk for innsiktsfullt innlegg @kjetil-1 !
Sett fra arbeidet med innsyn sin side så kommer nok vi til å legge frem behov, og tiltak med fokus på hva og hvorfor. Når det kommer til hvordan, så vil vi nok drøfte ulike retninger/alternativer med fokus mulighetsrommet på kort og lang sikt. Vil gjerne ha en prat med deg om det når vi har fått fordøyd innsikten vår litt mer! Vi tror altså ikke at utredningen vår er spesielt egnet til å definere arkitekturen for datalagring og utveksling nasjonalt, det er andre miljøer bedre egnet til å gjøre. Det er også et arbeid som i stor grad påvirkes av det globale bildet, beslutninger hos EU, osv.. Arbeidet med nasjonal referansearkitektur og SKATE har kanskje den kraften som må til der, i kombinasjon med kunnskap fra vårt arbeid og andre utredninger som springer ut fra stortingsmeldingen Data som ressurs?
Når det er sagt så merker jeg meg et visst spenn i både offentlig og privat sektor rundt hva man tror og mener er den beste måten å løse ting på i fremtiden. Håper vi etter hvert klarer å samle feltet, og dra i samme retning.
Når det gjelder fokus på konfidensialitet og begrensning av dataene så kunne jeg ikke vært mer enig. Synes historien vi så rundt informasjonssikkerhet, hvor tilgjengelighet lå i skyggen av konfidensialitet og integritetskrav relativt lenge synes å gjenta seg. Mange former for data er ikke spesielt kontroversielle å anvende, til gode formål. Tror også at vi må starte reisen et sted og at det å gradvis eksponere innbyggerne mer for de valgene som andre tar på deres vegne (begrens) i dag der det gir en reell og opplevd nytteverdi, for å bygge kompetanse og aktive borgere som tar del i samfunnslivet.
To be continued Får litt lyst til å nudge @francis-dsilva, @steinar-skagemo her så gjør da bare det!