Kjøretøydata og søkeparametre
-
Ref datasett på kjøretøydata, https://hotell.difi.no/?dataset=vegvesen/kjoretoy
Savner muligheten for å søke på dataparameter "tekn_eu_type", eller aller helst inkludere dette feltet under det generelle søkeparameteret "query".
På de fleste nyere kjøretøy er ikke dette feltet så interessant da det er en forholdsvis sekundær typekode, men ved søk på eldre kjøretøy (veterankjøretøy) ser jeg at vesentlig informasjon om modell og type ofte er splittet mellom feltene "tekn_modell" og "tekn_eu_type".
Et eksempel : Der èn bil kan ha benevnelsen "Alpine A310" i feltet for "tekn_modell" har en annen bil benevnelsen "Alpine" i feltet for "tekn_modell" mens "A310" ligger i feltet for "tekn_eu_type". I dette tilfellet er det da ikke mulig å finne samtlige Alpine A310 ved å søke i registeret, selv om man benytter litt ulike skrivemåter. A310 er i praksis ekskludert.
Det riktige i dette tilfellet (slik jeg ser det) er at A310 burde vært en del av modell, men så antar jeg at det var litt tilfeldig hvordan ulike kjøretøy ble registrert inn for 20-30-40 år siden.
Jeg har for ordens skyld funnet flere eksempler på denne problematikken, dette var en av dem.
Datasettet på kjøretøydata har stor verdi når det gjelder å kunne kartlegge gjenlevende veterankjøretøy (kanskje først og fremst antall), men når parameteret "tekn_eu_type" i praksis inneholder vesentlige data som ikke er søkbare, så mister datasettet litt verdi.
Håper noen kan ta dette opp til vurdering.
-
For spørsmål om sjølve dataene, så kan gjerne vegvesenet svare meir om dette.
Ikkje søk/filter på felt på grunn av spesialteikn
Når det gjeld API-et på Datahotellet, og kvifor søk (query-parameteret) og filter ikkje er skrudd på for feltet "tekn_eu_type" og diverse andre felt, så er dette fordi Datahotellet har problem med spesialteikn. Data i feltet du nemner inneheld spesialteikn, så søk og filtrering vil ikkje fungere som forventa dersom søke- eller filter-termen inneheld spesialteikn. Difor har vi ikkje skrudd dette på - for å unngå å forlede brukarane til å tru at søk og filtrering fungerer.For å gjere søk eller filtrering så vert ein difor nødt til å hente ned heile datasettet og deretter søke/filtrere på eiga maskin eller server. I ein anna tråd er det tips om korleis jobbe med store CSV-filer som kjøretøy-datasettet.
Problem med spesialtegn er også nemt i Datahotellet sin dokumentasjon, i avsnittet "Spesialtegn".
Nytt Datahotell på sikt
I Datafabrikken jobbar vi med å få på plass ei ny løysing som på sikt skal erstatte Datahotellet. Vi har allereie tatt med oss dette behovet inn i arbeidet.Legger ved lenke til data-beskrivinga i data.norge.no, "Teknisk kjøretøyinformasjon", så vi får ei lenke til denne tråden derifrå.
-
@livar-bergheim Takk for svar. Da finnes det en forklaring.
Joda, å jobbe med filen som sådan er ikke noe problem annet enn at dette datasettet er plasskrevende dersom man skal legge det over i en egen database for mest mulig effektive oppslag.
Det enkleste er jo å bruke den som allerede ligger tilgjengelig hos dere, da med noen trade offs ift noen få søkebegrensninger. Jeg vet ikke hvor ofte dette konkrete datasettet oppdateres, det er jo greit å ha så ferske data som mulig hele tiden dersom man skal hente ned datasettet for videre bearbeiding.
-
@tom-1-2-3 Datasettet vert oppdatert kvar veke, vanlegvis på måndags morning/formiddag. Ser det manglar informasjon om oppdateringsfrekvens i oppføringa på data.norge.no.
Du kan hente ut ETag-verdien (ein HTTP-header) på datasettet for å sjekke når tid det vart sist oppdatert. Sjå detaljar på datahotellet si dokumentasjonsside, under overskrifta "ETag".
Det er eit nettlesar-innstikk (plugin som det heiter) som gir deg tidspunktet for sist oppdatering på eit datasett.
Med innstikket installert, så får ein opp tidspunktet når ein ser på datasettet i nettvisninga på hotell.difi.no:
-
Dette innlegget er slettet!
-