Begreppsarbete och informationshantering

189  Download (0)

Full text

(1)

NORDTERM 22

Begreppsarbete och informationshantering

Rapport från NORDTERM 2021 Helsingfors, Finland

1–2 juni 2021

(2)

ISBN 978-952-9794-37-9 (PDF)

ISSN 1100-9659

Utgiven för Nordterm av Terminologicentralen

Runebergsgatan 4c B 20, FI-00100 Helsingfors www.tsk.fi

Nordterm 2021 anordnades av

Organisering av Nordterm 2021 stöddes av

(3)

Innehåll

Förord...1 Jim J. Yang & Marianne Aasgaard:

Begrepsarbeid som en sentral del av informasjonsforvaltning...2 Riitta Alkula:

Developing practical interoperability tools and methods for practical users...15 Stefano Testi:

Skillnader och likheter mellan begreppsdiagram och begreppsmodeller...19 Bodil Nistrup Madsen:

Polyhierarki og ikke-leksikaliserede begreber i terminologiske ontologier...28 Mikael af Hällström:

Abstract: Enabling semantic interoperability in legal drafting...43 Ingebjørg Rype:

Norsk tesaurus for sjanger og form...44 Ole Våge:

På vei mot en felles terminologi i norsk helsevesen. Bruk av korpus i arbeidet med å omsetje Snomed CT til norsk...52 Virpi Kalliokuusi & Johanna Eerola:

Informationshantering inom social- och hälsovården. Utveckling och harmonisering av

verksamhetsmodeller för begreppsarbete...56 Henrik Nilsson:

Terminologifrämjandet – om att fylla ett hål i Terminologi-Sverige...62 Gisle Andersen, Peder Gammeltoft & Kjetil Gundersen:

Termportalen – fra forprosjekt til fast finansiering...65 Henrik Nilsson:

Distansering, elicitering och facilitering – det ”nya” terminologiarbetet?...77 Lise Lotte Weilgaard Christensen & Irene Simonsen:

Nabosprogslæring for voksne mhp. integration i arbejdslivet på begge sider af den dansk- tyske grænse...90 Marit Holm Torseth & Synne Solbakken:

Verdien av informasjonsforvaltning i krisetid...99 Kerstin Lindmark:

Begrepp utan gränser. En enkätundersökning om hur Scanias översättare världen över

uppfattar termer från Södertälje...105 Pekka Linna & Satu Lindberg:

Discretionary government grants glossary developed in close collaboration with

the glossary’s future users...120

(4)

Susanne Lervad & Morten Grymer-Hansen:

Conceptual work and information management of textile technical terminology by

Margrethe Hald et al...129

Rapport från Nordterms styrgrupp 2019–2021...138

Beretning fra Terminologigruppen i Danmark 2019–2021...140

Rapport från Finland 2019–2021...144

Terminologiarbejde på Færøerne 2019–2021...156

Terminologiaktiviteter i Grønland 2019–2021...157

Rapport fra Island 2019–2021...159

Statusrapport for Norge 2019–2021...161

Nordiskt kunskaps- och resurscentrum för samiska språk...164

Terminologiverksamheten i Sverige 2019–2021...165

Arbeidsgruppe 1: Rapport om perioden 2019–2020...167

Arbeidsgruppe 2: Terminologi i Norden 2020...171

Program...184

(5)

Förord

Nordterm 2021 arrangerades av Terminologicentralen och Helsingfors universitet den 1–2 juni 2021. Målgruppen för evenemanget var alla som är intresserade i terminologi och vill med hjälp av begreppsarbete göra informationshantering mer effektiv till exempel vid utvecklingen av informationsarkitektur, informationssystem och digitala tjänster.

I 2021 ordnades Nordtermevenemanget för första gången någonsin som ett webbinarium och också Nordterms arbetsgrupper och styrgrupp höll sina möten virtuellt. Grunden för den här lösningen var coronapandemin som hindrade resandet till Finland.

Programmet för webbinariet bestod av föredrag, pausdiskussioner och rapporter från olika språkområden. Moderatorer Henrik Nilsson och Anna-Lena Bucher från Terminologifrämjandet ledde webbinariet, medan Hanne Erdman Thomsen från Terminologigruppen, Åsa Holmér från Institutet för språk och folkminnen och Kristiina Antinjuntti från Finlands tolk- och

översättarförbund ledde diskussionen under pauserna. Huvudtalare Jim J. Yang från Digitaliseringsdirektoratet och Marianne Aasgaard från Språkrådet Norge berättade om begreppsarbete som en central del av informationsförvaltning. Teman som behandlades i föredrag och diskuterades under pauser omfattade terminologiska metoder och inter- operabilitet, nya tillämpningsområde för begreppsarbete, organisering av begreppsarbete i de nordiska länderna och flerspråkigt begreppsarbete. Drygt 200 intresserade anmälde sig till webbinariet och under de två dagarna var det högsta antalet samtidiga deltagare ca 140.

Nordplus (finansiering) och Myndigheten för digitalisering och befolkningsdata var samarbets- partner till Nordterm 2021.

Denna PDF-publikationen innehåller artiklar som baserar sig på föredragen och rapporter från arbetsgrupperna, styrgruppen och olika språkområden som representeras på Nordterm.

Helsingfors i september 2021 Katri Seppälä

(6)

Begrepsarbeid som en sentral del av informasjonsforvaltning

Jim J. Yang, Digitaliseringsdirektoratet & Marianne Aasgaard, Språkrådet

Sammendrag

Deling og gjenbruk av data i offentlig sektor og med privat sektor har de siste fem til ti årene vært en av de viktigste driverne for å ha god informasjonsforvaltning i offentlig sektor i Norge.

For å kunne korrekt bruke data fra andre er det viktig å forstå dataene, både betydningen og strukturen av dataene. Felles datakatalog som er etablert i Norge, inneholder derfor ikke bare oversikt over datasett som kan deles, men også begreper, informasjonsmodeller osv.

Deling og gjenbruk gjelder ikke bare data, men også begreper, informasjonsmodeller osv.

Dette forutsetter standardiserte, strukturerte og maskinlesbare beskrivelser av begreper osv.

Det er derfor etablert forvaltningsstandarder med tilhørende veiledere samt

opplæringsmateriale og kurs, som hjelp til selvhjelp i virksomhetenes begrepsarbeid. Gjenbruk av begreper og informasjonsmodeller forsterker også behovet for fellesoffentlige begreper.

I denne artikkelen presenterer vi den nasjonale satsingen på informasjonsforvaltning i den offentlige sektoren i Norge, hvor begrepsarbeid spiller en sentral rolle. Vi presenterer videre hvordan Digitaliseringsdirektoratet og Språkrådet samarbeider om å etablere standarder, veiledere, prosesser og opplæringsmateriale, og å etablere fellesoffentlige begreper.

Informasjonsforvaltning og deling av data

Topplederforumet Skate (Styring og koordinering av tjenester i e-forvaltning), som er et strategisk samarbeidsråd og rådgivende organ til Digitaliseringsdirektoratet og digitaliseringsministeren, gjennomførte i 2014 en kartlegging av udekkede behov innen digitaliseringen i offentlig sektor. Basert på kartleggingsresultatet besluttet Skate å

gjennomføre en foranalyse av de tre høyest prioriterte områdene med udekkede, komplekse behov (Referat fra Skate-møte 27. 11. 2014 ), deriblant informasjonsforvaltning

(informasjonsforvaltning omfatter «aktiviteter, verktøy og andre tiltak for å sikre best mulig kvalitet, utnyttelse og sikring av informasjon» (Direktoratet for forvaltning og IKT, 2013).

Våren 2015 ble foranalyserapporten (Sluttrapport. Foranalyse Informasjonsforvaltning og - utveksling (pdf)) ferdigstilt og godkjent av Skate. Skate-direktørene ga sin tilslutning til tre ambisjonsnivåer og et felles rammeverk for informasjonsforvaltning i offentlig sektor, som illustrert i figur 1 og nærmere beskrevet i punktlisten nedenfor.

(7)

Begrepsarbeid som en sentral del av informasjonsforvaltning

Ambisjonsnivå 3: Gjenbruk av data og tjenester er hovedregelen.

Ambisjonsnivå 2: For at gjenbruk skal kunne være hovedregelen, må det som kan gjenbrukes, være tilgjengelig.

Ambisjonsnivå 1: Det første steget mot gjenbruk som hovedregel er å skaffe seg oversikt over det som kan gjenbrukes.

Grunnmur: I bunnen ligger et felles rammeverk for informasjonsforvaltning som legger til rette for at ambisjonsnivåene kan nås.

Stortingsmeldingen Digital agenda for Norge, som kom 2016, knesatte prinsippet om at

«forvaltningen skal gjenbruke informasjon i stedet for å spørre brukerne på nytt om forhold de allerede har opplyst» (Regjeringen, 2016), omtalt som «kun én gang»-prinsippet (tilsvarende EUs «once only»-prinsipp (CEF Digital, 2020)). Regjeringens Digitaliseringsstrategi for

offentlig sektor som kom 2019, fastslo igjen at «offentlig sektor skal dele data når den kan og skjerme data når den må» (Regjeringen, 2019). Fra og med 2016 stilte det årlige

Digitaliseringsrundskrivet også krav til offentlige virksomheter om at de skal følge «kun én gang»-prinsippet:

«Den enkelte virksomhet skal ha tilstrekkelig oversikt over hvilke data den håndterer.

[…] Offentlige virksomheter skal ikke spørre brukerne på nytt om forhold de allerede har opplyst om. […] Finnes data hos en annen virksomhet, skal data hentes derfra, forutsatt at det foreligger rettslig grunnlag.» (Regjeringen, 2020)

Digitaliseringsrundskrivet er en sammenstilling av regjeringens pålegg og anbefalinger om digitalisering i offentlig sektor. Det gjelder for departementene, statens ordinære

forvaltningsorganer, forvaltningsorganer med særskilte fullmakter og forvaltningsbedrifter.

På grunnlag av anbefalingene i foranalysen ble det høsten 2016 igangsatt et arbeid med å utvikle en felles datakatalog og etablere et felles rammeverk for informasjonsforvaltning.

Samtidig startet flere etater opp arbeidet med å få oversikt over og beskrive dataene de behandler (dette arbeidet ble omtalt som å skape «orden i eget hus»).

Til sammen var arbeidet med Felles datakatalog, Rammeverk for informasjonsforvaltning og

«orden i eget hus» i virksomhetene et nasjonalt løft som krevde godt samspill mellom deler av et komplekst system. Samspillet mellom de ulike delene av arbeidet er illustrert i figur 2, og i punktlisten under gis en kort beskrivelse av hver del.

Figur 1. Ambisjonsnivåer og grunnmur (Sluttrapport. Foranalyse Informasjonsforvaltning og -utveksling)

(8)

Felles datakatalog er en fellesløsning som skal gi en oversikt over hvilke data det offentlige til sammen behandler, samt hva dataene betyr, juridiske grunnlag for behandling (inkludert deling og skjerming) av dataene, teknisk tilgang til dataene, m.m.

«Orden i eget hus» betegner det at offentlige virksomheter har oversikt over hvilke data de behandler, og tilgjengeliggjør oversiktene. Uten at slike dataoversikter lages og deles, vil det ikke være mulig å ha en felles oversikt over alle dataene i det offentlige.

Rammeverk og arena for informasjonsforvaltning viser til et felles rammeverk med standarder og veiledere og en felles arena for diskusjoner og erfaringsutveksling.

Dette er nødvendig for at oversiktene og beskrivelsene som den enkelte virksomheten skaper, skal kunne forstås av andre.

Gjenbruk av og maskinell tilgang til data har vært hovedprinsippet i den nasjonale satsingen på informasjonsforvaltning. Det har derfor vært et mål at oversikter over og beskrivelser av data skal forvaltes hos den virksomheten som de faglig sett tilhører, og at de skal høstes inn automatisk til Felles datakatalog (illustrert i figur 2 med de blå «rørledningene» inn til Felles datakatalog). Felles datakatalog inneholder også enkle registreringsløsninger slik at

virksomheter som ikke har egnede registreringsløsninger selv, også kan registrere og tilgjengeliggjøre sine oversikter og beskrivelser.

Figur 2. Samspill mellom Felles datakatalog, Rammeverk og arena for informasjonsforvaltning og «orden i eget hus» i virksomhetene

(9)

Begrepsarbeid som en sentral del av informasjonsforvaltning

Figur 3 viser det som per i dag er dekket av Felles datakatalog:

• beskrivelser av datasett som kan deles, inkludert beskrivelser av datakvalitet, juridiske grunnlag for behandling av data, hvor data eventuelt kan lastes ned, osv.

• beskrivelser av datatjenester (også kjent som API-er) som blant annet gir teknisk tilgang til data som kan deles

• beskrivelser av begreper som dataene representerer eller forklares med

informasjonsmodeller som beskriver strukturen til datasettene som kan deles

• beskrivelser av tjenester og hendelser, i skrivende stund i en beta-versjon med eksempeldata

Begrepsdelen av Felles datakatalog inneholder i dag også beskrivelser av begreper som ikke nødvendigvis er direkte knyttet til noen spesifikke datasett, for eksempel begrepet

‘samhandlingsevne’ (engelsk interoperability).

Informasjonsmodelldelen av Felles datakatalog omfatter i dag også gjenbrukbare felles informasjonsmodeller (tilsvarende EUs Core Vocabularies) som ikke nødvendigvis direkte beskriver noen spesifikke datasett, for eksempel «Felles informasjonsmodell for Adresse».

Tjeneste- og hendelsesdelen av Felles datakatalog skal inneholde beskrivelser av tjenester og hendelser. For eksempel kan hendelsen «å starte og drive en restaurant» utløse behov for tjenesten «skjenkebevilling» i en gitt kommune. Det skal også være mulig å knytte

datasett/datatilbydere til de ulike (sammenhengende) tjenestene, for eksempel kreves følgende som dokumentasjon ved behandling av søknad om skjenkebevilling: Firmaattest fra Brønnøysundregistrene, Serveringsbevilling fra Mattilsynet, Vandelsattest fra Politidirektoratet, Attest for skatt og merverdiavgift fra Skatteetaten.

I resten av artikkelen kommer vi bare til å ta for oss begrepsdelen og informasjonsmodelldelen av Felles datakatalog.

Begrepsarbeid som en sentral del av informasjonsforvaltning

Figur 4 viser et utdrag av en datasettbeskrivelse hentet fra Felles datakatalog. Datasettet inneholder opplysninger fra barnehager og skolefritidsordninger. For å kunne bruke datasettet

Figur 3. Felles datakatalog

(10)

korrekt, trenger man å vite hva ‘barnehage’ og ‘skolefritidsordning’ betyr. Felles datakatalog viser derfor en definisjon av disse begrepene.

Ved å klikke på et begrep kommer man til begrepsdelen av Felles datakatalog, som gir en mer detaljert beskrivelse av begrepet. Figur 5 viser et utdrag av beskrivelsen av begrepet

‘skolefritidsordning’. Her får man blant annet se tillatte termer, datasett som inneholder opplysninger relatert til begrepet, og kontaktinformasjon til organisasjonen som er ansvarlig for begrepsbeskrivelsen.

Figur 4. Utdrag av en datasettbeskrivelse

(11)

Begrepsarbeid som en sentral del av informasjonsforvaltning

Hjelp til selvhjelp i begrepsarbeid

For at begrepsbeskrivelser skal kunne forstås av andre og innhøstes automatisk til Felles datakatalog, er det etablert et sett med anbefalte (det vil si ikke-obligatoriske)

forvaltningsstandarder for begrepsanalyse og definisjonsarbeid (Behovsområde

«Begrepsanalyse og definisjonsarbeid» i Referansekatalogen for IT-standarder), som illustrert i figur 6.

Figur 5. Utdrag av en begrepsbeskrivelse

Figur 6. Forvaltningsstandarder for begrepsanalyse og definisjonsarbeid

(12)

Termlosen (norsk utgave av Guide to Terminology (pdf)) er en kortfattet og trinn for trinn veiledning i praktisk terminologiarbeid. Den beskriver for eksempel hvordan en definisjon utformes slik at den best mulig beskriver et begrep og samtidig skiller det fra andre

beslektede begreper, og hvordan en term velges eller dannes slik at den best mulig gjenspeiler innholdet i begrepet.

Forvaltningsstandard for begrepsbeskrivelser er en innholdsstandard som spesifiserer hva en begrepsbeskrivelse skal og kan inneholde. Den sier for eksempel at ethvert begrep skal ha minst én anbefalt term (og maksimalt én per språk/målform) og minst én definisjon (og maksimalt én per språk/målform). Videre sier den at begrepet kan ha én eller flere tillatte og/eller frarådde termer, og én eller flere alternativt formulerte definisjoner.

Til Forvaltningsstandard for begrepsbeskrivelser følger det også med en veileder: Veileder for bruk av Forvaltningsstandard for begrepsbeskrivelser.

SKOS-AP-NO-Begrep – Forvaltningsstandard for tilgjengeliggjøring av begrepsbeskrivelser basert på SKOS er en teknisk standard som spesifiserer hvordan begrepsbeskrivelser utformet i henhold til Forvaltningsstandard for begrepsbeskrivelser gjøres tilgjengelig i maskinlesbare formater i samsvar med W3C-standarden SKOS . Den spesifiserer for eksempel hvordan SKOS brukes til å angi «dette er definisjonen på engelsk», slik at dataapplikasjoner klarer å vise den aktuelle teksten som definisjon og ikke som term, og slik at de klarer å vise den engelske teksten i et engelskspråklig brukergrensesnitt.

TBX-AP-NO – Forvaltningsstandard for tilgjengeliggjøring av begrepsbeskrivelser basert på TBX er en teknisk standard som spesifiserer hvordan begrepsbeskrivelser utformet i henhold til Forvaltningsstandard for begrepsbeskrivelser gjøres tilgjengelig i maskinlesbare formater i samsvar med ISO-standarden TBX (NS-ISO 30042:2019). Den spesifiserer hvordan TBX brukes til å angi hva som er hva i en begrepsbeskrivelse, slik at dataapplikasjoner klarer å håndtere beskrivelsen korrekt.

Forvaltningsstandard for begrepsharmonisering og begrepsdifferensiering er en prosesstandard som beskriver hvordan likheter og ulikheter mellom beslektede eller overlappende begreper avklares, slik at man har et grunnlag for å harmonisere eller differensiere begrepene. Å harmonisere begreper vil å si å fjerne eller redusere ulikheter mellom dem. Å differensiere begreper vil si å tydeliggjøre forskjeller mellom dem.

De ulike forvaltningsstandardene er ment å brukes i ulike sammenhenger. Dette er illustrert i figur 7 og forklart i punktlisten under (numrene i parentes i punktlisten svarer til numrene i figuren).

(13)

Begrepsarbeid som en sentral del av informasjonsforvaltning

Termlosen (1) og Forvaltningsstandard for begrepsbeskrivelser (2) brukes når virksomhetene analyserer og beskriver begrepene sine.

SKOS-AP-NO-Begrep (3) eller TBX-AP-NO (4) brukes når virksomhetene publiserer begrepsbeskrivelsene sine i maskinlesbare formater, slik at Felles datakatalog skal kunne automatisk høste inn beskrivelsene.

Forvaltningsstandard for begrepsharmonisering og begrepsdifferensiering (5) brukes når virksomhetene har behov for å harmonisere eller differensiere beslektede eller overlappende begreper.

Digitaliseringsdirektoratet og Språkrådet samarbeider om etablering og oppdatering av nødvendige forvaltningsstandarder for begrepsanalyse og definisjonsarbeid. Standarder med tilhørende veiledere inngår i Rammeverk for informasjonsforvaltning (jf. figur 1).

I tillegg til at det finnes standarder for terminologiarbeid med tilhørende veiledere, tilbyr Språkrådet fysiske og digitale kurs i terminologiarbeid og ulike terminologiresursser på nett (Språkrådets terminologiressurser). Hensikten er å gi dem som arbeider med terminologi, mulighet til å tilegne seg grunnleggende terminologikompetanse. I samarbeid med

Digitaliseringsdirektoratet har Språkrådet også utviklet et e-læringskurs som gir en innføring i terminologi- og begrepsarbeid – Begrip begrepene!

Kurset gir en enkel innføring i begrepsanalyse, definisjonsskriving, termdanning og termvalg. I tillegg gir det en kort innføring i organisering av prosessen for arbeidet med begreper og terminologi.

Figur 7. Når brukes hvilken forvaltningsstandard

(14)

Kurset inneholder fem moduler, som vist i figur 8. Ideelt sett bør kurset gjennomføres i den modulrekkefølgen som er angitt, men det er mulig å bare ta enkeltmoduler. Modul 2, 3 og 4 er de faglig tyngste modulene og gir en innføring i begrepsanalyse, definisjonsskriving og

termdanning og termvalg. Disse modulene inneholder flere praktiske øvingsoppgaver.

Hovedmålgruppene for kurset er ansatte i offentlig forvaltning og i universitets- og

høgskolesektoren som arbeider med å skrive definisjoner eller lage norske termer. Kurset kan være relevant også for andre som arbeider med fagspråk eller kommunikasjon.

Standarder og veiledere, samt opplæringsmateriell og kurs gir «hjelp til selvhjelp» i virksomhetenes arbeid med begreper.

Behov for fellesoffentlige begreper

Informasjonsmodelldelen av Felles datakatalog inneholder som nevnt ikke bare informasjonsmodeller som beskriver strukturen til datasett som kan deles, men også gjenbrukbare felles informasjonsmodeller (tilsvarende EUs Core Vocabularies) som ikke nødvendigvis direkte beskriver strukturen til noen spesifikke datasett. Én av dem er Felles informasjonsmodell for Person og Enhet (revidering planlagt). Som illustrert i figur 9

inneholder den blant annet en objekttype (også kalt klasse) «Person», som har blant annet

«fødeland», «fødested» og «fødselsdato» som attributter.

Figur 8. Moduler i e-læringskurset Begrip begrepene!

(15)

Begrepsarbeid som en sentral del av informasjonsforvaltning

Prinsippet om gjenbruk gjelder ikke bare data, men også begreper og informasjonsmodeller.

Begrepet ‘person’ kan for eksempel gjenbrukes som overbegrepet til begrepene ‘student’,

‘lærer’ osv. Hvis det gjøres, trenger ikke alle å definere ‘person’ hver gang det trengs, og man unngår utilsiktede forskjeller mellom definisjonene som gjør det vanskelig å vite om man snakker om samme ‘person’ eller ikke. Objekttypen «Person» kan også gjenbrukes som supertypen til objekttypene «Student», «Lærer» osv. Da vil man ikke måtte finne opp

datastrukturen for «Person» hver gang man trenger å strukturere opplysninger om «Person», og det vil bli enklere å dele og gjenbruke fagområde- og bruksområdenøytrale opplysninger om person, som for eksempel en persons «fødeland», «fødested» og «fødselsdato». Deling og gjenbruk av begreper og informasjonsmodeller forsterker behovet for å ha felles definisjoner av fellesoffentlige begreper (også kalt toppontologier). For eksempel bør det være enighet om hva som omfattes av begrepet ‘person’.

Med fellesoffentlige begreper mener vi begreper på et svært overordnet nivå. Det er begreper som brukes på tvers av fagområder og virksomheter, som ligger øverst i begrepshierarkiet, og som fungerer som overbegrep for mer fag- og domenespesifikke begreper. Definisjonene av disse begrepene må fungere uavhengig av kontekst, slik at for eksempel begrepet ‘person’

kan fungere som overbegrep for både ‘student’ og ‘pasient’ selv om disse hører til ulike domener og fagområder.

Det er derfor satt i gang arbeid med å etablere nødvendige fellesoffentlige begreper, og i første omgang er sju sentrale begreper valgt ut, deriblant ‘person’ og ‘adresse’.

Figur 9. Hva er en person? – behov for fellesoffentlige begreper (toppontologier)

(16)

Figur 10 viser prosessen i arbeidet med å etablere fellesoffentlige begreper.

Arbeidsgruppa består av personer fra Digitaliseringsdirektoratet og Språkrådet, blant annet artikkelforfatterne, med kompetanse innenfor både informasjonsforvaltning og terminologi.

Ganske tidlig i prosessen utvekslet arbeidsgruppa erfaringer med nordiske aktører som hadde drevet med tilsvarende arbeid i sine land.

Arbeidsgruppa utarbeidet utkast til begrepsdiagram, definisjoner og termer for de sju fellesoffentlige begrepene. Dette utkastet ble presentert på et møte i «terminologiforum», som er en møteplass som er viet til arbeid med terminologi, i «Faglig arena for

informasjonsforvaltning» – et faglig fellesskap for personer som arbeider med digitaliseringen av offentlig forvaltning. På dette møtet ble utkastet diskutert, og det kom ulike innspill.

Arbeidsgruppa justerte så sine forslag før de ble sendt ut på høring. Det kom inn få svar på høringen, men temaet er også relativt smalt, og derfor var det ikke overraskende.

Høringssvarene viste at det var viktig at begrepene fungerte uavhengig av kontekst, men de viste også at det var viktig at begrepene likevel fungerte i kontekst, altså at for eksempel arvelighetsprinsippet fungerte nedover på de lavere nivåene.

I det store og hele ble arbeidsgruppas forslag godtatt med enkelte justeringer, men gruppa er fortsatt ikke i mål med arbeidet. Ett av begrepene har vært vanskelig å finne en god definisjon av, og derfor samarbeider arbeidsgruppa direkte med berørte virksomheter for å komme fram til et resultat som vil fungere.

Det vil være Språkrådet som har forvaltningsansvaret for de fellesoffentlige begrepene i Felles datakatalog.

Erfaringer fra arbeidet med fellesoffentlige begreper

Arbeidsgruppa har gjort seg flere erfaringer i arbeidet med de fellesoffentlige begrepene, mange av dem av pedagogisk art:

• Hensikten med arbeidet må forklares godt, blant annet hva fellesoffentlige begreper er, hvorfor vi trenger dem, og hvem arbeidet er til for

◦ I høringsnotatet ble nok ikke arbeidet med de fellesoffentlige begrepene godt nok forklart og beskrevet for dem som ikke allerede kjente til det. I tilsvarende arbeid fremover må det brukes mer tid på å forklare hva arbeidet innebærer, og hvorfor det er nødvendig.

• Terminologer og informasjonsforvaltere befinner seg i ulike «verdener»

Figur 10. Arbeidsprosess for etablering av fellesoffentlige begreper

(17)

Begrepsarbeid som en sentral del av informasjonsforvaltning

◦ Terminologene og informasjonsforvalterne går inn i arbeidet med ulike

forutsetninger og bakgrunner. Språket og fremgangsmåtene kan ligne litt, og man kan ofte bli lurt til å tro at alle snakker om det samme, selv om man kanskje ikke gjør det. Vi opplevde at det oppsto misforståelser mellom de to gruppene

underveis.

• Grensen mellom fellesoffentlige begreper og begreper flere har til felles kan være uklar

◦ Det er ikke alltid en helt klar grense mellom de begrepene som hører til de fellesoffentlige begrepene (toppontologien), og begreper som er felles for flere virksomheter, og som har behov for harmonisering.

Oppsummering

Begrepsarbeidet er en viktig del av informasjonsforvaltningsarbeidet. Det er et mål at

gjenbruk skal være hovedregelen, men for at det skal fungere godt, og for at riktige data skal brukes, må vi vite hva dataene betyr, og da blir gode begrepsdefinisjoner svært viktig.

Både Digitaliseringsdirektoratet og Språkrådet har som mål å tilby hjelp til selvhjelp. Det gjelder både i arbeid med informasjonsforvaltning og i begrepsarbeid. Vi har utviklet flere ulike opplæringsressurser i tillegg til forvaltningsstandarder som skal hjelpe virksomhetene til å kunne jobbe med disse tingene selv.

Vi har også sett behovet for fellesoffentlige begreper (toppontologi), blant annet fordi informasjonsmodellene skal peke til begreper. Informasjonsobjektene skal representere objekter i den virkelige verden, og vi ser at vi på et overordnet «toppnivå» da trenger felles definisjoner på tvers av sektorer og fagområder.

Referanser

Begrip begrepene! – et innføringskurs i terminologi- og begrepsarbeid.

Behovsområde «Begrepsanalyse og definisjonsarbeid» i Referansekatalogen for IT- standarder.

CEF Digital, 2020. The Once-Only Principle (OOP).

Direktoratet for forvaltning og IKT, 2013. Informasjonsforvaltning i offentlig sektor (Difi- rapport 2013:10).

European Commission. Core Vocabularies.

Felles datakatalog.

Felles informasjonsmodell for Person og Enhet (revidering planlagt).

Forvaltningsstandard for begrepsbeskrivelser.

Forvaltningsstandard for begrepsharmonisering og begrepsdifferensiering.

Forvaltningsstandard for tilgjengeliggjøring av begrepsbeskrivelser basert på TBX (TBX-AP- NO).

NS-ISO 30042:2019 Forvaltning av terminologiressurser - Utvekslingsformat for termbaser (TBX).

Rammeverk for informasjonsforvaltning.

(18)

Referat fra Skate-møte 27. november 2014, saksnr. 02/14.

Regjeringen, 2016. Digital agenda for Norge — IKT for en enklere hverdag og økt produktivitet, Meld. St. 27 (2015–2016).

Regjeringen, 2019. Én digital offentlig sektor — Digitaliseringsstrategi for offentlig sektor 2019–2025.

Regjeringen, 2020. Digitaliseringsrundskrivet, H-7/20.

Skate (Styring og koordinering av tjenester i e-forvaltning).

SKOS Simple Knowledge Organization System.

SKOS-AP-NO-Begrep – Forvaltningsstandard for tilgjengeliggjøring av begrepsbeskrivelser basert på SKOS.

Sluttrapport. Foranalyse Informasjonsforvaltning og -utveksling, 2015.

Språkrådets terminologiressurser.

Suonuuti, Heidi. 2001. Guide to Terminology (pdf). Helsinki: Tekniikan Sanastokeskus ry.

Termlosen. Kort innføring i begrepsanalyse og terminologiarbeid av Heidi Suonuuti.

Veileder for bruk av Forvaltningsstandard for begrepsbeskrivelser.

Veileder for orden i eget hus (under revisjon).

(19)

Developing practical interoperability tools and methods for practical users

Developing practical interoperability tools and methods for practical users

Riitta Alkula, Digital and Population Data Services Agency (The Finnish Digital Agency)

As terminologists very well know, words without context tend to be misunderstood. This happens between us humans and applies even more to computers. Information moves

between information systems in the shape of words and structures that the receiver interprets and turns into meaning.

In European Union, where we have a wide variety of countries and languages, it becomes even more challenging. In cross border data exchange public entities share citizen data with each other even when they don’t have a common language. One building block to reduce administrative burdens on citizens and businesses is the Once-Only Principle (OOP). The basic idea of OOP is that people using any public services only have to enter their information once.

Within the network of services public administrations in Europe can share data that citizens and businesses have already supplied, in a transparent and secure way.

But how do we know that the piece of information we need is already there, stored in some public service? And what if it is presented in a language we cannot speak? How do we

recognise the information we need? Somehow, we have to find the true meaning of the piece of information regardless of its various presentations and formats. This is not an academic problem but a very practical one.

Semantic interoperability is generally defined as interoperability that enables the transfer and processing of data in way that keeps the meaning unchanged and the content comprehensible to all parties. To keep the meaning of information unchanged in our data sharing process information needs metadata, in other words “information about information”. We need descriptions and labels to tell others what is the data we are dealing with. And we also need unique identifiers to help accessing that data, preferably in language-independent and machine-readable form.

Finnish government activities on the reuse of information

National application and implementation of the European Interoperability Framework (EIF) was going on in a two-year project in 2016–2018. This Joint Metadata and Information

Management Key Project was funded and steered by the Ministry of Finance. The once-only principle applied to government information requests: using said information for various legitimate purposes.

The project had two focus areas:

• the national metadata service called as the Interoperability Platform

• the Interoperability Method, which is a management solution for the core and metadata in the public administration and gives guidelines for organisations publishing their (meta)data descriptions on the Interoperability platform.

Nowadays legislative foundation for interoperability development is laid on the Act on Information Management in Public Administration (or Public Information Management Act).

Ministry of Finance was responsible for drafting the law and it was passed by Parliament in 2019.

(20)

One of the objectives of this act is to promote the interoperability of information systems and information pools within Finnish public administration. In detail, this means that the authorities shall implement electronic disclosure of regular and standard information between information systems via technical interfaces like application programming interfaces (API).

According to the act the description of the data structure of such technical interface is determined and maintained by the authority that discloses the information. When planning disclosure of information between several authorities via technical interfaces, the description of the data structure shall be determined and maintained at the direction of the ministry in charge of the mandate.

Where the magic happens

Because of earlier government projects promoting interoperability, Finnish public

administration has produced quite a many terminologies and data models. The problem is that they are not coherent and may not be in machine-readable form.

To enable semantic interoperability in practice Finland launched the above-mentioned interoperability project, which developed and released both the Interoperability Method and the technical Interoperability Platform. Both the platform and the method are now maintained by Digital and Population Data Services Agency. The mission of the agency is to promote the digitalisation of society, ensure the availability of data and offer services for customers’ life events.

The three major tools provided by the Interoperability Platform are the following:

• The Terminologies tool, a browser-based application for creating and managing information domain specific terminologies and concepts

• The Data Vocabularies tool, a browser-based application for managing and publishing data vocabularies (data models)

• The Reference Data tool, a technical platform for publishing and sharing common public sector code lists and reference data

Only authorized users from registered organisations can create and edit information in the tools, but all tools function as a public web site where anyone, including unregistered users, can browse the various resources.

The Interoperability Platform supports multilingual development. The user can choose between a Finnish, Swedish or an English interface. The actual data can be presented in various

languages, as the user is able to select and tag for their data almost any of the standardised language code defined by Internet Engineering Task Force (IETF). The user gets a template for every language they have defined and can provide the data for each language separately.

All Interoperability Platform tools provide a unique and machine-readable identification for each resource. This unique ID is called Uniform Resource Identifier, URI. In that manner the resources can be referenced anywhere and language-independently by using that specific URI.

As the concepts defined in the Terminologies tool are machine-readable and are provided with unique identifiers, they can be referenced elsewhere. The tools within Interoperability Platform also use this feature to link various resources together. For example, classes and properties created in data models are based on existing concepts in terminologies. There are also

(21)

Developing practical interoperability tools and methods for practical users

reusable data models, so called core vocabularies, which can be used as basis for context specific data models, which are called application profiles. An application profile addresses the interoperability requirements between information systems by retaining conformance with the base model.

Terminologies Tool in more detail

The Terminologies Tool is intended for

• terminology and vocabulary specialists in their organisations

• data and information architects as well as data modellers and other ICT experts whose work touches on semantics

• communications specialists and translators

• citizens who, as public service users, want to learn about the meanings of terms and concepts used in public administration

The Tool lets terminology specialists

• create and manage terminologies

• define concepts via user interface or import information on concepts via Excel or XML file, including language versions and their management

• define and maintain concept and term related information (update or delete)

• define and maintain formal, concept relations between concepts

• in addition to entering data via web interface, the concepts can be imported via a text file (in spreadsheet terms a comma-separated values format, CSV) or via an Extensible Markup Language (XML) file that is a subset of Nordic Terminological Record Format, NTRF.

In addition to browsing and searching via web user interface, the data can also be accessed via application programming interface.

'Re-use when possible, mint when necessary'

The Interoperability Method presents the principles according to which the information and metadata are described in a consistent and harmonised way on the Interoperability platform.

Re-use is in the core of the method. The idea is that the more metadata descriptions there are on the Interoperability Platform, the less other users need to create their own descriptions.

When the definitions are of good quality, others can rely on the already existing descriptions.

With some modifications, our principles and the above mentioned slogan are based on

the process presented in the Cookbook for Translating Relational Data Models to RDF Schemas and are as follows:

1. Research existing concepts, terms, codes and data models and their usage and maximise re-use of them.

2. When new concepts can be seen as specialisations of existing concepts, create narrower concept, or sub class and sub properties as appropriate.

3. Where new concepts are required, create them following commonly agreed best practice in terms of naming conventions etc.

(22)

4. Publish descriptions within a highly stable environment designed to be persistent and identify them with URIs.

How to achieve common understanding

When information is defined in a systematic, harmonised way, we have better visibility to and understanding of information in different information systems. The problem is that common understanding is not self-evident but requires work.

In Finland we currently do not have a centralised organisation that would take care of common metadata descriptions and publish them like the Core Vocabularies are drafted and published on behalf of the European Union. EU Core Vocabularies are simplified, reusable, and extensible data models that capture the fundamental characteristics of an entity, such as a person or a public organisation, in a context-neutral manner. They are used mainly for information exchange between systems as well as in data integration and in development of new systems.

We aim to similar approach, but in practice our current way of working is decentralised and is based on organisations publishing mainly just their own descriptions developed for their own purposes. With such a decentralised working model all parties need practical guidance on how to produce semantically harmonized descriptions. The Interoperability Method aims to help this harmonization work and sets out the principles for co-creation of metadata definitions. It provides principles for how metadata is described in a technology independent way. The method connects terminological work and data modelling as well as reuse of code lists and classifications.

Establishment of domain-specific and cross-sectoral communities is on its way. We need a common governance model that sets out the principles for co-creation of metadata

definitions. The communities would align and agree on common definitions and specifications and share their results on our platform. Such a community already exists in the domain of built environment. It is recognized that we need also national core groups that would coordinate the harmonisation of concept descriptions, data models and code sets.

Figure 1. Interoperability platform

(23)

Skillnader och likheter mellan begreppsdiagram och begreppsmodeller

Skillnader och likheter mellan begreppsdiagram och begreppsmodeller

Stefano Testi, MedMod Ab

Detta föredrag vill visa på skillnader och likheter mellan begreppsdiagram i traditionella terminologiarbeten och begreppsmodeller där syftet är att beskriva begrepp som är viktiga i informationshänseende.

Under senare år har terminologer och informatiker i Sverige samarbetat mer med varandra när det gäller att ta fram begrepps- och informationsmodeller inom hälso- och sjukvård och socialtjänst. Terminologer kan här bidra till att modellerna närmar sig fackspråket i fråga för benämningar och beskrivningar av begrepp och klasser, och även klassernas attribut.

Jag kommer i denna artikel att använda begreppsdiagram och begreppsmodell. Ett begrepps- diagram är en grafisk framställning av ett begreppssystem, framtaget med terminologiska metoder. En begreppsmodell är en modell av begrepp och deras inbördes relationer inom ett specifikt område som kan visualiseras i en grafisk representation, och som kan vara ett stöd i arbetet med att ta fram en informationsmodell (se ISO 704 och ISO 24156-1).

Det vi har sett genom åren är att begreppsdiagram typiskt innehåller generiska relationer, medan begreppsmodeller till övervägande del innehåller associativa relationer. Traditionellt har begreppsdiagram använts som stöd vid definitionsskrivning. Nedan följer ett par exempel på begreppsdiagram, från Socialstyrelsens termbank, ett över olika typer av vårdkontakter, figur 1, och ett över olika typer av boende, figur 2 (gröna streck är generiska relationer, svarta pilar är associativa):

Figur 1. Begreppsdiagram över olika typer av vårdkontakter

(24)

Figur 1 på föregående sida visar ett typiskt begreppsdiagram med fokus på generiska

relationer och några associativa relationer. De associativa vill säga att vårdtillfälle associeras med vårdformen sluten vård, att vårdkontakt i öppen vård associeras med vårdformen öppen vård etc. I figur 2 nedan visas ytterligare ett begreppsdiagram med i huvudsak generiska relationer.

Lägg märke till att inga relationer är benämnda i någon av modellerna, man får själv anta vad det är för relation mellan begreppen. Jämför med exemplet på nästa sida, figur 3, på

en begreppsmodell (Inera, 20201), där alla relationsnamn är utskrivna (mer om detta längre ner):

Figur 2. Begreppsdiagram över olika typer av boende

Figur 3. Begreppsmodell över intyg inom hälso- och sjukvård Figur 2. Begreppsdiagram över olika typer av boende

(25)

Skillnader och likheter mellan begreppsdiagram och begreppsmodeller

Figur 3 visar en begreppsmodell över intyg inom hälso- och sjukvård. Denna modell innehåller inte så många generiska relationer, modellen har annat syfte än att vara ett stöd för att

definiera begrepp. Det har sagts om begreppsmodeller att ”begrepp definieras av sina

samband till andra begrepp” (Bolagsverket, 2018). Det har också sagts att en begreppsmodell åskådliggör definitionerna: ”Det är förhållandet mellan begreppen och därigenom de enskilda begreppens definitioner som åskådliggörs i en begreppsmodell.” (Fogelberg, 2003)

Låt oss titta på ytterligare en begreppsmodell, figur 4 (Inera, 2019):

Denna begreppsmodell visar hos vilka myndigheter den som söker ekonomiskt bistånd (se definition i Socialstyrelsens termbank), har ärenden. Den visar också vilka myndigheter som är med i SSBTEK, ”sammansatt bastjänst, ekonomiskt bistånd”, som har vilka förmåner e.d.

Inte heller denna modell fokuserar på generiska relationer, utan det är mest associativa relationer.

Men tittar man på begreppsmodellerna ovan ser man att dessa egentligen inte alls har med definitioner av begrepp att göra. I modellen för intyg får man veta att ett intyg kan ha

ärendekommunikation (som enligt beskrivningen för det begreppet är ”kommunikation mellan en intygsmottagare och en enhet kring ett enskilt intyg”), att hälso- och sjukvårdspersonal skapar/hanterar intyg, att ett intyg avser patient och överlämnas till intygsmottagare, att intyg innehåller svar, att behörig intygsutfärdare signerar intyg, att elektronisk underskrift validerar intyg och att makulering ogiltigförklarar intyg. Dessutom får man veta att ett intyg kan vara i tillstånd intygsutkast (men man kan fråga sig om det då verkligen är ett intyg), underskrivet eller signerat. Men vad är ett intyg? I Basord i våra fackspråk (TNC 104) definieras intyg på en generell nivå som ”dokument som formellt bekräftar eller försäkrar något”. Knappast någon av relationerna i begreppsmodellen kan sägas vara definierande för begreppet intyg. Men de kan vara viktiga av andra skäl.

Figur 4. Begreppsmodell över person som ansöker

(26)

Samma sak kan sägas om i stort sett samtliga begrepp i ovan visade begreppsmodeller.

Modellernas syfte är inte att definiera begrepp, utan snarare att visa vilken information som är viktig i respektive sammanhang, och ge en överblick över hur begreppen hänger ihop.

Jämför med begreppsdiagrammen ovan. I begreppsmodellerna är samtliga relationsnamn utskrivna. Man har valt att inte använda de symboler som finns i UML (unified modeling language) för generiska respektive partitiva relationer. I stället har man skrivit ”är en”

respektive ”är en del av”.

Det man kan fundera över när det gäller att skriva ut relationsnamnen i stället för att använda olika relationssymboler är om man då är lika medveten om vad relationerna står för. Om man skriver ”är en” mellan två begrepp, avses då en strikt generisk relation med arv av samtliga kännetecken från det överordnade till det underordnade begreppet? Eller tänker man bara en relation mellan begrepp utan närmare eftertanke? Ett av relationsnamnen i begreppsmodellen för intyg säger till exempel bara ”är” (behörig intygsutfärdare är hälso- och sjukvårds-

personal). Vad avses med det? Är det bara en felskrivning för ”är en”?

Jag har ingen bra förklaring till varför terminologiska begreppsdiagram inte brukar ange relationsnamn. Under mina år som terminolog har jag själv varit dålig på att skriva ut relationsnamnen. Kanske är det av tradition som vi inte brukar göra det?

Nu måste det inte vara så att ett terminologiskt begreppsdiagram innehåller mest generiska relationer. Se ett exempel nedan från Socialstyrelsens termbank, figur 5.

Detta begreppsdiagram vill åskådliggöra begrepp som har med uppmärksamhetsinformation (”information som avser något som avviker från det man normalt kan förvänta sig och som påverkar handläggningen av vård eller omsorg” enligt Socialstyrelsens termbank) att göra.

Det innehåller till övervägande del associativa relationer. Inte heller här har man skrivit ut relationsnamn på de associativa relationerna.

Vissa företeelser är viktiga att hålla information om inom ett visst område, till exempel hälso- och sjukvård. Benämningar för begreppen bakom dessa företeelser är inte nödvändigtvis facktermer och det skulle förmodligen inte finnas behov av att ha med sådana i ett begreppsdiagram som är resultatet av ett terminologiarbete för ett visst fackområde. Jag kommer att visa exempel ur en begreppsmodell från Socialstyrelsens arbete med nationell informationsstruktur för hälso- och sjukvård (Socialstyrelsen, 2021a; Socialstyrelsen, 2021b), se figur 6.

Figur 5. Begreppsdiagram över uppmärksamhetsinformation

(27)

Skillnader och likheter mellan begreppsdiagram och begreppsmodeller

Jag har i denna artikel valt att beskriva annan person, kommunikationssätt, plats, visshetsgrad, uppgift i patientjournal och planerad respektive utförd aktivitet.

I arbetet med nationell informationsstruktur för hälso- och sjukvård behövde man ett begrepp för person som på något sätt är relaterad till patienten men som inte är patienten själv eller hälso- och sjukvårdspersonal. Exempel är anhörig, närstående (se definitioner i

Socialstyrelsens termbank), företrädare, målsägande. Man kunde tänka sig att benämna begreppet ”person med relation till patienten”, men eftersom personalen inte skulle ingå så går inte det. Benämningen blev då ”annan person”, vilket ju inte kan vara en fackterm, men som kan fungera i sitt avgränsade sammanhang. I webbversionen av begreppsmodellen ovan (figur 6) kan man klicka på den rosa rutan ”Annan person” (efter Nordtermkonferensen publicerade Socialstyrelsen en ny version, där fungerar inte detta). Då får man upp en detaljerad modell över vilka andra personer som det finns dokumentationskrav för (figur 7):

Figur 6. Begreppsmodell över nationell informationsstruktur för hälso- och sjukvård

(28)

Men vad är detta? Är det en begreppsmodell (men utan några relationsnamn utskrivna)? Eller ett begreppsdiagram (men med vilken sorts relationer)? Det är meningen att det ska vara generiska relationer, men hur vet man det egentligen? I ovan visade begreppsmodeller ser de olika relationstyperna likadana ut, men med relationsnamnen utskrivna, men om det hade varit ett begreppsdiagram skulle det ha varit partitiva relationer.

I Socialstyrelsens termbank finns ett begreppsdiagram över roller, som påminner om modellen för annan person (figur 8):

Men här är det inte ”annan” person i förhållande till något som avses, utan helt enkelt olika roller som en person kan anta.

Figur 7. Modell över vilka andra personer som det finns dokumentationskrav för

Figur 8. Begreppsdiagram över roller

(29)

Skillnader och likheter mellan begreppsdiagram och begreppsmodeller

När det gäller kommunikationssätt, plats och visshetsgrad kan det vara sådant som är viktigt att dokumentera om en patient. Kommunikationssätt handlar om en persons sätt att

kommunicera med sin omgivning. Exempel på kommunikationssätt är talat språk och teckenspråk, där det kan vara viktigt att dokumentera huruvida patienten är i behov av en tolk. Men det kan även handla om att patienten behöver andra former av

kommunikationsstöd, till exempel om patienten kommunicerar via bilder eller röst- och

talhjälpmedel. Plats där vård utfördes kan behöva dokumenteras, till exempel plats för olycka, plats för dödsfall. Man kan behöva ange grad av visshet för att ett visst hälsotillstånd

föreligger, om det är bekräftat eller misstänkt. Varken kommunikationssätt, plats eller

visshetsgrad är typiska facktermer inom hälso- och sjukvård, men viktiga ur ett informations- och dokumentationsperspektiv. Därför finns de med i begreppsmodellen.

Patientjournal och journalhandling är facktermer som har definitioner i såväl Socialstyrelsens termbank som i svensk lagstiftning. I begreppsmodellen har man lagt in uppgift i

patientjournal med beskrivningen ”Uppgift som dokumenteras i patientjournalen. Exempel på uppgift i patientjournal är information om patientens hälsotillstånd, planerade och utförda aktiviteter och önskade måltillstånd.” I begreppsmodellen (se figur 6) har till exempel

vårdkontakt, hälsotillstånd, vårdbegäran relationen ”dokumenteras som” till uppgift i patientjournal. Det kan annars vara frestande att säga att vårdkontakt, hälsotillstånd etc.

”är en” uppgift i patientjournal, det vill säga generisk relation. Men det är det ju bara i detta specifika sammanhang. Som begrepp är vårdkontakt en typ av kontakt, hälsotillstånd en typ av tillstånd och vårdbegäran en typ av begäran.

När det gäller planerad och utförd aktivitet handlar detta snarare om status för aktiviteten.

Det finns många fler tänkbara sådana, som pågående, avbruten, inställd, utebliven. Dessa behöver inte vara egna begrepp i en begreppsmodell, utan kan finnas i till exempel

ett tillhörande kodverk. I en senare version av begreppsmodellen, publicerad efter Nordtermkonferensen, är planerad och utförd aktivitet borttagna ur modellen.

En fråga som har diskuterats en del genom åren är huruvida det borde vara samma notation oavsett om det är ett traditionellt terminologiskt begreppsdiagram eller en begreppsmodell. På nästä sida följer två exempel som visar samma sak, nämligen de typer av vårdkontakter som finns definierade i Socialstyrelsens termbank.

(30)

I figur 9 visas ett begreppsdiagram i Powerpoint (inte publicerat), med definitionerna inlagda.

Det blir här lite svårt med utrymmet, vissa termer har kortats av på grund av platsbrist, och inga indelningsgrunder är utritade.

Om man i stället använder UML, som i figur 10 ovan (inte heller publicerat), är det lättare att rita ut indelningsgrunder och att få med hela benämningen. Å andra sidan finns risken att detta tolkas som en begreppsmodell och inte ett begreppsdiagram.

Personligen tycker jag fortfarande att det är bra att visuellt kunna skilja mellan olika typer av diagram och modeller, se exempel i figur 11 på nästa sida.

Figur 10. Bergeppsmodell över vårdkontakter

Figur 9. Begreppsdiagram över vårdkontakter med definitionerna inlagda

(31)

Skillnader och likheter mellan begreppsdiagram och begreppsmodeller

I till exempel Socialstyrelsens modeller för den nationella informationsstrukturen för vård och omsorg ser man skillnad även mellan begrepps- och informationsmodell.

Referenser

Bolagsverket, 2018. Grundläggande uppgifter om företag (8.9.2021)

Fogelberg, Magnus 2003. Analys av begrepp och processer (pdf) (8.9.2021)

Inera, 2019. Informationsspecifikation för Ekonomiskt bistånd version 1.0 (28.5.2019) Inera, 2020a. Informationsspecifikation för Intygshantering, version 4.0.5 (docx) (17.1.2020)

Inera, 2020b. Referensarkitektur för grunddata och katalog, version 1.0 (pdf) (19.8.2020) Socialstyrelsen, 2021a. Länk till version 1 av begreppsmodell för hälso- och sjukvård (pdf) som refereras till i texten (8.9.2021)

Socialstyrelsen, 2021b. Länk till version 2 av begreppsmodell för hälso- och sjukvård (pdf) (8.9.2021)

Socialstyrelsens termbank (8.9.2021)

Socialstyrelsens termbank: Termposten ekonomiskt bistånd (8.9.2021)

SS-ISO 24156-1:2015 Grafisk notation för terminologiska begreppsmodeller ‒ Del 1: Riktlinjer för användning av UML-notation i terminologiarbete

SS-ISO 704:2011 Terminologiarbete ‒ Principer och metoder Terminologicentrum TNC 2012. Basord i våra fackspråk (TNC 104)

Figur 11 Begreppsdiagram över olika typer av beslut (Socialstyrelsens termbank) / Begreppsmodell över en organisations grunddata (Inera, 2020b)

(32)

Polyhierarki og ikke-leksikaliserede begreber i terminologiske ontologier

Bodil Nistrup Madsen, Copenhagen Business School, Departement of Management, Society and Communication

Indledning

Flere offentlige myndigheder opretter i forbindelse med deres begrebsarbejde terminologiske ontologier. Det vil sige terminologiske begrebssystemer, som er udvidet med karakteristiske træk og inddelingskriterier, jævnfør Madsen, Thomsen & Vikner (2004; 2005). Den mest anvendte relation mellem begreber er typerelationen (også kaldet generaliseringsrelationen), som kan danne hierarkier med begreber i flere niveauer. Et begreb kan indgå i et polyhierarki, det vil sige en struktur, hvor et eller flere begreber har mere end et overbegreb.

I nogle tilfælde er der behov for at indsætte et ekstra niveau begreber i en terminologisk ontologi for at kunne oprette polyhierarki og dermed opnå den rette struktur. Men i disse tilfælde eksisterer, der ikke altid gængse udtryk for de ekstra begreber, som derfor kaldes ikke-leksikaliserede begreber, jævnfør Damhus, Olesen Larsen, Madsen & Zambach (2009).

Eksempler på de sidstnævnte tilfælde findes i de komplekse terminologiske ontologier, som udarbejdes af offentlige myndigheder.

I mit indlæg vil jeg først introducere principper for terminologiske ontologier og diskutere anvendelsen af ikke-leksikaliserede begreber samt udformningen af definitioner af begreber, der indgår i polyhierarki. Dernæst vil jeg berøre, hvordan terminologiske ontologier kan danne baggrund for udviklingen af datamodeller, jævnfør Madsen & Ingram (2009) og Madsen &

Thomsen (2015). Herunder vil jeg diskutere, om en polyhierarkisk begrebsstruktur kan overføres til en datamodel, jævnfør Madsen (2012).

Terminologiske ontologier – grundlæggende principper

Adskillende og supplerende træk

I figur 1 ses et udsnit af en terminologisk ontologi udarbejdet af NBS (Det Nationale Begrebsråd for Sundhedsvæsenet), Arbejdsgruppe 07 (Forebyggelse, sundhedsfremme og folkesundhed).

Begreber vises som gule bokse, og begrebsrelationer (typerelationer) repræsenteres af grønne streger. De karakteristiske træk, som er tilføjet af forfatteren til dette indlæg, vises i form af attribut-værdi-par under begreberne. Endelig er der indsat inddelingskriterier (hvide bokse), som inddeler begreberne i grupper og viser hvad, der adskiller begreber inden for en gruppe.

Et inddelingskriterium svarer til attributten på begreberne i en gruppe, for eksempel MÅLGRUPPE.

Formålet med at udarbejde terminologiske ontologier er, at skabe en fælles forståelse mellem forskellige personer og målgrupper, som for eksempel rekvirenter og udviklere af et it-system.

Dette kan opnås ved opbygning af terminologiske ontologier, som overholder de

grundlæggende principper, og ved udarbejdelse af definitioner på basis af disse ontologier.

(33)

Polyhierarki og ikke-leksikaliserede begreber i terminologiske ontologier

Ifølge principperne for terminologiske ontologier adskilles sideordnede begreber ved hjælp af ét karakteristisk træk. Hvis der til et begreb er knyttet to eller flere træk, kan det skyldes flere forhold, blandt andet, at det eller de karakteristiske træk, som ikke er adskillende, supplerer det adskillende karakteristiske træk. I forbindelse med udarbejdelse af den terminologiske ontologi vedrørende forebyggelse registrerede Arbejdsgruppen NBS 07 flere træk på hvert begreb, jævnfør figur 2.

Det er terminologens opgave i hvert enkelt tilfælde at vurdere hvilket træk, der er adskillende, og hvilke(t), der er supplerende, jævnfør figur 3 (og 1), hvor kun de adskillende er vist: her er trækket med attributten MÅLGRUPPE adskillende, og trækkene med attributterne ARENA og AKTØR er supplerende og afhængige af trækket med attributten MÅLGRUPPE.

Figur 1. Eksempel på terminologisk ontologi vedrørende forebyggelse

Figur 2. Eksempel med flere træk på hvert begreb

(34)

Polyhierarki og nedarvning

Hvis der til et begreb er knyttet to eller flere træk, kan det også skyldes, at det pågældende begreb indgår i et polyhierarki, hvor begrebet har to (eller flere) overbegreber og derfor arver et træk fra hvert af disse overbegreber. Eksemplet i figur 4 viser, at et begreb ambulant tilbud til børn og unge er både en type ambulant tilbud og en type tilbud til børn og unge.

De nedarvede træk udgør tilsammen en trækstruktur, som giver en unik identifikation af begrebet, her TIDSRUM: efter aftale eller behov, MÅLGRUPPE: børn og unge. De to

overbegreber til begrebet ambulant tilbud til børn og unge hører til i hver sin gruppe (med hvert sit inddelingskriterium) og begrebet arver derfor en kombination af træk fra de to overbegreber fra de to forskellige grupper.

Figur 4. Polyhierarki – min gentegning af et udsnit af 06.01 Tilbud – Samlet oversigt – Fagbegreber

Figur 3. Kun ét adskillende træk på hvert begreb

(35)

Polyhierarki og ikke-leksikaliserede begreber i terminologiske ontologier

Dette og de følgende eksempler stammer fra Sociale Begreber, Socialstyrelsens begrebsbase:

Diagram 06.01 Tilbud – Samlet oversigt – Fagbegreber.

I figur 5 stammer kombinationen af træk fra to overbegreber fra den samme gruppe med inddelingskriteriet TIDSRUM, hvilket resulterer i konflikt mellem værdierne.

Polyhierarki og ikke-leksikaliserede begreber

I figur 6 vises min gentegning af et større udsnit af Diagram 06.01 Tilbud.

Figur 6. Udsnit af Diagram 06.01 Tilbud med polyhierarki

Figur 5. Ugyldigt polyhierarki (oprindeligt diagram ændret af forfatteren)

(36)

Som allerede tidligere nævnt, er der i nogle tilfælde behov for at indsætte et ekstra niveau (ikke-leksikaliserede) begreber i en terminologisk ontologi for at kunne oprette polyhierarki og dermed opnå den rette struktur.

Eksemplerne i det følgende afspejler min proces med at indsætte ikke-leksikaliserede

begreber og foretage ændringer i relationer og karakteristiske træk, efterhånden som jeg fik arbejdet mig ind i emnet.

I figur 7 vises underbegreberne til 1.2.1+1.4.2 dagtilbud til børn og unge, altså et af de underbegreber, der indgik i polyhierarki i figur 6. Der er i figur 7 ikke tale om polyhierarki under begrebet dagtilbud til børn og unge, men det var måske oprindeligt tanken, da der er to træk på hvert af begreberne. Endvidere er der to attributnavne i inddelingskriteriet, hvilket ikke er i overensstemmelse med principperne, som beskrives her. Som det ses, har 1.2.1.3 dagbehandlingstilbud til børn og unge og 1.2.1.6 uddannelsestilbud til børn og unge samme træk, det vil sige, at de to begreber ikke kan adskilles. Det kan konkluderes, at der bør indføres ikke-leksikaliserede begreber, således at der dannes polyhierarki i dette diagram.

Et ikke-leksikaliseret begreb eksisterer logisk set, men repræsenteres ikke af et udtryk, der normalt bruges. Ved at se på træk og definitioner fra basen, Sociale Begreber, identificeres en række manglende (ikke-leksikaliserede) begreber, som kan indsættes som underbegreber til overbegrebet dagtilbud til børn og unge, altså som et ekstra niveau. I figur 8 vises til Figur 7. Udsnit af Diagram 06.01 Tilbud (uden polyhierarki)

(37)

Polyhierarki og ikke-leksikaliserede begreber i terminologiske ontologier

venstre de ikke-leksikaliserede begreber, som blev identificeret, og i figur 9 vises, hvordan disse er indsat som et ekstra niveau (begreberne uden numre).

Der er i figur 9 indført et nyt inddelingskriterium YDELSE, og nye træk, for eksempel YDELSE:

behandling, YDELSE: uddannelse, og begreberne 1.2.1.3 dagbehandlingstilbud til børn og unge og 1.2.1.6 uddannelsestilbud til børn og unge kan nu adskilles!

Særlige behov dækker over børn og unge med nedsat fysisk eller psykisk funktionsevne eller med et andet særligt behov for støtte (Lov om social service 2020; §19). Trækværdierne ja og nej til attributterne SÆRLIGE BEHOV er ikke særligt sigende. De burde specificeres. Nærmere drøftelser med Socialstyrelsen kan måske give input her.

Forslag til nye definitioner af begreber i polyhierarki

Intensionale definitioner indledes med det nærmeste overbegreb efterfulgt af de(t) adskillende træk. Definitioner af begreber, der har flere overbegreber, indledes, om muligt under

hensyntagen til udformningen, af begge overbegreber. Men ofte indledes de med det ene overbegreb og anførelse af det andet overbegreb, som (en del af) det adskillende træk, jævnfør mine forslag i figur 12 og 14 (hvor der er tre overbegreber).

Figur 8. 06-01 Tilbud udsnit – forslag til ikke-leksikaliserede begreber listet

(38)

Figur 9. 06-01 Tilbud udsnit – Polyhierarki

(39)

Polyhierarki og ikke-leksikaliserede begreber i terminologiske ontologier

I Sociale Begreber anvendes også en tredje metode. Definitionen af 1.2.1+1.4.2 dagtilbud til børn og unge, jævnfør figur 6, lyder: ’tilbud, der både er dagtilbud og tilbud til børn og unge’.

Her er definitionen altså indledt med over-overbegrebet til dagtilbud til børn og unge.

Den nye struktur i diagrammet, dvs. indførslen af ikke-leksikaliserede begreber, giver et bedre grundlag for udarbejdelse af begrebsdefinitionerne. I figur 10 findes de to begreber

almindeligt klubtilbud og særligt klubtilbud med de nærmeste overordnede begreber og disses karakteristiske træk.

Jeg har indsat det ikke-leksikaliserede begreb dagtilbud til børn og unge med almindelige behov, med den fortolkning, at hvis man ikke har særlige behov (SÆRLIGE BEHOV: nej), så har man almindelige behov.

Termen almindeligt klubtilbud findes ikke i Lov om social service (2020), men indholdet kan udledes af teksten om særligt klubtilbud. Termen findes for eksempel på Social- og

ældreministeriets hjemmeside, og i Vejledning om dagtilbud, fritidshjem og klubtilbud, dog uden definition.

Definitionen af almindeligt klubtilbud i figur 11 fra basen Sociale begreber bygger på diagrammet i figur 7, hvor overbegrebet er dagtilbud til børn og unge og trækket

ALDERSGRUPPE er større børn og unge. I diagrammet i figur 7 får vi at vide, at målgruppen har ikke har særlige behov, men dette er ikke ekspliciteret i definitionen.

Det er ikke let at udforme definitionerne med den mest optimale rækkefølge af trækkene, men jeg vurderer, at mine forslag i figur 12 og 14 er lettere at læse end definitionerne i Sociale Begreber, og at de indeholder alle de nødvendige informationer.

Jeg har overtaget formuleringen ’dagtilbud … der leverer … ydelser’ fra Sociale begreber, hvor tilbud (med synonymet leverandør) defineres som ’organisation der leverer ydelser’.

Figur 10. Udsnit af figur 9

(40)

Mit forslag til definition i figur 12 bygger på den nye struktur i figur 10: overbegreb og træk kan læses direkte af diagrammet, definitionen bliver enklere og mere præcis.

Definitionen af særligt klubtilbud i figur 13 er ligeledes uklart opbygget, hvorimod min definition i figur 14 kan læses direkte ud af diagrammet.

Figur 11. Definition af almindeligt klubtilbud i Sociale Begreber

Figur 13. Særligt klubtilbud i Sociale Begreber

Figur 12. Mit forslag til definition af almindeligt klubtilbud

Figur 14. Mit forslag til definition af særligt klubtilbud

(41)

Polyhierarki og ikke-leksikaliserede begreber i terminologiske ontologier

Opsummering vedrørende brug af ikke-leksikaliserede begreber

Man kan diskutere, om det er hensigtsmæssigt at indføre polyhierarki ved hjælp af de mange ikke-leksikaliserede begreber. Det kan være uoverskueligt for brugeren, især da der opstår polyhierarki i flere niveauer. Men processen kan hjælpe til at forbedre de træk og definitioner, der findes i en kompleks ontologi. En mulighed kunne eventuelt være, efter udarbejdelse af træk og definitioner, at fjerne niveauet med ikke leksikaliserede begreber, og dermed vende tilbage til en enklere struktur, som den i figur 7.

Selv om de karakteristiske træk for begreberne er ændret i henhold til figur 9, løber man dog igen ind i problemet fra den oprindelige version figur 7, nemlig at overbegrebet bliver

det generelle begreb dagtilbud til børn og unge, og at man er nødt til at supplere

definitionerne med de mere specifikke aldersgrupper, for eksempel større børn og unge, jævnfør definitionerne i Sociale Begreber, figur 11 og 13, hvilket betyder at definitionerne bliver mere uoverskuelige. Jeg vil derfor anbefale strukturen med ikke-leksikaliserede begreber.

Terminologiske ontologier som grundlag for datamodeller

Dette afsnit er udarbejdet på basis af Madsen (2012) og Madsen & Ingram (2009), hvor vi diskuterede mulighederne for at opstille regler for at udarbejde konceptuelle og logiske datamodeller på basis af terminologiske ontologier. Overgangen fra logisk til fysisk datamodel berørte vi ikke, da denne er veldokumenteret. Der hersker uenighed om betegnelserne og definitionerne af datamodellerne, idet mange taler om informationsmodel. Det er uklart, om

Figur 15. Modelleringsforløbet

(42)

der hermed henvises til konceptuel eller logisk datamodel. Som det des i figur 15, betragter vi informationsmodel som synonym til konceptuel model.

Eksemplet, som anvendes, er baseret på Mathiassen et. al. (2001), men den terminologiske ontologi og datamodellerne i nærværende indlæg afviger væsentligt fra modellerne i denne kilde, jævnfør Madsen og Ingram (2009).

Figur 16 viser et udsnit af den terminologiske ontologi, som skal ligge som grundlag for en database (en it-applikation) indeholdende informationer om en konference.

Der mangler karakteristiske træk på en del begreber. Der er kun anført betegnelser på de to associative relationer mellem hhv. forfatter og artikel og reviewer og artikel. Alle øvrige associative relationer kan beskrives med betegnelserne, som ses i figur 18. Reglerne for at oprette en konceptuel datamodel på basis af en terminologisk ontologi findes i (Madsen 2012).

Reglerne for begreber i typerelationer vises i figur 17.

Figur 16. Konferencedatabase – udsnit af terminologisk ontologi

(43)

Polyhierarki og ikke-leksikaliserede begreber i terminologiske ontologier

De gule bokse repræsenterer klasser i UML-modellen, jævnfør UML 2.5.1 (2017). De grønne streger svarer til typerelationer (i datamodeller omtalt som generalisering/specialisering), og de sorte streger svarer til associative relationer. Som det ses svarer klasserne i de fleste

Figur 18. Konceptuel datamodel Figur 17. Regler for typerelationer

Figure

Updating...

References

Related subjects :