Den statistiske model - Tværgående opsamling og konklusion

5 Tværgående opsamling og konklusion

5.4 Den statistiske model

De statistiske modellers opbygning

I de tre lande, der anvender en statistisk model i profilafklaringen af de ledige, benyttes der enten en logit- eller en probit-model til at beregne sandsynligheden for, at personen bliver langtidsledig. I begge modeller opereres med et dikotomt udfald: langtidsledig henholdsvis ikke-langtidsledig. For hver af de uafhængige variable (forklarende variable, fx alder, uddan-nelsesniveau mv.) beregnes der en vægt, som indikerer, i hvilken grad den pågældende vari-abel påvirker den lediges sandsynlighed for langtidsledighed.

Omregningen fra de statistiske modeller til de konkrete profileringsværktøjer er ikke fuldt ud gennemsigtig i de tre lande. Mest konkret er sammenhængen beskrevet for det svenske bedömningsstöd (jf. Dahlén 2012), hvor beskrivelsen af værktøjet indeholder konkrete ek-sempler på klientprofiler og en beskrivelse af, hvordan de skal fortolkes. Det fremgår dog også af de øvrige to landes værktøjer, hvor stor en betydning de enkelte variable har for beregningen af den lediges profilscore (i form af de vægte, som regressionsanalyserne resul-terer i). For Australien beskrives desuden, hvilke værdier (point) de enkelte svarkategorier tildeles i beregningen af en JSCI-totalscore (jf. bilag 4). For Irland har tilsvarende oplysnin-ger ikke været tilgængelige.

De statistiske beregninger, der ligger bag profileringsværktøjerne, er i alle tre lande foretaget på baggrund af hele populationen af ledige over en bestemt tidsperiode (jf. O’Connell et al.

2009, Dahlén 2012, OECD 2012). Dette giver det mest pålidelige grundlag for at forudsige risikoen for langtidsledighed for ledige med forskellige karakteristika. Irland har dog valgt at beregne modeller særligt for mænd og kvinder, hvilket i Irland har betydet lidt forskellige vægte for de enkelte variable. Begrundelsen herfor er store forskelle mellem de to køn med hensyn til arbejdsdeltagelse og forudsætninger for at komme i arbejde. (I Australien udgør alder og køn én faktor, og man har valgt at tildele forskellige vægte for alderskategorierne for hhv. mænd og kvinder.)

I vores interview med forskerne, der havde udviklet det irske profilafklaringssystem, blev vi gjort opmærksom på, at det vil være problematisk at udarbejde et profileringsværktøj, der udelukkende bygger på en snævert afgrænset gruppe af ledige, fx unge eller ledige med hel-bredsproblemer. Det skyldes, at sådanne subgrupper ofte vil være meget homogene på cen-trale variable, med lidt variation på den afhængige såvel som de uafhængige variable. Kon-sekvensen bliver, at det er svært at finde variable, der har en signifikant betydning for udfal-det for den undersøgte gruppe, fx langtidsledighed. Derudover vil en sådan model have en meget lille forklaringskraft.

Den statistiske model resulterer ikke i bestemte profilkategorier. De profilkategorier, som er angivet i tabel 5.1, er defineret politisk-administrativt og har dermed ikke en direkte stati-stisk begrundelse.

Modellernes træfsikkerhed

Profileringsværktøjernes træfsikkerhed i forbindelse med at forudsige risikoen for langtidsle-dighed angives i de tre lande på forskellig måde. Derfor er oplysningerne om modellernes træfsikkerhed ikke direkte sammenlignelige med hinanden. Det har ikke været muligt ved vores dataindsamling at få adgang til data, som vil muliggøre sammenligningen på et ensar-tet grundlag.

Overordnet set gælder det, at modellernes træfsikkerhed med hensyn til at forudsige risikoen for langtidsledighed bliver desto bedre, jo højere cut-off-punktet for langtidsledighed sættes.

Ved et cut-off-punkt på 80 (dvs. hvor modellens træfsikkerhed kun vurderes for ledige, der minimum har 80 % sandsynlighed for at blive langtidsledige) placerer modellerne i Sverige og Irland korrekt udfald for mellem 81 og 83 % af tilfældene. Det har ikke været muligt at få en tilsvarende oplysning om træfsikkerheden for den australske model. Træfsikkerheden fal-der, hvis cut-off-punktet sættes ned, som illustreret i beskrivelsen af det irske profilerings-værktøj (jf. tabel 4.2 i afsnit 4.2.4). Dermed er modellerne og profileringsprofilerings-værktøjerne mest usikre for gruppen af ledige med ’middelrisiko’ for langtidsledighed. Da middelrisikogruppen udgør størstedelen af populationen, vil modellerne være forbundet med usikkerhed over for en betydelig del af de ledige.

Søjlediagrammet i Figur 5.1 (gengivet fra beskrivelsen fra den svenske profileringsmodel;

Dahlén 2012) illustrerer, hvordan profileringsværktøjets præcision er relateret til cut-off-punkterne. Hvis der alene ses på den delpopulation, som modellen placerer mellem 0.8 og 1.0, er modellens forudsigelse meget præcis: de allerfleste bliver langtidsledige. Tilsvarende bliver kun få ledige langtidsledige, hvis de har en lav risiko herfor ifølge modellen (jf. delpo-pulation mellem 0.0.-0.2 sandsynlighed for at blive langtidsledig). Diagrammet illustrerer endvidere, at modellen og dermed profileringsværktøjet er mest usikker for midtergrupperne, hvor størstedelen af populationen befinder sig i (jf. også afsnit 4.3.4).

Figur 5.1 Det faktiske antal af hhv. korttids- og langtidsledige ved forskellige prognostiske værdier for langtidsledighed

Kilde: Dahlén 2012.

Ikke overraskende er modellernes træfsikkerhed bedst for personer, som har de karakteristi-ka, som er relateret til høj sandsynlighed for langtidsledighed. Man vil altså med relativt stor sandsynlighed kunne forudsige, hvilke personer der er i højrisikogruppen for at blive langtids-ledige. Derimod vil modellernes præcision (prædiktive værdi) være mere usikker med hensyn til personer med moderat sandsynlighed for langtidsledighed. Ifølge vores interview med de forskere, der har været involveret i udviklingen af modellerne, kan man ikke forvente, at træfsikkerheden bliver meget bedre end den, som man finder i disse lande. Det skyldes, at der altid vil være en række uforklarede forhold, som påvirker de lediges relation til arbejds-markedet, og som det ikke er muligt at opfange.

Indholdsmæssig revision af modellerne

Af de tre lande har kun Australien foretaget mindre revisioner og genberegninger af den sta-tistiske model, som ligger til grund for profileringsværktøjet, bl.a. baseret på en ny dataind-samling. Den seneste dataindsamling i Australien er fra 2007. Den irske model bygger på dataindsamlingen i 2006 og den svenske på dataindsamlingen i 2010. Hverken i Australien, Irland eller i Sverige er der procedurer, som skal sikre, at den statistiske model opdateres løbende med nye data. I Australien og i Irland foretager ministeriet en monitorering på bag-grund af de data, der løbende indsamles fra de ledige. I Sverige er dette ikke muligt, idet resultaterne af profilering ikke gemmes i en database.

Det er et udbredt ønske blandt vores informanter – især forskere og analytikere, der har væ-ret involvevæ-ret i udviklingen af værktøjerne – at der blev fovæ-retaget systematiske

dataindsam-linger baseret på et udtræk af populationen af ledige. Dette vil give mulighed for at rekalku-lere modellen og eventuelt korrigere de vægte, enkelte variable bliver tildelt. Samtidig vurde-rer de forskere, vi har været i kontakt med, at modellerne fortsat afspejler de lediges risiko for langtidsledighed – på trods af, at der i alle de tre lande med statistisk profilering er gået nogle år siden seneste dataindsamling. Begrundelsen herfor er, at værktøjerne anvendes til at placere de ledige i relation til hinanden og i relativt brede kategorier. Derfor vil mindre ændringer i den lediges risikoscore typisk ikke betyde ændring i tilhørsforhold til en bestemt kategori. Dette har bl.a. O’Connell et al. (2012) konkluderet ved at sammenligne populatio-nen af arbejdsløse i 2006 og 2011 og analysere, om den statistiske profileringsmodel fortsat er effektiv.

In document Profilering af ledige Analyse af profileringsværktøjer i fire lande (Sider 78-81)