Multivariate analyser - FATTIGDOM OG SOCIAL EKSKLUSION

I de empiriske analyser i kapitel 5, 6 og 7 fremstilles inklusionen og eksklusionen og i kapitel 8 dødeligheden først som procenttabeller, der viser fordelingen eller udbredelsen af forskellige typer af levekår relateret til, forskellige karakteristika ved befolkningen, for eksempel i forhold til hvilken familietype man tilhører. Procentfordelingerne angiver imidlertid ikke, hvilke faktorer der statistisk set spiller en rolle for sandsynligheden for den givne fordeling af levekårene. Når der for eksempel er ﬂere fattige kvinder end mænd, skyldes dette så, at kvinders sandsynlighed for fattigdom alt andet lige er højere end mænds, eller skyldes det for eksempel, at kvinder i langt højere grad end mænd er enlige forsørgere, og at enlige forsørgere har en langt større sandsynlighed for fattigdom end andre grupper?

For at belyse, hvilke faktorer der statistisk set er betydningsfulde i forhold til sandsynligheden for at opleve for eksempel fattigdom, er der gennemført såkaldte multivariate analyser.

Den multivariate analyse, som er anvendt i undersøgelsen, er en logistisk regression, og der anvendes to typer af logistisk regression i analyserne. For det første en binær logistisk regression, hvor der kun er to udfaldsrum. Denne anvendes i kapitel 2, hvor udfaldsrummet er relativt økonomisk fattig eller ikke fattig, og i kapitel 5, 6 og 7 i for-hold til meget svært belastende levekår, hvor udfaldsrummet er meget svært belastende levekår og ikke meget svært belastende levekår. For det andet anvendes en multinominel logistisk regression, hvor der er

18. Blandt andre har Allardt (1990) anbefalet, at der i højere grad, end tilfældet er, sker en sammenkobling af kvantitative og kvalitative metoder og data inden for den samme undersøgelse af levekår (se også kapitel 9).

tre eller ﬂere udfaldsrum. Denne bruges i analysen af inklusion og eksklusion i kapitel 5, 6 og 7 og af dødeligheden i kapitel 8, hvor der er tre udfaldsrum: inklusion, midtergruppen og eksklusion.

Resultatet af de logistiske regressionsanalyser udtrykkes ved hjælp af

“odds ratios”, som er forholdet mellem to odds.¹⁹ Odds er forholdet mellem sandsynligheden for, at en begivenhed, for eksempel at blive/

forblive relativt økonomisk fattig, vil indtræde, og sandsynligheden for, at begivenheden ikke vil indtræde. Odds ratios er således to sæt af sandsynligheder sat i forhold til hinanden, for eksempel sandsynlig-heden for, at de, der var relativt økonomisk fattige i 1986, er fattige i 2000, sat over for sandsynligheden for, at de, der ikke varrelativt økonomisk fattige i 1986, er fattige i 2000. Odds ratios udtrykker, hvor meget større/mindre sandsynligheden er for det ene eller andet udfald af disse to sandsynligheder sat over for hinanden.

Oddsratio-tallene oversættes i tekstfremstillingen til sandsynlighed, fordi odds ratio er et noget akavet ord og en svær regnestørrelse for de ﬂeste ikke matematisk/statistisk kyndige fagfolk – måske bortset fra inkarnerede “gamblere”, som af deres “bookmakere” får angivet deres chancer for at vinde i odds eller odds ratios. Jævnfør for eksem-pel også betegnelsen for en af de spillemuligheder, der udbydes til danskerne: “Oddset” under Dansk Tipstjeneste.

Odds ratio-tallene kan dog ikke umiddelbart læses som den fak-tiske/relative sandsynlighed, men jo sjældnere forekomsten af en begivenhed (her social eksklusion) er i befolkningen, jo tættere er oddsratio-tallet på den faktiske sandsynlighed eller relative risiko.²⁰

19. Odds ratio-opgørelser er især udbredt i den medicinske forskning (Bland & Altman 2000), men i stigende grad også i samfundsforskningen.

20. Deeks (1996: 25) angiver følgende i forhold til at tolke odds ratio som relativ sandsynlighed/risiko: “For example, in the ISIS-4 study 2,231 of 29,022 patients in the control group died within 35 days: a risk of 0.077 [2,231/29,022] or an odds of 0.083 [2,231/(29,022-2,231)]. This is an absolute diﬀerence of 6 in 1000, or a relative error of about 7%. This close approximation holds when we talk about odds ratios and relative risks, providing the events are rare … It is clear that when the prevalence of the event is low, say 1%, the RR [relative risk] is a good approximation of the OR [odds ratio]. For example, when the OR is 10, the RR is 9, an error of 10% … if the baseline prevalence is 10% an OR of 4 is equivalent to a RR of 3, a discrepancy of 25%” (Deeks 1996: 25).

Signifikans

I nogle tilfælde vil visse variabler, for eksempel køn, vise sig ikke at være signiﬁkante. Det vil sige, at de af den ene eller anden grund ikke har nogen forklaringskraft og/eller er statistisk usikre. I nogle tilfælde kan disse variabler godt isoleret set have en signiﬁkans, men i den her anvendte model kontrolleres betydningen af hver enkelt variabel, der indgår, i forhold til hinanden. Køn kan således isoleret set være signiﬁkant, men når der kontrolleres for alder²¹ eller familiestatus, kan køn vise sig at være insigniﬁkant.

I andre tilfælde vil nogle variabler helt udgå af den logistiske regres-sion, for eksempel hvis én variabel er for tæt korreleret (”strukturelt”

afhængig) af en anden variabel. Det gælder i særdeleshed for varia-blerne socialgruppe og hovedbeskæftigelse, hvor for eksempel alder og status som pensionist under hovedbeskæftigelse er “strukturelt afhængige”, hvorfor hovedbeskæftigelse i en del af analyserne må udgå. Også i tilfælde, hvor der er for få cases i den enkelte kategori, kan den logistiske regressionsanalyse ikke gennemføres. Det gælder for eksempel for nogle af analyserne af dødeligheden i relation til socialgruppe I og II.

Hvis man således skulle undre sig over, at for eksempel socialgruppe eller hovedbeskæftigelse i visse af de logistiske regressionsanalyser er udgået – hvor man umiddelbart ville forvente, at disse var centrale variabler til at forklare en given levekårsfordeling – er det altså ikke nødvendigvis ensbetydende med, at disse variabler ingen forklarings-kraft har, men at de er stærkt sammenhængende med andre variable i analysemodellen og derfor må udgå af den multivariate analyse.

De udeladte variabler giver således ingen yderligere information om opdeling på de forskellige levekår set i forhold til de allerede inddragede variabler. Når man for eksempel kender respondentens

21. Alder er i analysemodellen omkodet til variablen “FAAR”, der viser odds ratio for, om et givent fænomen (social eksklusion eller meget svært belastende levekår) stiger eller falder med alderen. En positiv odds ratio-værdi udtrykker, at sandsynligheden for pågældende fænomen stiger med alderen. Hvis odds ratio for eksempel er 1,016, betyder det, at 50-årige – alt andet lige – har 30 x 1,016 større sandsynlighed for det pågældende fænomen end 20-årige.

socialgruppe, som optræder i modellen, giver yderligere information om respondentens erhvervstilknytning (som er udeladt) ikke større kendskab til respondents forventede levevilkår.

In document FATTIGDOM OG SOCIAL EKSKLUSION (Sider 108-111)