• Ingen resultater fundet

Funktion Frekvensfunktion Frekvensfunktion generelle tilfælde X ; Y uafhængige

In document En Introduktion til Statistik (Sider 52-66)

X +Y

Tabel 0.10: Frekvensfunktioner for simple funktioner af to kontinuert fordelte stokastiske variable

X

og

Y

med simultan frekvensfunktion

f(x;y)

såvel i det generelle tilfælde som i tilfældet med uafhængige

X

og

Y

. I det sidste tilfælde er frekvensfunktionerne for

X

og

Y f

X

(x)

henholdsvis

f

Y

(y)

.

0.9. MOMENTER 53

0.9 Momenter

DEFINITION0.7. Middelværdien eller forventningsværdien af en stokastisk vari-abel

X

med frekvensfunktionen

f

er tallet

E(X) =

x

xf(x) X

diskret

1

j

x

j

f(x)dx

respektivePj

x

j

f(x)

eksisterer.

E()

står for expectation

= forventning. Det ses, at middelværdien eller forventningsværdien netop svarer til tyngdepunktet i en (masse-)fordeling. Som standardbetegnelse for middelværdien an-vendes ofte

.

Forventningsværdiens betydning som mål for en fordelings placering fremgår af ne-denstående figur, hvor der er anført nogle frekvensfunktioner med forskellige mid-delværdier.

SÆTNING0.9. Lad

g

være en reel funktion af

n

variable. Hvis den (flerdimensionale)

stokastiske variable

(X

1

;

;X

n

)

har frekvensfunktionen

f

, da er

i henholdsvis det diskrete og det kontinuerte tilfælde.

Bevis. Vi indskrænker os til det endimensionale tilfælde med en kontinuert fordelt stokastisk variabel

X

, der transformeres af en monotont voksende funktion

g

. Vi har,

at frekvensfunktionen for

Y = g(X)

er

h(y) = f(g

?1

(y))(g

?1

)

0

(y)

Ved anvendelse af substitutionen

x = g

?1

(y)

fås

1

hvilket netop er det søgte resultat.

BEMÆRKNING0.2. Vi ser, at e.g.

X

1’s middelværdi naturligvis er den samme, hvad enten vi finder den i den marginale fordeling for

X

1, eller vi beregner den ved hjælp af

ovenstående sætning. H

Ved hjælp af Sætning 0.9 fås umiddelbart følgende vigtige regneregler for forvent-ningsværdier

0.9. MOMENTER 55

E(a + bX) = a + bE(X)

(0.40)

E(X + Y ) = E(X) + E(Y )

(0.41)

E(XY ) = E(X) E(Y ); X

og

Y

uafhængige (0.42)

Vi skal nu indføre begrebet momenter i en fordeling.

DEFINITION0.8. Den stokastiske variabel

X

’s

k

’te moment er

0k

= E

?

X

k

Det

k

’te centrale moment er størrelsen

k

= E

?

(X

?

E(X))

k

= E

?

(X

?

)

k

N

Det andet centrale moment kaldes også variansen og er altså

V(X) = E

?

(X

?

E(X))

2

= E

?

X

2?

(E(X))

2 (0.43)

(Det sidste lighedstegn ses ved direkte regning). Man bemærker, at variansen svarer til inertimomentet i en massefordeling. Som standardbetegnelse for variansen anvendes ofte

2.

Variansen er et mål for, hvor meget sandsynlighedsmassen er spredt ud over aksen.

Dette fremgår måske klarere, hvis man anvender skrivemåden

V(X) =

8

>

<

>

: P

i

(x

i?

)

2

f(x

i

)

1

R

?1

(x

?

)

2

f(x)dx ;

idet variansens betydning som mål for den gennemsnitlige kvadrerede afvigelse fra forventningsværdien nu klarere træder frem.

I nedenstående figur er anført to frekvensfunktioner med samme forventningsværdi, men med forskellige varianser.

−50 0 5

0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4

µ

Kvadratroden af variansen kaldes spredningen eller standardafvigelsen.

Som et relativt mål for "bredden" af en sandsynlighedsfordeling anvendes ofte forholdet mellem spredningen og middelværdien

=

p

V(X) E(X) :

Denne størrelse kaldes variationskoefficienten. Den er dog kun et fornuftigt mål, såfremt der findes et "naturligt" nulpunkt (forventningsværdien ændres jo ved en nulpunk-tsforskydning).

Sandsynlighedsmål på den positive halvakse kan foruden ved de sædvanlige beliggen-hedsmål og spredningsmål også beskrives ved de såkaldte geometriske mål, nemlig geometrisk middelværdi og geometrisk standardafvigelse. For en stokastisk vari-abel

X

, der kun antager positive værdier, defineres disse ved

g

= exp(E(log

e

X))

g

= exp(

p

V (log

e

X));

naturligvis forudsat, at forventningsværdierne eksisterer.

0.9. MOMENTER 57

Endelig defineres kovariansen mellem 2 stokastiske variable ved

Cov(X;Y ) = E(X

?

E(X))E(Y

?

E(Y ))

(0.44)

og vi har

Cov(X;Y ) = E(X

Y )

?

E(X) E(Y )

(0.45)

Hvis

X

og

Y

er uafhængige ses, at

Cov(X;Y ) = 0

.

Der gælder de vigtige regneregler

V(aX) = a

2

V (X)

(0.46)

V (X + b) = V(X)

(0.47)

V(X

Y ) =

V (X) + V(Y )

2Cov(X;Y )

V (X) + V(Y ); X

og

Y

uafhængige (0.48)

Cov((a

1

X + b

1

);(a

2

Y + b

2

)) = a

1

a

2

Cov(X;Y )

(0.49)

Ved kombination af (0.48) og (0.49) fås

V(a

1

X

1

+

+ a

n

X

n

) = a

21

V (X

1

) +

+ a

2n

V(X

n

) +2a

1

a

2

Cov(X

1

;X

2

) +

+2a

n?1

a

n

Cov(X

n?1

;X

n

)

Endelig gælder, at korrelationskoefficienten

defineres ved

(X;Y ) = Cov(X;Y )

p

V (X) V(Y )

(0.50)

Vi bemærker, atj

j

1

.

Korrelationen er et mål for den lineære sammenhæng mellem to (ikke-udartede) stokastiske variable. Kun hvis der med sandsynlighed

1

gælder en relation af formen

X + Y + = 0;

hvor

(;)

6

= (0;0)

, gælder det, atj

j

= 1

. Hvis

og

har modsat fortegn, er

= 1

,

og hvis de har samme fortegn, er

=

?

1

. I alle andre tilfælde erj

j

< 1

. Hvis

= 0

,

kaldes de variable ukorrelerede. Det skal bemærkes, at uafhængige variable altid er ukorrelerede, hvorimod det modsatte ikke nødvendigvis er tilfældet.

For en flerdimensional stokastisk variabel (skrives af notationsmæssige grunde som en søjlevektor)

Denne matrix kaldes også for kovariansmatricen eller dispersionsmatricen . Vi be-mærker, at den er symmetrisk.

Betragtes en linearkombinationaTXafX’s komponenter, kan det vises, at

V

?aTX

=

aTD

(

X

)

a

Da variansen på venstresiden altid er

0

må den kvadratiske form på højresiden også være

0

. Heraf følger umiddelbart, atD

(

X

)

må være positiv semidefinit.

0.9. MOMENTER 59

Betingede middelværdier og varianser af

X

for givet

Y

defineres som middelværdier henholdsvis varianser i de betingede fordelinger. Man anvender symbolerne

E(X

j

Y )

henholdsvis

V(X

j

Y ) = E

?

(X

?

E(X

j

Y ))

2j

Y

= E

?

X

2j

Y

?

(E(X

j

Y ))

2

:

For hver realisation af

Y

fås en realisation af

E(X

j

Y )

henholdsvis

V (X

j

Y )

, og disse

størrelser er således stokastiske variable, og der gælder følgende relationer

E(E(X

j

Y )) = E(X)

V(X) = V(E(X

j

Y )) + E(V (X

j

Y ))

Cov(X;Z) = E(Cov(X;Z

j

Y )) + Cov(E(X

j

Y );E(Z

j

Y ))

EKSEMPEL0.15. Lad

X

og

Y

være indbyrdes uafhængige stokastiske variable med sammen forventningsværdi

og varianser lig

2henholdsvis

2. Vi betragter nu den stokastiske variabel

Z = wX + (1

?

w)Y; 0

w

1

Vi finder umiddelbart

E(Z) = w + (1

?

w) = V(Z) = w

2

2

+ (1

?

w)

2

2

= g(w)

Vi ser altså, at forventningsværdien af

Z

er lig

uafhængigt af værdien af

w

. Vi vil nu bestemme den værdi af

w

, der gør variansen af

Z

så lille som mulig. Vi differentierer udtrykket med hensyn til

w

og finder

dw = 2w dg

2?

2(1

?

w)

2

= 2w(

2

+

2

)

?

2

2

Derfor er

dw = 0 dg

,

w =

2

+

2 2

De den anden afledede af

g

er negativ, er dette et minimum. Vi omskriver resultatet let og får, at variansen af

Z

er minimal for vægtene

w =

1 12

2

+

12

og

1

?

w =

1 12

2

+

12

dvs. hvis vægtene er proportionale med de reciprokke varianser.

Vi generaliserer resultatet i ovenstående eksempel til summer af flere stokastiske vari-able i

EKSEMPEL0.16. Lad

X

1

;::: ;X

n være indbyrdes uafhængige stokastiske variable med

E(X

i

) = V(X

i

) =

2i

og sæt

Z = w

1

X

1

+ ::: + w

n

X

n

; w

1

+ ::: + w

n

= 1

Da er

V(Z) = w

12

21

+ ::: + w

2n

2n

= g(w

1

;::: ;w

n

)

For at minimalisere denne under bibetingelsen

w

1

+:::+w

n

= 1

indføres en Lagrange multiplikator

, og vi får, at vi skal minimalisere

h(w

1

;::: ;w

n

;) = g(w

1

;::: ;w

n

) +

0

@ X

j

w

j?

1

1

A

0.9. MOMENTER 61

Vi differentierer og finder

dw dh

i

= 2w

i

2i

+ ; i = 1;::: ;n

Dette giver følgende udtryk for

w

i

w

i

=

1i2 Pj 12j

dvs., at vægtene

w

ier proportionale med de reciprokke varianser.

EKSEMPEL0.17 (DEN DISKRETE FORDELING PÅ

n

TAL.). Vi definerer tallene

x

1

;::: ;x

n

og definerer frekvensfunktionen givet ved

f(x

i

) = 1n

Grafen er

x j

n

x x

1 i n 2

1

x = x

I denne fordeling er middelværdien eller forventningsværdien

x = 1n

Xi=1n

x

i

dvs gennemsnittet af tallene. Betegnelsen

x

(læs: x streg) er en standardnotation for denne størrelse.

Tilsvarende bliver variansen lig

s

2

= 1n

Xi=1n

(x

i?

x)

2

Formlen

V(X) = E

?

X

2?

[E(X)]

2

bliver til

1 n

n

X

i=1

(x

i?

x)

2

= 1n

Xi=1n

x

2i ?

"

n 1

n

X

i=1

x

i

#

2

eller n

X

i=1

(x

i?

x)

2

=

Xn

i=1

x

2i ?

nx

2

0.9. MOMENTER 63

en formel, der kan være hensigtsmæssigt ved numeriske beregninger.

EKSEMPEL0.18. Lad

X

2

U(0;1)

, dvs uniformt fordelt over intervallet

[0;1]

. Da

finder vi

E(X

n

) =

1

Z

0

x

n

dx = 1 n + 1

Derfor er

E(X) = 12 V(X) = 13

?

1

4 = 1 12

Desuden finder vi, som et eksempel,

Cov

?

X

2

;X

= E

?

[X

2?

E

?

X

2

][X

?

E(X)]

= E

?

X

3?

E

?

X

2

E(X)

= 14

?

1 3

1

= 112 2

Nu er

V

?

X

2

= E

?

X

4?

[E

?

X

2

]

2

= 15

?

1 4 = 4

45

hvorfor korrelationskoefficienten mellem

X

2og

X

bliver

= 1=12

p

4=45

p

1=12 =

p

15

4

'

0:9682

ikke overraskende et højt tal.

EKSEMPEL0.19. Lad de stokastiske variable

X

og

Y

have den simultane

frekvens-funktion

Vi bestemmer først den marginale fordeling for

X

ved at integrere

Y

ud. Vi finder

h(x) =

Z 1

idet det sidste integral bliver en konstant, der er uafhængig af

x

.

Derfor finder vi, at den marginale fordeling for

X

må have frekvensfunktionen

h(x) = 1

p

2 exp(

?

1 2x

2

);

Denne fordeling vil vi senere kalde en normalfordeling med middelværdi 0 og varians 1.

Den betingede fordeling af

Y

for givet

X

bliver

g(y

j

x) = f(x;y) h(x)

Dette svarer til en normalfordeling med middelværdi

E(Y

j

X = X) = x

og varians

V(Y

j

X = x) = 1

?

2

0.9. MOMENTER 65

Havde vi i stedet betragtet

X

og

Y

med samme korrelation

, men med

E(X) =

x og

V(X) =

2x, og

E(Y ) =

yog

V (Y ) =

y2havde vi fået

E(Y

j

X = x) =

y

+

yx

(x

?

x

)

(0.51)

V(Y

j

X = x) =

2y

(1

?

2

)

(0.52)

For hvert udfald af

X

har vi en værdi af

E(Y

j

X = x)

. Det vil derfor være naturligt at skrive

E(Y

j

X) =

y

+

yx

(X

?

x

)

(0.53)

Vi finder da

E(E(Y

j

X)) =

y

+

yx

(E(X)

?

x

)

=

y

= E(Y )

Tilsvarende bliver

V(E(Y

j

X)) =

2

2y

2x

V(X)

=

2

2y

Da

E(V (Y

j

X)) =

2y

(1

?

2

)

genfinder vi relationen

V(Y ) = E(V(Y

j

X)) + V(E(Y

j

X))

Som et mål for skævheden af en fordeling anvendes ofte størrelsen (med

E(X) =

)

1

= E

?

(X

?

)

3

(V (X))

3=2

;

d.v.s. det tredie centrale moment divideret med spredningen i tredie. Det må straks bemærkes, at man ofte ser

21anført som et skævhedsmål (og da ofte under betegnelsen

1). Hvis

1

> 0

, er den højre hale i fordelingen større end den venstre. Omvendt, hvis

1

< 0

. Hvis fordelingen er symmetrisk, er

1

= 0

.

Som et mål for topstejlheden (kurtosis) af en fordeling anvendes

2

= E

?

(X

?

)

4

(V (X))

2 ?

3;

d.v.s. det fjerde centrale moment divideret med variansens kvadrat minus 3. Grunden til forekomsten af leddet?

3

er, at

2derved bliver 0 for den såkaldte normale fordeling.

Størrelsen

2bliver dermed et mål relativt til den normale fordeling.

Hvis

2er positiv, har fordelingen relativt tykke haler og dermed en spidsere top end den normale fordeling. Vi taler om en leptokurtisk fordeling. Hvis

2er negativ, har fordelingen tyndere haler og en fladere top end den normale fordeling. Vi taler om en platykurtisk fordeling. Hvis

2

= 0

, siges fordelingen at være mesokurtisk.

Vi slutter med at nævne et sidste mål for en fordelings beliggenhed, nemlig modus.

Modus er defineret som et punkt, hvor frekvensfunktionen har et lokalt maksimum.

Der er altså tale om "mest sandsynlige" værdier.

Hvis en fordeling har et modus, siges den at være unimodal. Hvis der er to, kaldes den bimodal etc.

DEFINITION0.9 (KARAKTERISTISK FUNKTION). Den karakteristiske funktion for en stokastisk variabel

X

er defineret ved

(t) = E

?

e

itX (0.54)

Ved triviel anvendelse af sætning 0.9 fås

(t) =

e

itx

f(x)dx X

kontinuert (0.55)

N

Den karakteristiske funktion kan bl.a. benyttes til at bestemme fordelingen af transfor-mationer af stokastiske variable og til at udregne momenter for stokastiske variable.

In document En Introduktion til Statistik (Sider 52-66)