X +Y
Tabel 0.10: Frekvensfunktioner for simple funktioner af to kontinuert fordelte stokastiske variable
X
ogY
med simultan frekvensfunktionf(x;y)
såvel i det generelle tilfælde som i tilfældet med uafhængigeX
ogY
. I det sidste tilfælde er frekvensfunktionerne forX
ogY f
X(x)
henholdsvisf
Y(y)
.0.9. MOMENTER 53
0.9 Momenter
DEFINITION0.7. Middelværdien eller forventningsværdien af en stokastisk vari-abel
X
med frekvensfunktionenf
er talletE(X) =
x
xf(x) X
diskret1
j
x
jf(x)dx
respektivePjx
jf(x)
eksisterer.E()
står for expectation= forventning. Det ses, at middelværdien eller forventningsværdien netop svarer til tyngdepunktet i en (masse-)fordeling. Som standardbetegnelse for middelværdien an-vendes ofte
.Forventningsværdiens betydning som mål for en fordelings placering fremgår af ne-denstående figur, hvor der er anført nogle frekvensfunktioner med forskellige mid-delværdier.
SÆTNING0.9. Lad
g
være en reel funktion afn
variable. Hvis den (flerdimensionale)stokastiske variable
(X
1;
;X
n)
har frekvensfunktionenf
, da eri henholdsvis det diskrete og det kontinuerte tilfælde.
Bevis. Vi indskrænker os til det endimensionale tilfælde med en kontinuert fordelt stokastisk variabel
X
, der transformeres af en monotont voksende funktiong
. Vi har,at frekvensfunktionen for
Y = g(X)
erh(y) = f(g
?1(y))(g
?1)
0(y)
Ved anvendelse af substitutionen
x = g
?1(y)
fås1
hvilket netop er det søgte resultat.
BEMÆRKNING0.2. Vi ser, at e.g.
X
1’s middelværdi naturligvis er den samme, hvad enten vi finder den i den marginale fordeling forX
1, eller vi beregner den ved hjælp afovenstående sætning. H
Ved hjælp af Sætning 0.9 fås umiddelbart følgende vigtige regneregler for forvent-ningsværdier
0.9. MOMENTER 55
E(a + bX) = a + bE(X)
(0.40)E(X + Y ) = E(X) + E(Y )
(0.41)E(XY ) = E(X) E(Y ); X
ogY
uafhængige (0.42)Vi skal nu indføre begrebet momenter i en fordeling.
DEFINITION0.8. Den stokastiske variabel
X
’sk
’te moment er 0k= E
?X
kDet
k
’te centrale moment er størrelsen k= E
?(X
?E(X))
k= E
?(X
?)
kN
Det andet centrale moment kaldes også variansen og er altså
V(X) = E
?(X
?E(X))
2= E
?X
2?(E(X))
2 (0.43)(Det sidste lighedstegn ses ved direkte regning). Man bemærker, at variansen svarer til inertimomentet i en massefordeling. Som standardbetegnelse for variansen anvendes ofte
2.Variansen er et mål for, hvor meget sandsynlighedsmassen er spredt ud over aksen.
Dette fremgår måske klarere, hvis man anvender skrivemåden
V(X) =
8
>
<
>
: P
i
(x
i?)
2f(x
i)
1
R
?1
(x
?)
2f(x)dx ;
idet variansens betydning som mål for den gennemsnitlige kvadrerede afvigelse fra forventningsværdien nu klarere træder frem.
I nedenstående figur er anført to frekvensfunktioner med samme forventningsværdi, men med forskellige varianser.
−50 0 5
0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4
µ
Kvadratroden af variansen kaldes spredningen eller standardafvigelsen.
Som et relativt mål for "bredden" af en sandsynlighedsfordeling anvendes ofte forholdet mellem spredningen og middelværdien
=
p
V(X) E(X) :
Denne størrelse kaldes variationskoefficienten. Den er dog kun et fornuftigt mål, såfremt der findes et "naturligt" nulpunkt (forventningsværdien ændres jo ved en nulpunk-tsforskydning).
Sandsynlighedsmål på den positive halvakse kan foruden ved de sædvanlige beliggen-hedsmål og spredningsmål også beskrives ved de såkaldte geometriske mål, nemlig geometrisk middelværdi og geometrisk standardafvigelse. For en stokastisk vari-abel
X
, der kun antager positive værdier, defineres disse ved g= exp(E(log
eX))
g= exp(
pV (log
eX));
naturligvis forudsat, at forventningsværdierne eksisterer.
0.9. MOMENTER 57
Endelig defineres kovariansen mellem 2 stokastiske variable ved
Cov(X;Y ) = E(X
?E(X))E(Y
?E(Y ))
(0.44)og vi har
Cov(X;Y ) = E(X
Y )
?E(X) E(Y )
(0.45)Hvis
X
ogY
er uafhængige ses, atCov(X;Y ) = 0
.Der gælder de vigtige regneregler
V(aX) = a
2V (X)
(0.46)V (X + b) = V(X)
(0.47)V(X
Y ) =
V (X) + V(Y )
2Cov(X;Y )
V (X) + V(Y ); X
ogY
uafhængige (0.48)Cov((a
1X + b
1);(a
2Y + b
2)) = a
1a
2Cov(X;Y )
(0.49)Ved kombination af (0.48) og (0.49) fås
V(a
1X
1+
+ a
nX
n) = a
21V (X
1) +
+ a
2nV(X
n) +2a
1a
2Cov(X
1;X
2) +
+2a
n?1a
nCov(X
n?1;X
n)
Endelig gælder, at korrelationskoefficienten
defineres ved(X;Y ) = Cov(X;Y )
pV (X) V(Y )
(0.50)Vi bemærker, atj
j1
.Korrelationen er et mål for den lineære sammenhæng mellem to (ikke-udartede) stokastiske variable. Kun hvis der med sandsynlighed
1
gælder en relation af formenX + Y + = 0;
hvor
(;)
6= (0;0)
, gælder det, atjj= 1
. Hvisoghar modsat fortegn, er= 1
,og hvis de har samme fortegn, er
=
?1
. I alle andre tilfælde erjj< 1
. Hvis= 0
,kaldes de variable ukorrelerede. Det skal bemærkes, at uafhængige variable altid er ukorrelerede, hvorimod det modsatte ikke nødvendigvis er tilfældet.
For en flerdimensional stokastisk variabel (skrives af notationsmæssige grunde som en søjlevektor)
Denne matrix kaldes også for kovariansmatricen eller dispersionsmatricen . Vi be-mærker, at den er symmetrisk.
Betragtes en linearkombinationaTXafX’s komponenter, kan det vises, at
V
?aTX=
aTD(
X)
aDa variansen på venstresiden altid er
0
må den kvadratiske form på højresiden også være0
. Heraf følger umiddelbart, atD(
X)
må være positiv semidefinit.0.9. MOMENTER 59
Betingede middelværdier og varianser af
X
for givetY
defineres som middelværdier henholdsvis varianser i de betingede fordelinger. Man anvender symbolerneE(X
jY )
henholdsvis
V(X
jY ) = E
?(X
?E(X
jY ))
2jY
= E
?X
2jY
?(E(X
jY ))
2:
For hver realisation af
Y
fås en realisation afE(X
jY )
henholdsvisV (X
jY )
, og dissestørrelser er således stokastiske variable, og der gælder følgende relationer
E(E(X
jY )) = E(X)
V(X) = V(E(X
jY )) + E(V (X
jY ))
Cov(X;Z) = E(Cov(X;Z
jY )) + Cov(E(X
jY );E(Z
jY ))
EKSEMPEL0.15. Lad
X
ogY
være indbyrdes uafhængige stokastiske variable med sammen forventningsværdiog varianser lig2henholdsvis2. Vi betragter nu den stokastiske variabelZ = wX + (1
?w)Y; 0
w
1
Vi finder umiddelbart
E(Z) = w + (1
?w) = V(Z) = w
22+ (1
?w)
22= g(w)
Vi ser altså, at forventningsværdien af
Z
er liguafhængigt af værdien afw
. Vi vil nu bestemme den værdi afw
, der gør variansen afZ
så lille som mulig. Vi differentierer udtrykket med hensyn tilw
og finderdw = 2w dg
2?2(1
?w)
2= 2w(
2+
2)
?2
2Derfor er
dw = 0 dg
,w =
2+
2 2De den anden afledede af
g
er negativ, er dette et minimum. Vi omskriver resultatet let og får, at variansen afZ
er minimal for vægtenew =
1 122
+
12og
1
?w =
1 122
+
12dvs. hvis vægtene er proportionale med de reciprokke varianser.
Vi generaliserer resultatet i ovenstående eksempel til summer af flere stokastiske vari-able i
EKSEMPEL0.16. Lad
X
1;::: ;X
n være indbyrdes uafhængige stokastiske variable medE(X
i) = V(X
i) =
2iog sæt
Z = w
1X
1+ ::: + w
nX
n; w
1+ ::: + w
n= 1
Da er
V(Z) = w
1221+ ::: + w
2n2n= g(w
1;::: ;w
n)
For at minimalisere denne under bibetingelsen
w
1+:::+w
n= 1
indføres en Lagrange multiplikator, og vi får, at vi skal minimalisereh(w
1;::: ;w
n;) = g(w
1;::: ;w
n) +
0
@ X
j
w
j?1
1
A
0.9. MOMENTER 61
Vi differentierer og finder
dw dh
i= 2w
i2i+ ; i = 1;::: ;n
Dette giver følgende udtryk for
w
iw
i=
1i2 Pj 12j
dvs., at vægtene
w
ier proportionale med de reciprokke varianser.EKSEMPEL0.17 (DEN DISKRETE FORDELING PÅ
n
TAL.). Vi definerer tallenex
1;::: ;x
nog definerer frekvensfunktionen givet ved
f(x
i) = 1n
Grafen er
x j
n
x x
1 i n 2
1
x = x
I denne fordeling er middelværdien eller forventningsværdien
x = 1n
Xi=1nx
idvs gennemsnittet af tallene. Betegnelsen
x
(læs: x streg) er en standardnotation for denne størrelse.Tilsvarende bliver variansen lig
s
2= 1n
Xi=1n(x
i?x)
2Formlen
V(X) = E
?X
2?[E(X)]
2bliver til
1 n
n
X
i=1
(x
i?x)
2= 1n
Xi=1nx
2i ?"
n 1
n
X
i=1
x
i#
2
eller n
X
i=1
(x
i?x)
2=
Xni=1
x
2i ?nx
20.9. MOMENTER 63
en formel, der kan være hensigtsmæssigt ved numeriske beregninger.
EKSEMPEL0.18. Lad
X
2U(0;1)
, dvs uniformt fordelt over intervallet[0;1]
. Dafinder vi
E(X
n) =
1
Z
0
x
ndx = 1 n + 1
Derfor er
E(X) = 12 V(X) = 13
?1
4 = 1 12
Desuden finder vi, som et eksempel,
Cov
?X
2;X
= E
?[X
2?E
?X
2][X
?E(X)]
= E
?X
3?E
?X
2E(X)
= 14
?1 3
1
= 112 2
Nu er
V
?X
2= E
?X
4?[E
?X
2]
2= 15
?1 4 = 4
45
hvorfor korrelationskoefficienten mellem
X
2ogX
bliver= 1=12
p
4=45
p1=12 =
p
15
4
'0:9682
ikke overraskende et højt tal.
EKSEMPEL0.19. Lad de stokastiske variable
X
ogY
have den simultanefrekvens-funktion
Vi bestemmer først den marginale fordeling for
X
ved at integrereY
ud. Vi finderh(x) =
Z 1idet det sidste integral bliver en konstant, der er uafhængig af
x
.Derfor finder vi, at den marginale fordeling for
X
må have frekvensfunktionenh(x) = 1
p2 exp(
?1 2x
2);
Denne fordeling vil vi senere kalde en normalfordeling med middelværdi 0 og varians 1.
Den betingede fordeling af
Y
for givetX
bliverg(y
jx) = f(x;y) h(x)
Dette svarer til en normalfordeling med middelværdi
E(Y
jX = X) = x
og varians
V(Y
jX = x) = 1
?20.9. MOMENTER 65
Havde vi i stedet betragtet
X
ogY
med samme korrelation, men medE(X) =
x ogV(X) =
2x, ogE(Y ) =
yogV (Y ) =
y2havde vi fåetE(Y
jX = x) =
y+
yx(x
?x)
(0.51)V(Y
jX = x) =
2y(1
?2)
(0.52)For hvert udfald af
X
har vi en værdi afE(Y
jX = x)
. Det vil derfor være naturligt at skriveE(Y
jX) =
y+
yx(X
?x)
(0.53)Vi finder da
E(E(Y
jX)) =
y+
yx(E(X)
?x)
=
y= E(Y )
Tilsvarende bliver
V(E(Y
jX)) =
22y 2xV(X)
=
22yDa
E(V (Y
jX)) =
2y(1
?2)
genfinder vi relationen
V(Y ) = E(V(Y
jX)) + V(E(Y
jX))
Som et mål for skævheden af en fordeling anvendes ofte størrelsen (med
E(X) =
) 1= E
?
(X
?)
3(V (X))
3=2;
d.v.s. det tredie centrale moment divideret med spredningen i tredie. Det må straks bemærkes, at man ofte ser
21anført som et skævhedsmål (og da ofte under betegnelsen 1). Hvis1> 0
, er den højre hale i fordelingen større end den venstre. Omvendt, hvis1< 0
. Hvis fordelingen er symmetrisk, er1= 0
.Som et mål for topstejlheden (kurtosis) af en fordeling anvendes
2= E
?
(X
?)
4(V (X))
2 ?3;
d.v.s. det fjerde centrale moment divideret med variansens kvadrat minus 3. Grunden til forekomsten af leddet?
3
er, at2derved bliver 0 for den såkaldte normale fordeling.Størrelsen
2bliver dermed et mål relativt til den normale fordeling.Hvis
2er positiv, har fordelingen relativt tykke haler og dermed en spidsere top end den normale fordeling. Vi taler om en leptokurtisk fordeling. Hvis2er negativ, har fordelingen tyndere haler og en fladere top end den normale fordeling. Vi taler om en platykurtisk fordeling. Hvis2= 0
, siges fordelingen at være mesokurtisk.Vi slutter med at nævne et sidste mål for en fordelings beliggenhed, nemlig modus.
Modus er defineret som et punkt, hvor frekvensfunktionen har et lokalt maksimum.
Der er altså tale om "mest sandsynlige" værdier.
Hvis en fordeling har et modus, siges den at være unimodal. Hvis der er to, kaldes den bimodal etc.
DEFINITION0.9 (KARAKTERISTISK FUNKTION). Den karakteristiske funktion for en stokastisk variabel
X
er defineret ved(t) = E
?e
itX (0.54)Ved triviel anvendelse af sætning 0.9 fås
(t) =
e
itxf(x)dx X
kontinuert (0.55)N
Den karakteristiske funktion kan bl.a. benyttes til at bestemme fordelingen af transfor-mationer af stokastiske variable og til at udregne momenter for stokastiske variable.