x
?y ;
21
SAK t + 1 SAK v
;
således at
Z
1= ^ x
?^ y
S
qSAK1 t+
SAK1 v2
t(M + N
?4)
under
H
01. Vi kan derfor danne et test på niveauved at anvende det kritiske områdeC
1=
(x
11;
;y hm
h)
jz
1< t(M + N
?4) =
2_
z
1> t(M + N
?4)
1?=
2:
Hvis
H
01 accepteres antages, at^ x
og^ y
er estimatorer for den samme (ukendte) hældningskoefficient= x = y
.Vi kan derfor danne et bedre skøn over
(i.e. et skøn med mindre varians), nemlig^ = SAK t ^ x + SAK v ^ y
SAK t + SAK v = SAP xt + SAP yv SAK t + SAK v :
Vi bemærker, at
^
er et vejet gennemsnit af^ x
og^ y
med de reciprokke varianser som vægte. Det ses, at^
2N
;
2SAK t + SAK v
:
Hvis vi har fået accepteret
H
01, vil vi dernæst interessere os for hypotesenH
02:
de to linier er identiske mod alternativet, at de er forskellige.(t, )αx
(v)
(v, )αy µx(t)
µy
Da linierne har samme hældning, er de ens, hvis deres konstantled er lig hinanden, i.e.
såfremt
x
?t= y
?v
eller
= x
?y
t
?v :
Dette udtrykker blot, at linierne er ens, hvis den linie
`
, der forbinder tyngdepunkterne(t; x )
og(v; y )
har samme hældning som de oprindelige linier, jfr. vedstående figur. Som skøn over= ( x
?y )=(t
?v)
kan derfor anvendesunder
H
02. Af Sætning 1.77, side 195, følger, at^
og~
er stokastisk uafhængige og uafhængig afS
2. Derfor erog
under
H
02. Som kritisk område for et test på niveaukan vi derfor anvendeC
2=
(x
11;
;y hm
h)
jz
2< t(M + N
?4) =
2_
z
2> t(M + N
?4)
1?=
2:
Vi bemærker, at den anvendte teknik kan udvides til at omfatte sammenligning af
m
regressionslinier. I litteraturen omtales sådanne analyser ofte som kovariansanalyser.
Det skal sluttelig anføres, at hvis vi forkaster et test for
2x =
2y
, kan problemet ikke løses eksakt. Man kan finde en approksimativ løsning, men dette skal vi ikke komme ind på her. Vi henviser blot til [25, p. 573].Vi anfører nu et illustrativt
EKSEMPEL5.8. På et laboratorium ønsker man at sammenligne et giftstof med en kendt standard for at få et indtryk af det ukendte giftstofs styrke. Man anvender føl-gende fremgangsmåde. Man fortynder giftstofferne med vand, så man opnår forskel-lige (relative) koncentrationer. Derefter indsprøjter man giftstofferne i laboratoriemus og noterer, hvor længe musene lever efter indsprøjtningen.
Ved undersøgelsen fik man følgende sammenhæng mellem (10-tals-) logaritmen til overlevelsestiden i minutter og logaritmen til 10 gange den relative koncentration. (Er-faringen har vist, at det er hensigtsmæssigt at logaritmere måleresultaterne. Det sikrer, at forudsætningerne for en lineær regressionsanalyse (tilnærmelsvis) er til stede).
log
10(10relativlog
10(overlevelsestid) koncentration) Standard Ukendt prøveVi indtegner disse data i et koordinatsystem og får følgende figur
0 0.2 0.4 0.6 0.8 1 0
0.5 1 1.5 2 2.5 3 3.5 4
log(10 relativ koncentration)
log(levetid)
Standard Ukendt pr.
Det ser ud til, at vi kan antage linearitetshypotesen for begge analyser. Vi udfører der-for en lineær regressionsanalyse med henblik på en senere sammenligning af regres-sionslinierne. Vi forudsætter nu - og erfaringen fra lignende forsøg underbygger dette - at ovenstående observationer kan opfattes som realisationer af uafhængige normalt fordelte stokastiske variable, der tilfredsstiller linearitetsforudsætningerne (5.9).
Vi anfører beregningerne i følgende skema
t = v y x
Værdier
0:20 0:40 0:60 0:80 1:00
2:12 1:80 1:16 0:88 0:20
2:72 2:24 1:92 1:44 s 3:00 6:16 0:72 9:04 sk 2:20 9:8944 18:6944
sp 2:744 4:464
sak 0:40 2:3053 2:3501 sap
?0:952
?0:960
Ved hjælp af disse værdier finder vi
sak
2x = 2:3501
?0:
0960:
402= 0:0461
sak
2y = 2:3053
?0:
0952:
402= 0:0395;
og vi får da let følgende estimatorer
^ x =
9:
504= 1:808
^ x =
?00: :
96040=
?2:400
^
2x =
0:
5?20461= 0:0154
^ y =
6:
516= 1:232
^ y =
?00: :
95240=
?2:380
^ y
2=
0:
5?20395= 0:0132:
Vi undersøger nu, om det kan antages, at
x
2= y
2. DaF(3;3)
0:
50< ^ ^ x y
22= 1:16 < F(3;3)
0:
70;
vil vi acceptere hypotesen
2x = y
2på alle niveauer mindre end30%
, hvorfor vi vil arbejde med denne antagelse i det følgende. Som et forbedret skøn over2har vi das
2= 16(3^
2x + 3^ y
2) = 0:014266 = 0:119
2:
Vi vil nu undersøge, om hældningerne kan antages at være ens. Den observerede værdi af teststørrelsen er
z
1= ^ x
?^ y
s
qsak1t+
sak1t=
?2:40 + 2:38
0:119
q0:
240 '?0:075:
Da
?
0:265 = t(6)
0:
40< z
1< t(6)
0:
50= 0;
vil vi acceptere antagelsen om, at linierne har samme hældning på alle niveauer mindre end
80%
. Som skøn over den fælles hældning har vi^ =
?0:960
?0:952
0:40 + 0:40 =
?2:39:
Vi skal nu undersøge, om linierne kan antages at være ens. Da
t= v
(idett i = v i
8i
),kan vi ikke anvende den p. 468 beskrevne procedure. Vi har imidlertid, at
x
?t= y
?t
,x = y :
Da
^ x
2N
x ; N
2
;
^ y
2N
y ; N
2
;
og
S
2222(2N
?4)=(2N
?4);
er stokastisk uafhængige (jfr. p. 457), er
^ x
?^ y
S
qN
1+ N
1 2t(6);
under antagelsen
x = y
. Da^ x
?^ y
s
q15+
15= 1:808
?1:232
0:119
q25 '10:8 > t(6)
0:
9995;
vil vi forkaste hypotesen
x = y
. Vi må altså konkludere, at de 2 regressionslin-ier er parallelle, men forskellige. I nedenstående figur har vi indtegnet de parallelle regressionslinier.0 0.2 0.4 0.6 0.8 1
1 2 3 4
log(10 relativ koncentration)
log(levetid)c
t1 t2
Standard Ukendt pr.
Vi vil nu opsummere de resultater, vi har fundet. Idet vi sætter logaritmen til over-levelsestiden i minutter lig
X
for det ukendte giftstof og ligY
for den kendte standardog logaritmen til 10 gange den relative koncentration lig
t
, har vi fundetE(X t )
'^ x (t) = ^ x
?^(t
?t) = 1:808
?2:39(t
?0:6) E(Y t )
'^ y (t) = ^ y
?^(t
?t) = 1:232
?2:39(t
?0:6):
Løser vi nu ligningen
c = ^ x (t
1) = ^ y (t
2);
fås
^ x
?^(t
1?t) = ^ y
?^(t
2?t)
eller
t
1?t
2= ^ x
?^ y
^ = 0:576
2:39 = 0:241:
Vi har altså fået, at giftene har samme styrke (d.v.s. samme overlevelsestid for musene), hvis forskellen mellem
log
10 (10 gange koncentrationerne) er (konstant lig)0:241
.Dette svarer til, at den ukendte gift skal anvendes i en koncentration, der er
10
0:
241= 1:74
gange større end standarden for at have samme virkning som denne. Vi kan også sige, at den ukendte gift har den relative styrke
1=1:74 = 0:57
.Til sidst bemærker vi, at parallelliteten af regressionslinierne er en forudsætning for, at man kan tale om den relative styrke. Hvis regressionslinierne ikke er parallelle, er de
2 giftstoffer ikke direkte sammenlignelige.
Hermed slutter vi behandlingen af problemet med sammenligning af regressionslinier og går over til at betragte
5.2.3 Regressionsanalyse med 2 uafhængige variable
I regressionsanalysen benævnes størrelserne
t
1;
;t k
de uafhængige variable (hvor forveksling med begrebet uafhængige stokastiske variable naturligvis er udelukket). I dette afsnit vil vi generalisere modellen fra afsnit 5.2.1 med 1 observation for hvert
-værdi til følgende.Der er givet stokastiske variable
X i ; i = 1;
;k
svarende til de 2 "uafhængige" variable
t i
1ogt i
2, i.e.t ij ; i = 1;
;k; j = 1;2:
Vi antager, at
X i
’erne1. er stokastisk uafhængige 2. er normalt fordelte 3. har samme varians
2.Endvidere forudsætter vi, at der er givet nogle størrelser
,1og2således, at mid-delværdien af de stokastiske variableX i
erE(X i ) = i = +
1(t i
1?t
1) +
2(t i
2?t
2);
(5.11)hvor
t j = 1k
Xi
=1k
t ij j = 1;2:
Sætter vi
har vi følgende analog til sætning 5.9.
SÆTNING5.11. Maximum likelihood estimatorerne for parametrene i relationen (5.11) er givet ved
Bevis. Sætningen følger ved direkte regning.
BEMÆRKNING5.8. Ligningssystemet (5.12) som kaldes normalligningerne, kan ikke altid løses. Der er netop 1 løsning, hvis determinanten
D t
1t
2= SAK t
1SAK t
2?(SAP t
1t
2)
2er forskellig fra 0. H
Hvis man er interesseret i at undersøge, om
1