SAK t + SAK v = SAP xt + SAP yvSAKt+ SAKv :

x

y ;

1 SAK t + 1 SAK v

;

således at

Z

= ^ x

^ y

S

^q^SAK¹ t

+

^SAK¹ v

t(M + N

4)

under

H

⁰¹. Vi kan derfor danne et test på niveau

ved at anvende det kritiske område

C

=

(x

¹¹

;

;y hm

)

z

< t(M + N

4) =

z

> t(M + N

4)

^1?

₌

:

Hvis

H

⁰¹ accepteres antages, at

^ x

^og

^ y

er estimatorer for den samme (ukendte) hældningskoefficient

= x = y

Vi kan derfor danne et bedre skøn over

(i.e. et skøn med mindre varians), nemlig

^ = SAK ^t ^ _x + SAK _v ^ _y

SAK t + SAK v = SAP ^xt + SAP _yv SAK t + SAK v :

Vi bemærker, at

^

er et vejet gennemsnit af

^ x

^og

^ y

med de reciprokke varianser som vægte. Det ses, at

^

N

;

SAK _t + SAK _v

:

Hvis vi har fået accepteret

H

⁰¹, vil vi dernæst interessere os for hypotesen

H

⁰²

:

de to linier er identiske mod alternativet, at de er forskellige.

(t, )α_x

(v)

(v, )α_y µ_x(t)

µy

Da linierne har samme hældning, er de ens, hvis deres konstantled er lig hinanden, i.e.

såfremt

x

t= y

v

eller

= ^x

y

t

v :

Dette udtrykker blot, at linierne er ens, hvis den linie

`

, der forbinder tyngdepunkterne

(t; x )

^og

(v; y )

har samme hældning

som de oprindelige linier, jfr. vedstående figur. Som skøn over

= ( x

y )=(t

v)

kan derfor anvendes

under

H

⁰². Af Sætning 1.77, side 195, følger, at

^

^og

~

er stokastisk uafhængige og uafhængig af

S

². Derfor er

under

H

⁰². Som kritisk område for et test på niveau

kan vi derfor anvende

C

=

(x

¹¹

;

;y hm

)

z

< t(M + N

4) =

z

> t(M + N

4)

^1?

=

:

Vi bemærker, at den anvendte teknik kan udvides til at omfatte sammenligning af

m

regressionslinier. I litteraturen omtales sådanne analyser ofte som kovariansanalyser.

Det skal sluttelig anføres, at hvis vi forkaster et test for

_x =

_y

, kan problemet ikke løses eksakt. Man kan finde en approksimativ løsning, men dette skal vi ikke komme ind på her. Vi henviser blot til [25, p. 573].

Vi anfører nu et illustrativt

EKSEMPEL5.8. På et laboratorium ønsker man at sammenligne et giftstof med en kendt standard for at få et indtryk af det ukendte giftstofs styrke. Man anvender føl-gende fremgangsmåde. Man fortynder giftstofferne med vand, så man opnår forskel-lige (relative) koncentrationer. Derefter indsprøjter man giftstofferne i laboratoriemus og noterer, hvor længe musene lever efter indsprøjtningen.

Ved undersøgelsen fik man følgende sammenhæng mellem (10-tals-) logaritmen til overlevelsestiden i minutter og logaritmen til 10 gange den relative koncentration. (Er-faringen har vist, at det er hensigtsmæssigt at logaritmere måleresultaterne. Det sikrer, at forudsætningerne for en lineær regressionsanalyse (tilnærmelsvis) er til stede).

log

¹⁰⁽¹⁰^relativ

log

¹⁰(overlevelsestid) koncentration) Standard Ukendt prøve

Vi indtegner disse data i et koordinatsystem og får følgende figur

0 0.2 0.4 0.6 0.8 1 0

0.5 1 1.5 2 2.5 3 3.5 4

log(10 relativ koncentration)

log(levetid)

Standard Ukendt pr.

Det ser ud til, at vi kan antage linearitetshypotesen for begge analyser. Vi udfører der-for en lineær regressionsanalyse med henblik på en senere sammenligning af regres-sionslinierne. Vi forudsætter nu - og erfaringen fra lignende forsøg underbygger dette - at ovenstående observationer kan opfattes som realisationer af uafhængige normalt fordelte stokastiske variable, der tilfredsstiller linearitetsforudsætningerne (5.9).

Vi anfører beregningerne i følgende skema

t = v y x

Værdier

0:20 0:40 0:60 0:80 1:00

2:12 1:80 1:16 0:88 0:20

2:72 2:24 1:92 1:44 s 3:00 6:16 0:72 9:04 sk 2:20 9:8944 18:6944

sp 2:744 4:464

sak 0:40 2:3053 2:3501 sap

0:952

0:960

Ved hjælp af disse værdier finder vi

sak

x = 2:3501

^?⁰

^:

⁰⁹⁶⁰

_:

⁴⁰²

= 0:0461

sak

y = 2:3053

^?⁰

^:

⁰⁹⁵²

_:

⁴⁰²

= 0:0395;

og vi får da let følgende estimatorer

^ x =

⁹

^:

⁵⁰⁴

= 1:808

^ x =

^?⁰⁰

^: _:

⁹⁶⁰⁴⁰

=

2:400

^

_x =

⁰

^:

^5?2⁰⁴⁶¹

= 0:0154

^ y =

⁶

^:

⁵¹⁶

= 1:232

^ y =

^?⁰⁰

^: _:

⁹⁵²⁴⁰

=

2:380

^ _y

=

⁰

^:

^5?2⁰³⁹⁵

= 0:0132:

Vi undersøger nu, om det kan antages, at

_x

= _y

²^{. Da}

F(3;3)

⁰

:

⁵⁰

< ^ ^ ^x _y

²²

= 1:16 < F(3;3)

⁰

:

⁷⁰

;

vil vi acceptere hypotesen

_x = _y

²på alle niveauer mindre end

30%

, hvorfor vi vil arbejde med denne antagelse i det følgende. Som et forbedret skøn over

²^{har vi da}

s

= 16(3^

^x + 3^ _y

) = 0:014266 = 0:119

:

Vi vil nu undersøge, om hældningerne kan antages at være ens. Den observerede værdi af teststørrelsen er

z

= ^ x

^ y

s

^q^sak¹t

+

^sak¹t

=

2:40 + 2:38

0:119

^q⁰

_:

²⁴⁰ ^'^?

0:075:

0:265 = t(6)

⁰

:

⁴⁰

< z

< t(6)

⁰

:

⁵⁰

= 0;

vil vi acceptere antagelsen om, at linierne har samme hældning på alle niveauer mindre end

80%

. Som skøn over den fælles hældning har vi

^ =

0:960

0:952

0:40 + 0:40 =

2:39:

Vi skal nu undersøge, om linierne kan antages at være ens. Da

t= v

^(idet

t i = v i

⁸

i

^),

kan vi ikke anvende den p. 468 beskrevne procedure. Vi har imidlertid, at

x

t= y

t

x = y :

^ x

N

x ; N

;

^ y

N

y ; N

;

S

²²

(2N

4)=(2N

4);

er stokastisk uafhængige (jfr. p. 457), er

^ x

^ y

S

_N

+ _N

¹ ²

t(6);

under antagelsen

_x = _y

^{. Da}

^ x

^ y

s

^q¹⁵

+

¹⁵

= 1:808

1:232

0:119

^q²⁵ ^'

10:8 > t(6)

⁰

:

⁹⁹⁹⁵

;

vil vi forkaste hypotesen

x = y

. Vi må altså konkludere, at de 2 regressionslin-ier er parallelle, men forskellige. I nedenstående figur har vi indtegnet de parallelle regressionslinier.

0 0.2 0.4 0.6 0.8 1

1 2 3 4

log(10 relativ koncentration)

log(levetid)_c

t1 t2

Standard Ukendt pr.

Vi vil nu opsummere de resultater, vi har fundet. Idet vi sætter logaritmen til over-levelsestiden i minutter lig

X

for det ukendte giftstof og lig

Y

for den kendte standard

og logaritmen til 10 gange den relative koncentration lig

t

, har vi fundet

E(X t )

^ x (t) = ^ x

^(t

t) = 1:808

2:39(t

0:6) E(Y _t )

^ _y (t) = ^ _y

^(t

t) = 1:232

2:39(t

0:6):

Løser vi nu ligningen

c = ^ x (t

) = ^ y (t

);

fås

^ _x

^(t

¹^?

t) = ^ y

^(t

²^?

t)

eller

t

¹^?

t

= ^ ^x

^ y

^ = 0:576

2:39 = 0:241:

Vi har altså fået, at giftene har samme styrke (d.v.s. samme overlevelsestid for musene), hvis forskellen mellem

log

¹⁰ (10 gange koncentrationerne) er (konstant lig)

0:241

Dette svarer til, at den ukendte gift skal anvendes i en koncentration, der er

10

⁰

^:

²⁴¹

= 1:74

gange større end standarden for at have samme virkning som denne. Vi kan også sige, at den ukendte gift har den relative styrke

1=1:74 = 0:57

Til sidst bemærker vi, at parallelliteten af regressionslinierne er en forudsætning for, at man kan tale om den relative styrke. Hvis regressionslinierne ikke er parallelle, er de

2 giftstoffer ikke direkte sammenlignelige.

Hermed slutter vi behandlingen af problemet med sammenligning af regressionslinier og går over til at betragte

5.2.3 Regressionsanalyse med 2 uafhængige variable

I regressionsanalysen benævnes størrelserne

t

;

;t _k

de uafhængige variable (hvor forveksling med begrebet uafhængige stokastiske variable naturligvis er udelukket). I dette afsnit vil vi generalisere modellen fra afsnit 5.2.1 med 1 observation for hver

t

-værdi til følgende.

Der er givet stokastiske variable

X i ; i = 1;

;k

svarende til de 2 "uafhængige" variable

t i

¹^og

t i

²^{, i.e.}

t _ij ; i = 1;

;k; j = 1;2:

Vi antager, at

X i

^’erne

1. er stokastisk uafhængige 2. er normalt fordelte 3. har samme varians

²^.

Endvidere forudsætter vi, at der er givet nogle størrelser

¹^og

²således, at mid-delværdien af de stokastiske variable

X _i

^er

E(X _i ) = _i = +

(t _i

¹^?

t

) +

(t _i

²^?

t

);

^(5.11)

hvor

t j = 1k

_i

^k

t ij j = 1;2:

Sætter vi

har vi følgende analog til sætning 5.9.

SÆTNING5.11. Maximum likelihood estimatorerne for parametrene i relationen (5.11) er givet ved

Bevis. Sætningen følger ved direkte regning.

BEMÆRKNING5.8. Ligningssystemet (5.12) som kaldes normalligningerne, kan ikke altid løses. Der er netop 1 løsning, hvis determinanten

D _t

_t

= SAK _t

SAK _t

²^?

(SAP _t

_t

)

er forskellig fra 0. ^H

Hvis man er interesseret i at undersøge, om

=

= 0

, kan man ved en spaltning af den totale variation komme frem til følgende variansanalyseskema

In document En Introduktion til Statistik (Sider 173-181)

SAK t + SAK v = SAP xt + SAP yvSAKt+ SAKv :

x

y ;

1

SAK t + 1 SAK v

;

Z

= ^ x

^ y

S

+

t(M + N

4)

H

C

=

(x

;

;y hm

)

z

< t(M + N

4) =

z

> t(M + N

4)

=

:

H

^ x

^ y

= x = y

^ = SAK t ^ x + SAK v ^ y