7 HYPOTESETESTNING (2 NORMALFORDELTE VARIABLE)
7.2 Sammenligning af 2 normalfordelte variable
Eksempel 7.1. Sammenligning af 2 normalfordelte variable
To produktionsmetoder M1 og M2 ønskes sammenlignet. Der udvælges tilfældigt 20 personer, hvoraf de 10 bliver sat til at arbejde med den ene metode, og de 10 andre med den anden.
Efter 2 ugers forløb, beregnede man for hver person det gennemsnitlige tidsforbrug pr. enhed.
Da metode 1 er mere kostbar end metode 2, ønsker man kun at gå over til den, hvis tidsforbruget pr. enhed ved metode 1 er mindst 2 minutter mindre end ved metode 2.
Man fik følgende resultater.
M1 87.8 91.9 89.8 89.0 92.6 89.4 91.4 88.7 90.1 92.4 M2 92.4 94.6 93.0 94.0 92.4 92.9 96.4 92.1 92.8 94.6
1) Undersøg på basis af disse resultater, om det på et signifikansniveau på 5% kan påvises at tidsforbruget ved metode M1 er 2 minutter mindre end ved metode M2
2) Hvis dette kan påvises, skal der angives et 95% konfidensinterval for differensen i tidsforbrug.
Løsning:
1) Lad X1 = udbyttet ved anvendelse af metode M1 og X2 = udbyttet ved anvendelse af metode M2.
X1 og X2 antages approksimativt normalfordelte med middelværdi og spredning henholdsvis
µ σ
1,
1og µ σ
2,
2.Begrundelse: Nulhypotesen udtrykker jo, at intet er ændret (nul virk-H0:µ2−µ1 =2
ning), så den angiver, at differensen i middeltidsforbruget er præcist 2.
Begrundelse: Den alternative metode udtrykker jo det vi ønsker at bevise, H:µ2 −µ1 >2
så den angiver, at differensen i middeltidsforbruget er større end 2.
Såvel TI89 som Excel anvender et færdigt program, der anvender en testmetode (Satterthwaites metode), som er robust overfor mindre afvigelser fra kravet om normalitet, når blot antallet af gentagelser er (næsten) den samme.
Er det ikke tilfældet kan man stadig foretage testen, men så stilles der større krav til, at de variable X1 og X2
virkelig er normalfordelte.
Formlen for Satterthwaites metode kan findes i oversigt 7.3.
Når regnemidlerne anvendes, omskrives hypoteserne til H0:µ1 +2= µ2 H:µ1+2<µ2
TI89: APPS, STAT/LIST , indtast data i list1 og list 2 F6, 4: 2 - SampTtest ENTER I den fremkomne menu vælg Data ok
I menu for “list 1" skrives list1+2, for “alternative Hyp”µ1 <µ2 og pooled til “NO” OK
Man får P-værdi = 0.0464.
TI-Nspire: Lister og regneark Udfyld lister med overskrift m1 og m2 Statistik statistiske tests t-interval for 2 variable menu:data ok menu: List1: benyt pil til at vælge “m1" og skriv +2 List 2: Vælg “m2" “alternative Hyp”µ1<µ2 samlet: nej ok
Excel: Tallene for metode 1 indtastes i A1 til A10 Tallene for metode 2 indtastes i B1 til B10
I C1 til C10 indsættes tallene fra A-kolonnen +2 (Skriv i C1 =A1+2 , og kopiere resultat ned) På værktøjslinien foroven: Tryk på fx Vælg kategorien “Statistisk” Vælg “TTEST”
Tabel udfyldes: =TTEST(C1:C10;B1:B10;1;3) P-værdi= 0,0464
Da P-værdi =4.64% < 5% forkastes H0, dvs. vi har bevist, at tidsforbruget ved metode M1 er 2
7.2 Sammenligning af 2 normalfordelte variable
2) 95% Konfidensinterval for differens
TI89: F7, 4: 2 - SampTint ENTER I den fremkomne menu vælg Data ok I menu for “list 1" skrives blot list2, osv. poole til “No” OK
Differensen er 3.21 og 95% konfidensinterval for differensen er [1.77 ; 4.64]
TI-Nspire: Lister og regneark Udfyld lister med overskrift m1 og m2 Statistik konfidensintervaller t-interval for 2 variable menu:data ok menu: List1: benyt pil til at vælge “m2" List 2: Vælg “m1" samlet: nej ok
Excel:
Excel har intet program til beregning af konfidensinterval, så man må benytte formlen
: , hvor
og frihedsgradstallet f er det nærmeste hele tal der er større end g c s
1 87.8 92.4 xA streg= MIDDEL(A1:A10) 90,31
2 91.9 94.6 xB streg= MIDDEL(B1:B10) 93,52
3 98.8 93 vA= VARIANS(A1:A10) 2,785444
4 89 94 VB= VARIANS(B1:B10) 1,839556
5 92.6 92.4 n1= 10
6 89.4 92.9 n2= 10
7 91.4 96.4 c= E3/E5+E4/E6 0,4625
8 88.7 92.1 f= AFRUND.LOFT(E7^2/((E3/E5)^2/(E5-1)+(E4/E6)^2/(E6-1));1) 18
9 90.1 92.8 Differens E2-E1 3,21
10 92.4 94.6 Nedre grænse E2-E1-TINV(0,05;E8) * KVROD(E3/E5+E4/E6) 1,781219
11 Øvre grænse E2-E1+TINV(0,05;E8) * KVROD(E3/E5+E4/E6) 4,638781
Differensen er 3.21 og 95% konfidensinterval for differensen er [1.77 ; 4.64]
Gemmes ovenstående excelfil, kan man nu hurtigt finde konfidensinterval for andre data.
Eksempel 7.2. Sammenligning af 2 normalfordelte variable (oprindelige data ikke givet) Et luftfartsselskab A hævder, at dets fly til USA i gennemsnit afgår mere præcist end et konkur-rerende luftfartsselskab.
En forbrugergruppe undersøger denne påstand ved i en given periode at bestemme forsinkelserne for samtlige flyafgange til USA for hver af de to selskaber.
Man fandt følgende tal:
Luftfartsselskab Antal afgange x s
A 100 55 minutter 30 minutter
B 80 60 minutter 35 minutter
Støtter undersøgelsen luftfartsselskab A's påstand?
7. Hypotesetest 2 variable
Løsning:
XA = forsinkelsen i minutter for luftfartselskab A.
XB =forsinkelsen i minutter for luftfartselskab B.
XA og XB antages approksimativt normalfordelte med middelværdi og spredning henholdsvis µA,σA og µB,σB.
Da vi ønsker at vise, at A er mere præcise end B, så haves:
H0:µA =µB H:µA <µB
TI89 t - test: APPS STAT/LIST F6, 4 2 - SampTtest ENTER
I den fremkomne menu vælg STATS OK (da oprindelige data ikke er kendt) Menuen udfyldes bl.a. “alternative Hyp”µ1 <µ2 og poole til “No” OK
P-værdi = 0.156
Konklusion: Da P-værdi > 0.05 accepteres H0 , dvs.
vi kan ikke vise, at A er mere præcis end B.
TI-Nspire: Lister og regneark Statistik Statistiske test t-interval for 2 variable menu:Statistik ok udfyld menu “alternative Hyp”µ1<µ2 samlet: nej ok
Excel har intet program til beregning af P-værdi, så man må benytte formlen fra oversigt 7.3 , hvor P-værdi = P(T < t)
og frihedsgradstallet f er det nærmeste hele tal der er større end g c s
3 XA =forsinkelsen for luftfartselskab A XA er normalfordelt med middelværdi µA 4 XB =forsinkelsen for luftfartselskab A XB er normalfordelt med middelværdi µB 5 H0: µA =µB H: µA < µB
6 Data Beregning
7 nA = 100 a= B9^2/B7 9
8 x-streg-A= 55 b= B12^2/B10 15,3125
9 sA = 30 c= E7+E8 24,3125
10 nB = 80 t= (B8-B11-B13)/KVROD(E9) -1,01404
11 x-streg-B= 60 g= E9^2/(E7^2/(B7-1)+E8^2/(B10-1)) 156,1194
12 sB = 35 f = RUND.OP(E11;0) 157
13 d= 0 P-værdi= TFORDELING(ABS(E10);E12;1) 0,156062 14 Konklusion: Da p -værdi > 0.05 accepteres H0, dvs.
15 det kan ikke på dette grundlag vises, at A er mere præcis end B
7.2 Sammenligning af 2 normalfordelte variable
Parvise observationer
Parvise observationer (Matched pairs samples) kan anvendes, hvis det har mening at sammen ligne observationerne to og to (i par)
Som et eksempel herpå vil vi igen betragte problemstillingen i eksempel 7.1, men nu antage, at forsøget er foretaget på en anden måde.
Eksempel 7.3. Parvise observationer
To produktionsmetoder M1 og M2 ønskes sammenlignet. Der udvælges tilfældigt 10 personer.
Efter lodtrækning bliver 5 personer sat til først i 2 uger, at arbejde med produktionsmetode M1 og derefter i de næste 2 uger med produktionsmetode M2.
De øvrige 5 personer arbejder omvendt først med metode M2 og derefter med metode M1.
Efter 2 ugers forløb, beregnede man for hver person det gennemsnitlige tidsforbrug pr. enhed.
Da metode 1 er mere kostbar end metode 2, ønsker man kun at gå over til den, hvis tidsforbruget pr. enhed ved metode 1 er mindst 2 minutter mindre end ved metode 2.
Man fik følgende resultater.
Person nr. 1 2 3 4 5 6 7 8 9 10
M1 87.8 91.9 89.8 89.0 92.6 89.4 91.4 88.7 90.1 92.4
M2 92.4 94.6 93.0 94.0 92.4 92.9 96.4 92.1 92.8 94.6
1) Undersøg på basis af disse resultater, om det på et signifikansniveau på 5% kan påvises at tidsforbruget ved metode M1 er 2 minutter mindre end ved metode M2
2) Angiv endvidere et 95% konfidensinterval for differensen mellem de to middeludbytter.
Forklaring på metode:
Da en forsøgsperson kan være hurtig og en anden langsom (person 1 er således hurtigere end person 2) kan spredningen på M1 og M2 være så stor, at man intet kan vise.
Hvis man i stedet tager differenserne M2 - M1 vil disse forskelle jo udjævnes, da person 1 jo er hurtig under arbejdet med begge metoder, mens person 2 er langsom ved begge.
Person nr. 1 2 3 4 5 6 7 8 9 10
M1 87.8 91.9 89.8 89.0 92.6 89.4 91.4 88.7 90,1 92,4
M2 92.4 94.6 93.0 94.0 92.4 92.9 96.4 92.1 92,8 94,6
D = M2 - M1 4.6 2.7 3.2 5 -0.2 3.5 5 3.4 2,7 2,2
I stedet for at benytte metoden i eksempel 7.1 kan vi nu teste nulhypotesen mod ved metoden i eksempel 6.2 (en variabel) H0:D=2 H D: >2
Løsning:
1) D = forskellen i tidsforbruget ved metode M2 og metode M1
D antages approksimativt normalfordelt med middelværdi µ og spredning σ . H0: D = 2 H: D > 2
TI89:Data indtastes (de samme som i eksempel 7.1)
APPS STAT/LIST data indtastes i list 1 og list 2 Cursor på list 3 list2 - list 1 Enter F6 t-test menu udfyldes
P-værdi = 0.0178
TI-Nspire: Lister og regneark Udfyld lister med overskrift m1 og m2 ny liste benævnes m3 i cellen lige under højre musetast :tryk 2 gange og skriv m2 - m1 ENTER vælg på menu variabel-reference Statistik t-interval for 1 variabel menu:data ok menu udfyldes med m3
ok
7. Hypotesetest 2 variable
Excel
Tallene for metode 1 indtastes i A1 til A10 Tallene for metode 2 indtastes i B1 til B10
I C1 til C10 indsættes tallene fra A-kolonnen +2 (Skriv i C1 =A1+2 , og kopiere resultat ned) På værktøjslinien foroven: Tryk på fx Vælg kategorien “Statistisk” Vælg “TTEST”
Tabel udfyldes: =TTEST(C1:C10;B1:B10;1;1) (bemærk 1 for parvis) P-værdi= 0,017836
Konklusion: Da P-værdi < 0.05 forkastes H0, dvs.
M1 er signifikant 2 minutter lavere end M2, dvs. man vil gå over til at benytte metode M1 2) Konfidensinterval for differens:
TI89:F6 t-interval menu udfyldes
Differens = 2.31 KONFIDENSINTERVAL [2.10 ; 4.32 ]
TI-Nspire: Beregninger Statistik Konfidensintervaller t-interval for 1 variabel menu:Statisk udfyld menu bl.a. med m3 ENTER
Excel: Danner en kolonne D1 til D10 med differenserne mellem A og B kolonner.
På værktøjslinien foroven: Tryk på fx Vælg kategorien “Statistisk” Middel Excel: 2003: Funktioner 2007: Data
derefter Dataanalyse Beskrivende statistik udfyld inputområde vælg konfidensniveau
Resultat
x streg 3,21
Konfidensniveau(95,0%) 1,10896985
nedre grænse 2,1011
øvre grænse 4,3190
Oversigt 1.2