• Ingen resultater fundet

Linearkombination

In document STATISTISKE GRUNDBEGREBER (Sider 127-149)

11 FLERDIMENSIONAL STATISTISK VARIABEL

11.3 Linearkombination

Eksempel 11.2. Kovarians. Korrelationskoefficient.

Vi betragter igen den 2-dimensionale fordeling fra eksempel 11.1.

a5) Find kovariansen og korrelationskoefficienten.

b2) Benyt stikprøven til at finde estimater for kovariansen og korrelationskoefficienten.

LØSNING:

a5) Idet vi i eksempel 11.1 har fundet µ1=11. ,µ2 =12. , σ = 0 69. og σ = 0 96. , finder vi nu kovariansen og korrelationskoefficienten :

V X( 1,X2) ρ(X1,X2)

Det ses, at estimaterne har en vis lighed med de eksakte værdier i spørgsmål a5).

11.3 LINEARKOMBINATION

Vi bruger ofte stikprøven til at danne gennemsnittet X X X X

n nX

Ved en linearkombination L for en k-dimensional stokastisk variabel forstås et udtryk af r

X =(X1,X2,...,Xk) formen

, hvor er konstanter.

L= a0+a X1 1+a X2 2+...+a Xk k a a a0, 2, 3,...,ak For middelværdien af L giver linearitetsreglen:

E L( )=a0+a E X1 ( 1)+a E X2 ( 2) ...+ +a E Xk ( k).

For variansen af en linearkombination L gælder kvadratreglen:

V L a V X a V X ak V Xk a a V Xi j i Xj

Flerdimensional stokastisk variabel

c) V X (X’erne statistisk uafhængige)

n V X stikprøvestørrelsen n. For at få et gennemsnit med en 10 gange mindre spredning, skal stikprøven altså gøres 100 gange større!

Bevis for kvadratreglen. Vi finder

( )

( )

Eksempel 11.3. Linearkombination af stokastiske variable.

Et levnedsmiddel leveres i poser. Lad X1 og X2 [mg/kg] betegne koncentrationerne af to stoffer A og B i en

Opgaver til kapitel 11

OPGAVER

Opgave 11.1.1 (2-dimensional stokastisk variabel)

Et spil i et casino går ud på at trække en tilfældig seddel fra en urne (og lægge sedlen tilbage igen). Urnen indeholder 10 sedler, og på hver seddel står 2 tal (X1,X2):

(1,0) (3,0) (4,0)

(1,0) (3,3) (4,3)

(1,3) (4,3)

(1,3) (1,3)

a1) Find den 2-dimensionale tæthedsfunktionf x x( 1, 2):

a2) Find de 1-dimensionale tæthedsfunktioner f x1( 1)og f2(x2). a3) Er X1 og X2 statistisk uafhængige ?

a4) Find middelværdierne µ1= E X( 1)og µ2 = E X( 2)samt spredningerne σ1(X1) og σ2(X2). a5) Find middelværdien E X

(

1 X2

)

.

2

b) Antag, at man i stedet kender en stikprøve på (X1,X2):

(1,3), (1,0), (1,0), (4,3), (3,0), (4,3), (1,0), (3,0), (3,3 ), (1,3).

b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a4).

Opgave 11.1.2 (kovarians, korrelationskoefficient)

a6) Find kovariansen V X( 1,X2) og korrelationskoefficienten ρ(X1,X2). b2) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a6).

Opgave 11.1.3 (linearkombination)

For det i opgave 11.1.1 og 11.1.2 omtalte casino aftales et spil, hvor gevinsten er G= 20 10+ X1+5X2.

a7) Find gevinstens middelværdi E G( ) og spredningσ( )G .

b3) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a7).

Opgave 11.2.1 (2-dimensional stokastisk variabel)

Under en produktion kan der optræde fejl. Lad (X1,X2)=( Antal gange der optræder fejl af type 1, Antal gange der optræder fejl af type 2) i en tilfældig produktion. VariablenX1 kan antage værdierne 0, 1 og 2, mensX2 kun kan antage værdierne 0 og 1.

a) Antag, at man teoretisk kender tæthedsfunktionenf x x( 1, 2):

f x x( 1, 2) x1

0 1 2

x2 0 0.3 0.1 0.1

1 0.1 0.2 0.2

a1) Find de 1-dimensionale tæthedsfunktioner f x1( 1)og f2(x2). a2) Er X1 og X2 statistisk uafhængige ?

a3) Find middelværdierne µ1= E X( 1)og µ2 = E X( 2)samt spredningerne σ1(X1) og σ2(X2). a4) Find middelværdien E

(

X1+ X2

)

.

b) Antag, at man i stedet kender en stikprøve på (X1,X2):

(0,1), (0,0), (1,1), (1,1), (0,0), (0,0), (0,1), (2,1), (0,0 ), (2,1).

b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a3).

Opgave 11.2.2 (kovarians, korrelationskoefficient) Vi betragter igen produktionsprocessen fra opgave 11.2.1.

a5) Find kovariansen V X( 1,X2) og korrelationskoefficienten ρ(X1,X2). b2) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a5).

Flerdimensional stokastisk variabel Opgave 11.2.3 (linearkombination)

For den i opgave 11.2.1 og 11.2.2 omtalte produktionsproces er fortjenesten F= 200003000X14000X2.

a6) Find fortjenestens middelværdi E F( ) og spredning σ( )F .

b3) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a6).

Opgave 11.3.1 (2-dimensional stokastisk variabel)

År 4001. En sonde er vendt hjem med oplysninger om individer på en fremmed planet. De kan have 2, 4 eller 6 øjne, og 2 eller 4 ører. Lad (X1,X2)= (Antal øjne, Antal ører) for et tilfældigt udtaget individ på planeten.

a) Professor Cosmussen har teoretisk opstillet tæthedsfunktionenf x x( 1, 2): a4) Find middelværdien E .

X X

b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a3).

Opgave 11.3.2 (kovarians, korrelationskoefficient) Vi betragter igen individerne fra opgave 11.2.1.

a5) Find kovariansen V X( 1,X2) og korrelationskoefficienten ρ(X1,X2). b2) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a5).

Opgave 11.3.3 (linearkombination)

For de i opgave 11.3.1 og 11.3.2 omtalte individer har professor Cosmussen opstillet en formel for deres masse:

kg.

M = 200+20X1+10X2

a6) Find massens middelværdi E M( ) og spredning σ(M).

b3) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a6).

Opgave 11.4.1 (2-dimensional stokastisk variabel)

Lad (X1,X2)= ( Højde [cm], Masse [kg] ) af en tilfældigt udtaget studerende på 3. halvår.

Vi betragter igen de i opgave 11.4.1 og 11.4.2 omtalte studerende. En frugtavler har opstillet en formel for den timeløn, han vil give dem som frugtplukkere:

kroner/time.

L=100+0 3. X10 2. X2

Opgaver til kapitel 11 Opgave 11.5 (poolet estimat)

Koncentrationen af et stof A blev målt i 3 partier råvarer:

Råvare 1: 56, 60, 54, 49, 61 Råvare 2: 78, 73, 80

Råvare 3: 66, 62, 70, 72, 60

Det antages, at der er samme spredning i de 3 tilfælde. Find et estimat spool for spredningenσ. Opgave 11.6 (poolet estimat)

Koncentrationen af et stof A blev målt i 2 levnedsmidler:

Levnedsmiddel 1: 87, 89, 94, 86, 89, 95 Levnedsmiddel 2: 93, 99, 94, 91, 98 . Det antages, at der er samme spredning i de 2 tilfælde. Find et estimat spool for spredningen σ. Opgave 11.7 (poolet estimat)

Koncentrationen af et stof A blev målt i mælken fra 5 køer:

Ko 1: 44, 48, 46, 43, 45 Ko 2: 40, 38, 41 Ko 3: 43, 45, 42, 42 Ko 4: 36, 32 Ko 5: 50

Det antages, at der er samme spredning i de 5 tilfælde. Find et estimat spool for spredningen σ.

Statistiske beregninger på lommeregner og PC-er

STATISTISKE BEREGNINGER PÅ LOMMEREGNER TI89 SAMT PÅ PC-PROGRAMMERNE TI-Nspire, EXCEL, MAPLE OG MATHCAD

TI 89

1) Generelt:

Beregning af sandsynlighedsfordelinger:

Metode 1 Vælg HOME\ CATALOG,, F3\ vælg den ønskede fordeling\ENTER

(tryk evt på “forbogstav” for hurtigt at komme til det ønskede navn).

Fordel: Hurtig ved beregning af sandsynligheder, såsom P(X < 0.87) da resultatet straks indsættes på HOME-linien.

Ulempe: Man skal huske parametrenes rækkefølge (de kan dog ses nederst på skærmen) Metode 2: Vælg APPS\ Stats/List\F5\vælg den ønskede fordeling\ENTER

Fordel: Der fremkommer nu en menu, som er næsten selvforklarende.

Ulempe:Skal resultatet ned på HOME-linien (man vil regne videre), bliver det lidt besværligt:

HOME, Var-Link\I StatsVar mappen markeres den ønskede størrelse, ENTER

Tal indlagt på liste Vælg APPS\ Stats/List\ indtast data i eksempelvis “list1"

Fordele og ulemper som under metode 2 ovenfor

Beregning af gennemsnit , spredning , middelværdi osv.

1) Hvis tal indlagt på liste 1

F4\ 1: 1-Var Stats , I menu sættes “List” til “List1" (Benyt evt. Var-Link til at finde List1) Udskriften består af en række statistiske størrelser.

2) Anvendes med få tal og kun ønsker beregning af en enkelt størrelse.

HOME\ MATH\6.Statistics\

Gennemsnit: Mean ({liste}) , Varians: Variance({liste}), Spredning: stdDev({liste}) Beregning af test

1) Hvis tal indlagt på liste(r)

F6\i menu vælg relevant test\ENTER\Data\ENTER\udfyld menu\ENTER

2) Oprindelige data ikke kendt, men kun middelværdi osv.

Som ovenfor, men nu vælges Stats fremfor Data

Beregning af konfidensintervaller 1) Hvis tal indlagt på liste(r)

F7\i menu vælg relevant konfidensinterval\ENTER\Data\ENTER\udfyld menu\ENTER

2) Oprindelige data ikke kendt, men kun middelværdi osv.

Som ovenfor, men nu vælges Stats fremfor Data

Oprette en “Folder”: VAR-Link\ F1\ 5: Create Folder\ Skriv navn på folder.

Vælg en mappe som den aktuelle mappe: MODE\ Current Folder\navn

Formål: Det kan være praktisk ikke at gemme alle sine resultater i MAIN.

TI89 2) Sandsynlighedsfordelinger.

Normalfordeling n(μ,σ)

a) pP a( X b), hvor a ,b,μ,σ er givne konstanter(a og b kunne evt. være 4): p = normcdf(a b, , , )  b) Find :xp P X( xp)p, hvor p, μ, σ er givne konstanter. xp=invNorm(p,μ,σ) t - fordeling. Lad T være t - fordelt med frihedsgradstallet f.

a) Find p = P(a # T # b), hvor a og b er givne konstanter.(a og b kunne evt. være 4): p = tCdf(a,b,f) b) Find t( ):f P T( t( ))f ( given konstant). t( )f invt(,f ) χ2 - fordeling. Lad Q være χ2 - fordelt med frihedsgradstallet f.

a) Find , pP a Q b(   ) hvor a og b er givne konstanter. p = chi2Cdf(a,b,f) b) Find fraktilen2( )f : P Q( 2( ))f ( given konstant). invChi2( ,f) Binomialfordeling. Lad X være binomialfordelt b(n,p)

Find P l(  Xm), hvor0   l m m n og l og m er hele tal. binomtCdf(n,p,l,m) Poissonfordeling. Lad X være Poissonfordelt p()

Find P l(  Xm), hvor0 l m og l og m er hele tal. poissCdf(,l,m) 3) Konfidensintervaller

Normalfordeling. 1 variabel

1)ukendt: F7\ 1: T-Interval (hvis oprindelige data ikke kendt så Stats ellers Data) 2) kendt: F7\ 1: Z-Interval (hvis oprindelige data ikke kendt så vælg Stats ellers Data) Normalfordeling. 2 variable

F7\ 4: 2-SampTint\ udfyld menu(se eksempel 7.1, parvis så eksempel 7.3) Binomialfordeling.

F7, 5: 1-Prop-ZInt (Kræver der kan approksimeres til normalfordeling) Poissonfordeling: findes ikke, så her må formel for konfidensinterval benyttes 4) Hypotesetest

Normalfordeling. 1 variabel

1) kendt: F6\ 1: Z-Test (hvis oprindelige data ikke kendt så Stats ellers Data) 2)ukendt: F6\ 1: T-Test (hvis oprindelige data ikke kendt så Stats ellers Data) Normalfordeling. 2 variable

F6\ 4: 2-SampTtest\ udfyld menu (se eksempel 7.1 eller 7.3) Binomialfordeling.

F7, 5: 1-Prop-ZTest (Kræver der kan approksimeres til normalfordeling) Poissonfordeling: findes ikke, så her må formel for konfidensinterval benyttes

Statistiske beregninger på lommeregner og PC-er

TI-Nspire 1) Generelt:

Beregning af sandsynlighedsfordelinger:

Vælg Beregninger\Statistik\Fordelinger\ vælg den ønskede fordeling\udfyld menu\ENTER

Huskes fordelingens navn og parametrenes rækkefølge kan man skrive direkte Tal indlagt på liste Lister og regneark giv en liste et navn og indtal tal i listen Beregning af gennemsnit , spredning , middelværdi osv.

1) Hvis tal indlagt på liste

Lister og regneark giv en liste et navn og indtal tal i listen vælg statistik statistiske beregninger statistik med 1 variabel udfyld menuer Enter.

Blandt mange tal findes det ønskede

2) Anvendes med få tal og kun ønsker beregning af en enkelt størrelse.

Beregninger\statistik\listematematik\vælg

Middel: mean({liste}), Stikprøvevarians: varSamp({liste}), Standardafvigelse for stikprøve:

stDevSamp({liste})

Beregning af test 1) normal, 1 variabel

1) Lister og regneark udfyld liste (husk overskrift) Statistik t-test for 1 variabel menu:data udfyld menu ENTER

2) Oprindelige data ikke kendt, men kun middelværdi osv.

Som ovenfor, men nu vælges Stats fremfor Data

2) normal, 2 variable

1)Lister og regneark Udfyld lister med overskrift m1 og m2 Statistik t-test for 2 variable menu:data ok menu: List1: skriv m1 List 2: Skriv m2 “alternative Hyp” samlet: nej (hvis parvise observationer så ja vælg variabelreference ok

2) Oprindelige data ikke kendt, men kun middelværdi osv.

Som ovenfor, men nu vælges Stats fremfor Data

Beregning af konfidensintervaller

Som under test blot vælges nu konfidensintervaller

De konkrete beregninger af en given sandsynlighedsfordeling konfidensinterval eller test svarer til det der står under TI89

Excel

Excel

1) Generelt Forudsætninger.

Da ikke alle de anvendte statistiske funktioner er indbygget fra starten, skal man først vælge et tilføjelsesprogram:

I Excel 2003: Vælg “Funktioner”, “Tilføjelsesprogrammer”, marker “Problemløser”

I Excel 2007: Vælg “Excel-Office-knappen”, “Excel indstillinger (findes forneden)”, Tilføjelsesprogrammer”,

”Udfør”, ”marker Analysis toolpak, Analysis toolpak VBA, Problemløser”, “Installer”.

Inddata.

Vi vil i det følgende for kortheds skyld antage, at den første stikprøves værdier står i cellerne A1, A2, A3 . . . A10.

Kræves der flere variable vil den næste stå i cellerne B1, B2, B3 . . . B8, osv.

Man angiver “udskriftsområdet” eller “inputområdet” f.eks en søjle placere i cellerne A1:A10 ved a) at markere området A1 til A10

b) at skrive eksempelvis A1:A10

c) at give det et navn: Vælg “Indsæt” i Excel 2003: Navn i Excel 2007:Formler Definer i menu skriv søjlens navn og (nederst)A1:A10

Skrive , beregne og kopiere formler.

Vælg den celle hvor resultatet skal stå. Lad det være B1: På værktøjslinien foroven skriv = formel skrives ENTER Resultatet står nu i celle B1

Hvis selve formlen skal stå i en anden celle. Lad det være A1: Cursor placeres i B1 I formelfelt markeres formlen uden lighedstegn og man kopierer den (CTRL C)” ENTER (så formlen igen er beregnet i B1 Cursor over i A1 og paste (CTRL V)

Udskrive gitterlinier og række og kolonneoverskrifter

Excel 2003: Vælg Filer Sideopsætning Ark Marker gitterlinier marker række- og kolonneoverskrifter.

Excel 2007: Vælg Sidelayout Under“Gitterlinier” marker “Udskriv” Under “Overskrifter” marker “Udskriv”

2: Indsætte og tegne diagrammer Lagkage eller søjle: se eksempel 2.1 side 2 Kurve: se eksempel 2.4 side 4

Tegne histogram: se eksempel 2.5 side 6 3: Beregne statistiske størrelser og funktioner

Beregning af “Karakteristiske tal” (se evt. ekempel 2.9) Data indtastes i eksempelvis søjle A1 til A10

Excel 2003: Funktioner Dataanalyse Beskrivende statistik udfyld inputområde Resumestatistik Excel 2007: Data Dataanalyse Beskrivende statistik udfyld inputområde Resumestatistik Valg af statistiske størrelser (funktioner)

1) Vælg den celle hvor resultatet skal stå (eksempelvis A1).

2) På værktøjslinien foroven:

2a) Tryk på fx

2b) På den fremkommne menu vælges den ønskede funktion eksempelvis “NORMALFORDELING”

2c) Der fremkommer en menu med anvisning på, hvordan den skal udfyldes.

Gennemsnit, spredning, median, kvartil

Navnene anføres nedenunder, men den fremkomne menu gør det let at indsætte de rette parametre.

Gennemsnit = x MIDDEL(A1:A10) Spredning s = STDAFV (A1:A10)

Median m = MEDIAN(A1:A10) (= KVARTIL(A1:A10;2) ) 1. Kvartil = KVARTIL(A1:A10;1)

Statistiske beregninger på lommeregner og PC-er Fakultet, kombination, Permutation (se evt. eksempel 8.8)

Fakultet n! = FAKULTET(n) Eksempel: 5! =FAKULTET(5) = 120 Kombination K(n,p) = KOMBIN(n;p) Eksempel: K(5,3)==KOMBIN(5;3) = 10 Permutation P(n,p = PERMUT(n;p) Eksempel: P(5,3) = PERMUT(5;3) = 60 Normalfordeling.

Lad X være normalfordelt med middelværdi og spredning

1)P X( x)= NORMFORDELING(x ;; ;1) 2)P X( x)= 1 - NORMFORDELING(x ;; ;1)

3)P a(  Xb) P X( b)P X( a)NORMFORDELING(b ;; ;1) -NORMFORDELING(a ;; ;1) Fraktil : xp P X( xp) p NORMINV(p;;)

Eksempel: u0 975. = NORMINV(0,975;0;1) = 1,959961 t - fordeling. (se evt. eksempel 5.3 side 44)

Lad T være t - fordelt med f frihedsgrader..

1) P T( t)= TFORDELING(abs(t); f ;1)

(bemærk: TFORDELING(abs(t); f ;1) udregner “øvre hale” af fordelingen)

2) P T(  t)+P T( t)= TFORDELING(abs(t); f ;2) (udregner “halen” til begge sider)

Bemærk: Man må må udnytte symmetrien i t-fordelingen, for værdier mindre end 0 (svarende til < 0.5) Eksempel:

Lad T være t - fordelt med 12 frihedsgrader

1) P X(  1) =P X( 1)= TFORDELING(abs(-1);12;1) = 0,168525 2) t0 975. (12) = TINV(0,05;12) = 2,178813

= - TINV(0,05;12) = - 2,178813 t0 025. (12)

- fordeling. (se evt.eksempel 5,8 side 49)

2

Lad X være 2- fordelt med f frihedsgrader = CHIFORDELING(x;f) P X( x)

(bemærk: CHIFORDELING(x;f) udregner “øvre hale” af fordelingen) Fraktil

Hypergeometrisk fordeling (se evt. eksempel 9.2 side 91) Lad X være hypergeometrisk fordelt med parametrene N, M og n

= HYPGEOFORDELING(x ; n ; M ; N) P X(  x)

Eksempel: Lad N = 600, M = 10 og n = 25

= HYPGEOFORDELING(1;25;10;600)+HYPGEOFORDELING(0;25;10;600) = 0,938876 P X( 1)

TI - 83 Binomialfordeling ( se evt. eksempel 9.5 side 96)

Lad X være binomialfordelt med parametrene n og p

= BINOMIALFORDELING(x ; n; p; 0) P X(  x)

= BINOMIALFORDELING(x ; n; p; 1) P X( x)

Eksempel (jævnfør eksempel 72)

Lad X være binomialfordelt med n = 6 og p = 0.15

= BINOMIALFORDELING(3;6;0,15;0) = 0,041453 P X( 3)

= 1- =1 - BINOMIALFORDELING(2;6;0,15;1) = 0,047339 P X( 3) P X( 2)

Poissonfordeling (se evt. eksempel 9.10 side 102) Lad X være Poissonfordelt med middelværdien

= POISSON(x; ; 0) P X(  x) 

= POISSON(x; ; 1) P X( x) 

Eksempel

Lad X være Poissonfordelt med middelværdien 10 P(X = 4) = POISSON(4; 10;0) = 0.018917

= 1 - POISSON(4;10;1) = 0,970747 P X( 4)

Eksponentialfordeling

Lad T være eksponentialfordelt med middelværdien. EKSPFORDELING(t,1/ ,1)

P T t(  ) 

Eksempel:

Lad T være eksponentialfordelt med middelværdi =2 EKSPFORDELING(3;1/2;1) = 0,77687

P T( 3)

Konfidensintervaller

Konfidensinterval middelværdi for 1 normalfordelt variabel. kendt eksakt

Radius r i et 95% konfidensinterval for :x r x u (se evt. eksempel 5.2 side 42)

   0 975. n r = KONFIDENSINTERVAL(0,05;, n).

Eksempel. Lad stikprøven have n =6 værdier, lad spredning = 0.25 og gennemsnit x =8 r =KONFIDENSINTERVAL(0,05;0,25;6). Resultat 0,200038

95% konfidensinterval: 8,00.200

Konfidensinterval for middelværdi for 1 normalfordelt variabel . ikke kendt eksakt se eksempel 5.4 side 45

Konfidensinterval for sandsynlighed p for 1 binomialfordelt variabel.

se eksempel 9.7 side 98 Hypotesetest

1 normalfordelt variabel

kendt eksakt se eksempel 6.1 side 55

ikke kendt eksakt se eksempel 6.3 side 57

2 normalfordelte variable 1) Ikke parvise observationer:

data givet: se Excel-program i eksempel 7.1 side 72 data ikke givet: se Excel-program i eksempel 7.2 side 73 2) Parvise observationer:

se Excel-program i eksempel 7.3 side 74 1 binomialfordelt variabel

se eksempel 9.5 side 96

Statistiske beregninger på lommeregner og PC-er MAPLE

Beregn gennemsnit og spredning af tallene 1 3 4 8

> with(stats):

data:=[1,3,4,8];

data := [1, 3, 4, 8]

> describe[mean](data);

4

> describe[standarddeviation[1]](data);

Beregne korrelationskoefficient for den i eksempel 9.2 nævnte stikprøve (1,2), (0,0), (2,2), (2,2), (1,0), (2,2), (0,2), (2,2), (0,2), (2,2) . Programudførelse:

> data1:=[1,0,2,2,1,2,0,2,0,2]; x- værdier

data1 := [1, 0, 2, 2, 1, 2, 0, 2, 0, 2] udskrift

> data2:=[2,0,2,2,0,2,2,2,2,2]; y-værdier

data2 := [2, 0, 2, 2, 0, 2, 2, 2, 2, 2] udskrift

> describe[linearcorrelation](data1,data2): evalf(");

.4014775343 resultat

Normalfordeling.

Find for n(113.3,5.6) P X( 116.1). Programudførelse:

> with(stats):

> with(statevalf):

> cdf[normald[113.3,5.6]](116.1);

Facit .6914624613 fordeling.

2

Find en tests P-værdi: P Q( 27.26) idet frihedsgradstallet er 19 (jævnfør eksempel 5.6) Programudførelse:

> with(stats):

> with(statevalf):

> 1-cdf[chisquare[19]](27.36);

Facit: .0965431211 t - fordeling.

Find en tests P-værdi: P T(-1.31) idet frihedsgradstallet er 14 (jævnfør eksempel 5.5) Programudførelse:

> with(stats):

> with(statevalf):

> cdf[studentst[14]](-1.31);

Facit: .1056420798

Find for binomialfordelingen b(100,0.3) P X( 35) Programudførelse:

> with(stats):

> with(statevalf):

> dcdf[binomiald[100,0.3]](35);

Facit: .8839213940

MATHCAD

MATHCAD 1) Generelt:

Sandsynlighedsfunktioner :

Skriv funktionens navn eller vælg fra (øverste) værktøjslinie

\Probability Density (dfunktionsnavn). Tæthedsfunktion ,

f x( ) P X( a)

\Probability Distribution (pfunktionsnavn). Fordelingsfunktion eller

f x( ) P X( a)

\Probability Distribution (qfunktionsnavn) Invers tæthedsfunktion: Find .

f x( ) P X( xp)p xp

Rækkefølgen af parametrene kan findes ved at placere cursor på navnet og trykke på tasten F1.

2) Sandsynlighedsfordelinger.

Normalfordeling n( , )

a) Find , pP a( X b) hvor a ,b, , er givne konstanter.

pnorm(b, ) - pnorm(a, ) pP a( X b )P X b( )P X( a)  ,  , Eksempel: , p P X( 116. ) hvor113. , 5 p = pnorm(11.6, 11.3,5) = 0.524 b) Find :xp P X( xp)p, hvor p, , er givne konstanter. xp=qnorm(p, , ) 

Eksempel:P X( xp)0 7. ,hvor11 4, ,6 xp=qnorm(0.7,11.4,6) =14.55 t - fordeling.

Lad T være t - fordelt med frihedsgradstallet f.

a) Find , pP a T b(   ) hvor a og b er givne konstanter.

pt(b,f) -pt(a,f) pP a( X b )P X b( )P X( a)

Eksempel: , p P T(  1 3. ) med f = 14 p = pt(-1.3,14) = 0.1073 b) Find t( ):f P T( t( ))f ( given konstant). t( )f = qt(,f )

Eksempel: t0 975. (12) = qt (0.975,12) = 2.179

fordeling.

2

Lad Q være 2 fordelt med frihedsgradstallet f.

a) Find , pP a Q b(   ) hvor a og b er givne konstanter. p = pchisq(b,f) - pshisq(a,f) Eksempel:Find , p P Q( 27 3. ) med f = 19 p 1 P Q( 27 3. )=1- pchisq(27.3,19) = 0.0979 b) Find fraktilen2(f ) : P Q( 2( ))f ( given konstant). 2( )f = qchisq(,f )

Eksempel: 0 0252. ( )8 = qchisq(0.025,8) = 2.18

Binomialfordeling.

Lad X være binomialfordelt b(n,p) a) P(X=x) =dbinom(x,n,p)

pbinom(x,n,p) P X( x)

Eksempel :q = P(3 X 6), hvor n = 10 og p = 0.3

q = P X( 6)P X( 2) = pbinom(6,10, 0.3)-pbinom(2,10,0.3) = 0.6066 b) Find det hele tal m for hvilket P X m( ) m = qbinom(p, n,)

Eksempel: Lad X være binomialfordelt med p = 0.3 og n = 10.

Find det hele tal m for hvilket P X( m)0 95. m = qbinom(0.3, 10,0.95 ) = 9

Statistiske beregninger på lommeregner og PC-er Poissonfordeling.

Lad X være Poissonfordelt p() a) P(X=x) =dpois(x,)

ppois(x, ) P X( x)

Eksempel: p = P X( 94) , hvor = 147.6 p = ppois(94,147.6) = 1.54 10 -6 b) Find det hele tal m for hvilket P X m( ) m = qpois( , )

Eksempel: Lad X være Poissonfordelt med = 147.6.

Find det hele tal m for hvilket P X( m)0 95. m = qpois(0.95, 147.6 ) =168 Hypergeometrisk fordeling:

Lad X være hyprgeometrisk fordelt h(N,M,n) a) P(X=x) =dhypgeo(x,M, N-M,n)

phypgeo(x,M,N-M,n) P X( x)

3) Gennemsnit, varians og spredning

Find gennemsnit , varians og spredning af tallene 1, 3, 4, 8

Opret en søjlematrix v:=

1 3 4 8









Vælg fra værktøjslinie f x( )\ Category: Statistics \ Function Name: eksempelvis mean Eksempel : Gennemsnit: mean (v) =4 Mean({1,3,4,8}) = 4

Varians: Var(v) = 8.667 Spredning: Stdev (v) = 2.944

APPENDIX

n N ≤ 1

10

M N

p≤ 1 10

1 10

9

10 5 5

< p< ∧ ≤n p⋅ ≤n

APPENDIX . Oversigt over approksimationer.

1) Når n og benyttes, at .

N > 1 10

M N ≤ 1

10 h N M n( , , )= h N n M( , , )

2) For p≥ 9 benyttes, i stedet for at tælle Xgammel = “antal af successer”, så at tælle X = antal fiaskoer dvs.

10

og .

p=1 pgammel X= n Xgammel

3) Husk heltalskorrektion ved approksimation med normalfordeling. (se næste side)

APPENDIX

Fig. 1. Heltalskorrektion

Approksimation af binomialfordeling til normalfordeling.

Det kan vises, at tæthedsfunktionen for binomialfordelingen b (n, p) nærmer sig ubegrænset til normalfordelingen

, hvor og , når n vokser ubegrænset1) .

n( , )µ σ µ =n p σ = n p (1p)

Approksimation af en binomialfordeling med en normalfor-deling anses, når 1 i praksis for at være

tilfreds-10 9

<p<10

stillende, såfremt n p 5 (og n(1 p)5).

Da binomialfordelingen kun antager heltalsværdier, medens en normalfordeling kan antage alle værdier på talaksen, svarer hvert helt tal ved binomialfordelingen til et interval af længden 1 ved normalfordelingen. På figur 1 er derfor tegnet en firkant, der har bredden 1, og hvis højde er udregnet ved binomialfordelingen. Arealet P X( =4)

under normalfordelingskurven fra x = 3.5 til x = 4,5 er med tilnærmelse lig firkantens areal. Man siger, at man ved approksimationen må heltalskorrigere (korrigeres for kontinuitet).

Ved approksimationen benyttes derfor følgende anførte formler, gældende for en binomialfordelt variabel X fordelt

b (n, p), hvor 1 og .

10 9

p10 5n p n5

Eksempel 7.13: Approksimation af binomialfordeling med normalfordeling.

En kunde til de i eksempel 2.3 producerede plastikkasser køber kasserne i partier på 2000. Kunden godkender et parti efter en stikprøvekontrol, hvor der udtages 100 kasser. Hvis antallet af defekte kasser i stikprøven højst er 14 godkendes hele partiet. I modsat fald kasseres partiet.

Hvor stor er sandsynligheden for at et parti bliver godkendt, hvis der er 300 defekte kasser i hele partiet på de 2000.

Løsning:

Lad X være antallet af defekte kasser i stikprøven. Vi ønsker at udregne P X( ≤14). Umiddelbart er X hypergeometrisk fordelt med N = 2000, M = 300, og n = 100.

Da stikprøvestørrelsen er lille n kan fordelingen af X umiddelbart approksimeres med N = <

binomialfordelingen b (100, p), hvor p M . Dette giver ved benyttelse af en lommeregner som

= N = 300 = 2000 015. TI-89 at P X( 14) = 45.72%.

Idet n p⋅ =15 5> , kan i stedet for approksimeres med normalfordelingen med µ=15ogσ = 15 0 85 . =3 57. . Ved hjælp af denne approksimation kan vi beregne:

normCdf( , 14.5, 15, 3.57) = 44.43%

P X( ≤14)= − ∞

Det ses, at der er ca. 1.5 % afvigelse, hvilket normalt ingen betydning har.

1) Matematisk formulering: Når X er fordelt b(n, p), vil for den tilsvarende normerede variabel

Y X n p gælde, at for ethvert tal y.

=

P Y( y)Φ( )y

Facitliste

FACITLISTE

KAPITEL 2 2.1 -2.2 -2.3

2.4 (1) - (2) ca 24%

2.5 (1) - (2) ca 0.052 2.6 (1) - (2) ca 13%

2.7 (1) - (2) 24.8 24.5 2.8 (1) - (2) (3) -KAPITEL 4

4.1 (1) 0.7734 0.0548 0.1718 (2) 0.7480

4.2 (1) 69.15% (2) 10.88% (3) 112.2 (4) 117.3 6.535 4.3 (1) 86.64% (2) 0.008 (3) 0.020

4.4 (1) 5.94% (2) 27.71% (3) [783.51; 816.49]

4.5 (1) 9.5 1.265 (2) 12.45 (3) 2.41%

4.6 (1) 92.8%

4.7 (1) 97.71% (2) 25.45 4.8 (1) 65 0.4 (2) 77.34%

KAPITEL 5

5.1 (1) 12.13 0.6783 (2) [11.65 ; 12.61] (3) [10.52 ; 13.74] (4) [11.73 ; 12.53]

5.2 (1) 2259.92 35.569 (2) [2237 ; 2283] (3) [2178 ; 2341]

5.3 (1) 74.0362 0.00124 (2) [74.035; 74.037]

5.4 (1) 750.2 (2) [740.1 ; 760.3] (3) 19.13 (4) [14.0 ; 30.2]

5.5 (1) 7.83 0.363 (2) [7.45 ; 8.22] (3) 53 5.6 [25.20 ; 60.39]

5.7 [0.00083 ; 0.00231]

5.8 (a) [4.23 ; 4.29] (b) 22 (c ) [4.16 ; 4.36] (d) [0.028 ; 0.076]

5.9 (1) [0.965 ; 1.111] (2) [0.0263; 0.1714]

KAPITEL 6

6.1 (1) nej P-værdi = 2.27%

6.2 ja 3.45% (2) 58.0 (3) [55.84; 60.16]

6.3 (1) 84.47 6.85 (2) ja P-værdi = 0.44% (3) [81.27 ; 87.67] (4) 25.7%

6.4 (a)nej P-værdi = 12.1% (b) [7.93 ; 8.49 ] 6.5 (a) ja P-værdi = 0.157% (b) [24.07 ; 35.56]

6.6 nej P-værdi = 6.45%

6.7 (1) ja, P-værdi = 0.012 (2) 0.987 (3) [0.68 ; 1.80 ] 6.8 ja, P-værdi =

18 10 . 

9

6.9 (1) 19.5 (2) nej, P-værdi =0.1% , (eller P-værdi =0.135%) 6.10 (1) 12 (2) ja P-værdi = 0.48 (3) nej

137

Facitliste

6.11 (1) 24 (2) ja P-værdi = 0.16% (3) nej [2.59 ; 2.67]

6.12 (1) 26 (2) ja P-værdi = 2 5 10.  13 (3) ja KAPITEL 7

7.1 P - værdi = 0.1044

7.2 (1) P - værdi = 0.001 (2) [0.69 ; 3.13]

7.3 P - værdi = 0.0204

7.4 (1) P - værdi = 0.0714 (2) P - værdi = 0.401 7.5 (1) 18 (2) P - værdi = 0.00017 , [11.9 ; 15.0]

7.6 P - værdi = 0.589 7.7 P - værdi = 0.1398 7.8 (1) nej P-værdi =29.9%

7.9 (1) nej, P-værdi =9.85% (2) [0.22 ;7.28 ] 7.10 (1) - (2) Ja, P-værdi =3.63%

KAPITEL 8

8.1 0.1 0.8 0.2 0.7 8.2 (1) 0.9134 (2) 0.9678

8.3 (1) 8.75% (2) 38.75% (3) 41.25% (4)11.25%

8.4 (1) 6.4% (2) 78.4% (3) 7.2%

8.5 (a) 30.24% (b) 0.24% (c ) 99.76% (d) 4.04% (e) 44.04% (f) 21.44%

8.6 1.283 1012 8.7 (a) - (b) 736 8.8 (a) 6 (b) 24 8.9 (a) 100 /b) 2400 8.10 60

8.11 (1) 27.1% 36.0% 9.756% (2) 53.34% (3) 49.20%

8.12 340

8.13 (1) 5 (2) 9 8.14 30.24%

8.15 9 10 7 KAPITEL 9

9.1 (1) 41.3% 2)- 3) 0.6

9.2 (A) 0.018% (B) 1.29% ( C) 38.24%

9.3 44.57%

9.4 (1) ja (2) 49.73%

9.5 (1) 17.68% (2) 59.28%

9.6 2.58%

9.7 5.83%

9.8 5.6%

9.9 94.9%

9.10 40.33%

9.11 13%

9.12 nej, P-værdi =0.08%

Facitliste

9.13 (1) 0.9% (2) nej

9.14 (1) ja, P-værdi = 2.53% (2) 0.12 (3) [0.056 ; 0.184]

9.15 ja p = 0.43%

9.16 (1) 0.108 (2) [0.089 ; 0.127]

9.17 [0.799 ; 0.847]

9.18 1522 9.19 77.86%

9.20 (1) 7.94% (2) 11.8%

9.21 (1) (a) 60.6% (b) 91.6% (c) 6.2% (2) 4.4%

9.22 (1) 30.1% (2) 87.9% (3) 4 9.23 50.37%

9.24 (1) 15 (2) 81.9%

9.25 75.3%

9.26 6.56%

9.27 92.2%

9.28 44.6%

9.29 (1) nej P-værdi = 7.84% (2) 100.8 (4) [85.56 ; 116.04]

9.30 (1) 4.68 (2) [4.47 ; 4.89] (3) 69.44

9.31 (1a) 11 (1b) [4.5 ; 17.5] (2a) 1.1 (2b) [0.45 ; 1.75]

9.32 (1) 0.539% (2) 0.119%

9.33 7.31%

9.34 0.188%

KAPITEL 10

10.1 (1) 2.90 (2) 14.6% (3) 16.98

10.2 (1) 77.88% (2) 10.45% (3) 77.88% (4) 9.48%

10.3 1

10.4 (1) 79.8% (2) 99.33% (3) 22.8 (4) 14 KAPITEL 11

11.1.1 (a1) - (a2) - (a3) nej (a4) 2.3 1.8 1.345 1.470 (a5) 12.6 (b1) 2.2 1.5 1.316 1.5811

11.1.2 (a6) 0.06 0.0304 (b2) 0.6667 0.3203 11.1.3 (a7) 52 15.52 (b3) 53.33 17.51

11.2.1 (a1) - (a2) nej (a3) 0.9 0.5 0.830 0.5 (a4) 0.9707 (b1) 0.6 0.6 0.843 0.516

11.2.2 (a5) 0.15 0.36 (b2) 0.2667 0.6124 11.2.3 (a6) 15300 3716.18 (b3) 15800 4131.18

11.3.1 (a1) - (a2) nej a3) 4.2 3.2 1.4 0.9798 (a4) 0.625 (b1) 4 3.2 1.633 1.033 11.3.2 (a5) 0.16 0.0342 (b2) 0.4444 0.2635

11.3.3 (a6) 316 44.36 (b3) 300 28.28 11.4.1 178.33 71.833 11.428 10,870 11.4.2 100.97 0.8128

11.4.3 139.13 2.089 11.5 4.6344

139

Facitliste

11.6 3.559 11.7 3.3466

Facitliste

for linearkomb. af normalf. variable 25, 30 alternativ hypotese 53

approksimation 99

binomial til normalfordeling 135 binomial til Poissonfordeling 135

hypergeometrisk til binomialford. 95, 135 Poisson til normalfordeling 135 chi i anden fordeling 44

D eksponential- 110 hypergeometrisk- 86

kontinuert variabel 20 foreningsmængde 75

generaliseret hypergeometrisk ford. 98 gennemsnit 7, 27, 34

Stikord

konfidensinterval 35, 37 , 39, 43, 44 konfidensinterval

1 normalfordelt variabel 35, 37, 39, 43, 44 2 normalfordelte variable , differens 67, 71 binomialfordeling 93, 100

Poissonfordeling 98, 101 kontinuert stokastisk variabel 17 korrelationskoefficient 115, 118 kovarians 115, 118

observationer, parvise 69 opgaver kapitel

relativ usikkerhed 23 repræsentativ stikprøve 33 S

SAK 10

Facitliste Stikord

sandsynlighed 16, 75 additionssætning 76

af middelværdi 48, 58 af spredning 54, 60

uafhængige stokastiske variable 15

udfald 15

diskret variabel 16, 86 kontinuert variabel 19 variationsbredde 5

In document STATISTISKE GRUNDBEGREBER (Sider 127-149)