11 FLERDIMENSIONAL STATISTISK VARIABEL
11.3 Linearkombination
Eksempel 11.2. Kovarians. Korrelationskoefficient.
Vi betragter igen den 2-dimensionale fordeling fra eksempel 11.1.
a5) Find kovariansen og korrelationskoefficienten.
b2) Benyt stikprøven til at finde estimater for kovariansen og korrelationskoefficienten.
LØSNING:
a5) Idet vi i eksempel 11.1 har fundet µ1=11. ,µ2 =12. , σ = 0 69. og σ = 0 96. , finder vi nu kovariansen og korrelationskoefficienten :
V X( 1,X2) ρ(X1,X2)
Det ses, at estimaterne har en vis lighed med de eksakte værdier i spørgsmål a5).
11.3 LINEARKOMBINATION
Vi bruger ofte stikprøven til at danne gennemsnittet X X X X
n nX
Ved en linearkombination L for en k-dimensional stokastisk variabel forstås et udtryk af r
X =(X1,X2,...,Xk) formen
, hvor er konstanter.
L= a0+a X1 1+a X2 2+...+a Xk k a a a0, 2, 3,...,ak For middelværdien af L giver linearitetsreglen:
E L( )=a0+a E X1 ( 1)+a E X2 ( 2) ...+ +a E Xk ( k).
For variansen af en linearkombination L gælder kvadratreglen:
V L a V X a V X ak V Xk a a V Xi j i Xj
Flerdimensional stokastisk variabel
c) V X (X’erne statistisk uafhængige)
n V X stikprøvestørrelsen n. For at få et gennemsnit med en 10 gange mindre spredning, skal stikprøven altså gøres 100 gange større!
Bevis for kvadratreglen. Vi finder
( )
( )
Eksempel 11.3. Linearkombination af stokastiske variable.
Et levnedsmiddel leveres i poser. Lad X1 og X2 [mg/kg] betegne koncentrationerne af to stoffer A og B i en
Opgaver til kapitel 11
OPGAVER
Opgave 11.1.1 (2-dimensional stokastisk variabel)
Et spil i et casino går ud på at trække en tilfældig seddel fra en urne (og lægge sedlen tilbage igen). Urnen indeholder 10 sedler, og på hver seddel står 2 tal (X1,X2):
(1,0) (3,0) (4,0)
(1,0) (3,3) (4,3)
(1,3) (4,3)
(1,3) (1,3)
a1) Find den 2-dimensionale tæthedsfunktionf x x( 1, 2):
a2) Find de 1-dimensionale tæthedsfunktioner f x1( 1)og f2(x2). a3) Er X1 og X2 statistisk uafhængige ?
a4) Find middelværdierne µ1= E X( 1)og µ2 = E X( 2)samt spredningerne σ1(X1) og σ2(X2). a5) Find middelværdien E X
(
1 X2)
.⋅ 2
b) Antag, at man i stedet kender en stikprøve på (X1,X2):
(1,3), (1,0), (1,0), (4,3), (3,0), (4,3), (1,0), (3,0), (3,3 ), (1,3).
b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a4).
Opgave 11.1.2 (kovarians, korrelationskoefficient)
a6) Find kovariansen V X( 1,X2) og korrelationskoefficienten ρ(X1,X2). b2) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a6).
Opgave 11.1.3 (linearkombination)
For det i opgave 11.1.1 og 11.1.2 omtalte casino aftales et spil, hvor gevinsten er G= 20 10+ X1+5X2.
a7) Find gevinstens middelværdi E G( ) og spredningσ( )G .
b3) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a7).
Opgave 11.2.1 (2-dimensional stokastisk variabel)
Under en produktion kan der optræde fejl. Lad (X1,X2)=( Antal gange der optræder fejl af type 1, Antal gange der optræder fejl af type 2) i en tilfældig produktion. VariablenX1 kan antage værdierne 0, 1 og 2, mensX2 kun kan antage værdierne 0 og 1.
a) Antag, at man teoretisk kender tæthedsfunktionenf x x( 1, 2):
f x x( 1, 2) x1
0 1 2
x2 0 0.3 0.1 0.1
1 0.1 0.2 0.2
a1) Find de 1-dimensionale tæthedsfunktioner f x1( 1)og f2(x2). a2) Er X1 og X2 statistisk uafhængige ?
a3) Find middelværdierne µ1= E X( 1)og µ2 = E X( 2)samt spredningerne σ1(X1) og σ2(X2). a4) Find middelværdien E
(
X1+ X2)
.b) Antag, at man i stedet kender en stikprøve på (X1,X2):
(0,1), (0,0), (1,1), (1,1), (0,0), (0,0), (0,1), (2,1), (0,0 ), (2,1).
b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a3).
Opgave 11.2.2 (kovarians, korrelationskoefficient) Vi betragter igen produktionsprocessen fra opgave 11.2.1.
a5) Find kovariansen V X( 1,X2) og korrelationskoefficienten ρ(X1,X2). b2) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a5).
Flerdimensional stokastisk variabel Opgave 11.2.3 (linearkombination)
For den i opgave 11.2.1 og 11.2.2 omtalte produktionsproces er fortjenesten F= 20000−3000X1−4000X2.
a6) Find fortjenestens middelværdi E F( ) og spredning σ( )F .
b3) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a6).
Opgave 11.3.1 (2-dimensional stokastisk variabel)
År 4001. En sonde er vendt hjem med oplysninger om individer på en fremmed planet. De kan have 2, 4 eller 6 øjne, og 2 eller 4 ører. Lad (X1,X2)= (Antal øjne, Antal ører) for et tilfældigt udtaget individ på planeten.
a) Professor Cosmussen har teoretisk opstillet tæthedsfunktionenf x x( 1, 2): a4) Find middelværdien E .
X X
b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a3).
Opgave 11.3.2 (kovarians, korrelationskoefficient) Vi betragter igen individerne fra opgave 11.2.1.
a5) Find kovariansen V X( 1,X2) og korrelationskoefficienten ρ(X1,X2). b2) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a5).
Opgave 11.3.3 (linearkombination)
For de i opgave 11.3.1 og 11.3.2 omtalte individer har professor Cosmussen opstillet en formel for deres masse:
kg.
M = 200+20X1+10X2
a6) Find massens middelværdi E M( ) og spredning σ(M).
b3) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a6).
Opgave 11.4.1 (2-dimensional stokastisk variabel)
Lad (X1,X2)= ( Højde [cm], Masse [kg] ) af en tilfældigt udtaget studerende på 3. halvår.
Vi betragter igen de i opgave 11.4.1 og 11.4.2 omtalte studerende. En frugtavler har opstillet en formel for den timeløn, han vil give dem som frugtplukkere:
kroner/time.
L=100+0 3. X1−0 2. X2
Opgaver til kapitel 11 Opgave 11.5 (poolet estimat)
Koncentrationen af et stof A blev målt i 3 partier råvarer:
Råvare 1: 56, 60, 54, 49, 61 Råvare 2: 78, 73, 80
Råvare 3: 66, 62, 70, 72, 60
Det antages, at der er samme spredning i de 3 tilfælde. Find et estimat spool for spredningenσ. Opgave 11.6 (poolet estimat)
Koncentrationen af et stof A blev målt i 2 levnedsmidler:
Levnedsmiddel 1: 87, 89, 94, 86, 89, 95 Levnedsmiddel 2: 93, 99, 94, 91, 98 . Det antages, at der er samme spredning i de 2 tilfælde. Find et estimat spool for spredningen σ. Opgave 11.7 (poolet estimat)
Koncentrationen af et stof A blev målt i mælken fra 5 køer:
Ko 1: 44, 48, 46, 43, 45 Ko 2: 40, 38, 41 Ko 3: 43, 45, 42, 42 Ko 4: 36, 32 Ko 5: 50
Det antages, at der er samme spredning i de 5 tilfælde. Find et estimat spool for spredningen σ.
Statistiske beregninger på lommeregner og PC-er
STATISTISKE BEREGNINGER PÅ LOMMEREGNER TI89 SAMT PÅ PC-PROGRAMMERNE TI-Nspire, EXCEL, MAPLE OG MATHCAD
TI 89
1) Generelt:Beregning af sandsynlighedsfordelinger:
Metode 1 Vælg HOME\ CATALOG,, F3\ vælg den ønskede fordeling\ENTER
(tryk evt på “forbogstav” for hurtigt at komme til det ønskede navn).
Fordel: Hurtig ved beregning af sandsynligheder, såsom P(X < 0.87) da resultatet straks indsættes på HOME-linien.
Ulempe: Man skal huske parametrenes rækkefølge (de kan dog ses nederst på skærmen) Metode 2: Vælg APPS\ Stats/List\F5\vælg den ønskede fordeling\ENTER
Fordel: Der fremkommer nu en menu, som er næsten selvforklarende.
Ulempe:Skal resultatet ned på HOME-linien (man vil regne videre), bliver det lidt besværligt:
HOME, Var-Link\I StatsVar mappen markeres den ønskede størrelse, ENTER
Tal indlagt på liste Vælg APPS\ Stats/List\ indtast data i eksempelvis “list1"
Fordele og ulemper som under metode 2 ovenfor
Beregning af gennemsnit , spredning , middelværdi osv.
1) Hvis tal indlagt på liste 1
F4\ 1: 1-Var Stats , I menu sættes “List” til “List1" (Benyt evt. Var-Link til at finde List1) Udskriften består af en række statistiske størrelser.
2) Anvendes med få tal og kun ønsker beregning af en enkelt størrelse.
HOME\ MATH\6.Statistics\
Gennemsnit: Mean ({liste}) , Varians: Variance({liste}), Spredning: stdDev({liste}) Beregning af test
1) Hvis tal indlagt på liste(r)
F6\i menu vælg relevant test\ENTER\Data\ENTER\udfyld menu\ENTER
2) Oprindelige data ikke kendt, men kun middelværdi osv.
Som ovenfor, men nu vælges Stats fremfor Data
Beregning af konfidensintervaller 1) Hvis tal indlagt på liste(r)
F7\i menu vælg relevant konfidensinterval\ENTER\Data\ENTER\udfyld menu\ENTER
2) Oprindelige data ikke kendt, men kun middelværdi osv.
Som ovenfor, men nu vælges Stats fremfor Data
Oprette en “Folder”: VAR-Link\ F1\ 5: Create Folder\ Skriv navn på folder.
Vælg en mappe som den aktuelle mappe: MODE\ Current Folder\navn
Formål: Det kan være praktisk ikke at gemme alle sine resultater i MAIN.
TI89 2) Sandsynlighedsfordelinger.
Normalfordeling n(μ,σ)
a) pP a( X b), hvor a ,b,μ,σ er givne konstanter(a og b kunne evt. være 4): p = normcdf(a b, , , ) b) Find :xp P X( xp)p, hvor p, μ, σ er givne konstanter. xp=invNorm(p,μ,σ) t - fordeling. Lad T være t - fordelt med frihedsgradstallet f.
a) Find p = P(a # T # b), hvor a og b er givne konstanter.(a og b kunne evt. være 4): p = tCdf(a,b,f) b) Find t( ):f P T( t( ))f ( given konstant). t( )f invt( ,f ) χ2 - fordeling. Lad Q være χ2 - fordelt med frihedsgradstallet f.
a) Find , p P a Q b( ) hvor a og b er givne konstanter. p = chi2Cdf(a,b,f) b) Find fraktilen2( )f : P Q( 2( ))f ( given konstant). invChi2( ,f) Binomialfordeling. Lad X være binomialfordelt b(n,p)
Find P l( X m), hvor0 l m m n og l og m er hele tal. binomtCdf(n,p,l,m) Poissonfordeling. Lad X være Poissonfordelt p()
Find P l( X m), hvor0 l m og l og m er hele tal. poissCdf(,l,m) 3) Konfidensintervaller
Normalfordeling. 1 variabel
1) ukendt: F7\ 1: T-Interval (hvis oprindelige data ikke kendt så Stats ellers Data) 2) kendt: F7\ 1: Z-Interval (hvis oprindelige data ikke kendt så vælg Stats ellers Data) Normalfordeling. 2 variable
F7\ 4: 2-SampTint\ udfyld menu(se eksempel 7.1, parvis så eksempel 7.3) Binomialfordeling.
F7, 5: 1-Prop-ZInt (Kræver der kan approksimeres til normalfordeling) Poissonfordeling: findes ikke, så her må formel for konfidensinterval benyttes 4) Hypotesetest
Normalfordeling. 1 variabel
1) kendt: F6\ 1: Z-Test (hvis oprindelige data ikke kendt så Stats ellers Data) 2) ukendt: F6\ 1: T-Test (hvis oprindelige data ikke kendt så Stats ellers Data) Normalfordeling. 2 variable
F6\ 4: 2-SampTtest\ udfyld menu (se eksempel 7.1 eller 7.3) Binomialfordeling.
F7, 5: 1-Prop-ZTest (Kræver der kan approksimeres til normalfordeling) Poissonfordeling: findes ikke, så her må formel for konfidensinterval benyttes
Statistiske beregninger på lommeregner og PC-er
TI-Nspire 1) Generelt:
Beregning af sandsynlighedsfordelinger:
Vælg Beregninger\Statistik\Fordelinger\ vælg den ønskede fordeling\udfyld menu\ENTER
Huskes fordelingens navn og parametrenes rækkefølge kan man skrive direkte Tal indlagt på liste Lister og regneark giv en liste et navn og indtal tal i listen Beregning af gennemsnit , spredning , middelværdi osv.
1) Hvis tal indlagt på liste
Lister og regneark giv en liste et navn og indtal tal i listen vælg statistik statistiske beregninger statistik med 1 variabel udfyld menuer Enter.
Blandt mange tal findes det ønskede
2) Anvendes med få tal og kun ønsker beregning af en enkelt størrelse.
Beregninger\statistik\listematematik\vælg
Middel: mean({liste}), Stikprøvevarians: varSamp({liste}), Standardafvigelse for stikprøve:
stDevSamp({liste})
Beregning af test 1) normal, 1 variabel
1) Lister og regneark udfyld liste (husk overskrift) Statistik t-test for 1 variabel menu:data udfyld menu ENTER
2) Oprindelige data ikke kendt, men kun middelværdi osv.
Som ovenfor, men nu vælges Stats fremfor Data
2) normal, 2 variable
1)Lister og regneark Udfyld lister med overskrift m1 og m2 Statistik t-test for 2 variable menu:data ok menu: List1: skriv m1 List 2: Skriv m2 “alternative Hyp” samlet: nej (hvis parvise observationer så ja vælg variabelreference ok
2) Oprindelige data ikke kendt, men kun middelværdi osv.
Som ovenfor, men nu vælges Stats fremfor Data
Beregning af konfidensintervaller
Som under test blot vælges nu konfidensintervaller
De konkrete beregninger af en given sandsynlighedsfordeling konfidensinterval eller test svarer til det der står under TI89
Excel
Excel
1) Generelt Forudsætninger.
Da ikke alle de anvendte statistiske funktioner er indbygget fra starten, skal man først vælge et tilføjelsesprogram:
I Excel 2003: Vælg “Funktioner”, “Tilføjelsesprogrammer”, marker “Problemløser”
I Excel 2007: Vælg “Excel-Office-knappen”, “Excel indstillinger (findes forneden)”, Tilføjelsesprogrammer”,
”Udfør”, ”marker Analysis toolpak, Analysis toolpak VBA, Problemløser”, “Installer”.
Inddata.
Vi vil i det følgende for kortheds skyld antage, at den første stikprøves værdier står i cellerne A1, A2, A3 . . . A10.
Kræves der flere variable vil den næste stå i cellerne B1, B2, B3 . . . B8, osv.
Man angiver “udskriftsområdet” eller “inputområdet” f.eks en søjle placere i cellerne A1:A10 ved a) at markere området A1 til A10
b) at skrive eksempelvis A1:A10
c) at give det et navn: Vælg “Indsæt” i Excel 2003: Navn i Excel 2007:Formler Definer i menu skriv søjlens navn og (nederst)A1:A10
Skrive , beregne og kopiere formler.
Vælg den celle hvor resultatet skal stå. Lad det være B1: På værktøjslinien foroven skriv = formel skrives ENTER Resultatet står nu i celle B1
Hvis selve formlen skal stå i en anden celle. Lad det være A1: Cursor placeres i B1 I formelfelt markeres formlen uden lighedstegn og man kopierer den (CTRL C)” ENTER (så formlen igen er beregnet i B1 Cursor over i A1 og paste (CTRL V)
Udskrive gitterlinier og række og kolonneoverskrifter
Excel 2003: Vælg Filer Sideopsætning Ark Marker gitterlinier marker række- og kolonneoverskrifter.
Excel 2007: Vælg Sidelayout Under“Gitterlinier” marker “Udskriv” Under “Overskrifter” marker “Udskriv”
2: Indsætte og tegne diagrammer Lagkage eller søjle: se eksempel 2.1 side 2 Kurve: se eksempel 2.4 side 4
Tegne histogram: se eksempel 2.5 side 6 3: Beregne statistiske størrelser og funktioner
Beregning af “Karakteristiske tal” (se evt. ekempel 2.9) Data indtastes i eksempelvis søjle A1 til A10
Excel 2003: Funktioner Dataanalyse Beskrivende statistik udfyld inputområde Resumestatistik Excel 2007: Data Dataanalyse Beskrivende statistik udfyld inputområde Resumestatistik Valg af statistiske størrelser (funktioner)
1) Vælg den celle hvor resultatet skal stå (eksempelvis A1).
2) På værktøjslinien foroven:
2a) Tryk på fx
2b) På den fremkommne menu vælges den ønskede funktion eksempelvis “NORMALFORDELING”
2c) Der fremkommer en menu med anvisning på, hvordan den skal udfyldes.
Gennemsnit, spredning, median, kvartil
Navnene anføres nedenunder, men den fremkomne menu gør det let at indsætte de rette parametre.
Gennemsnit = x MIDDEL(A1:A10) Spredning s = STDAFV (A1:A10)
Median m = MEDIAN(A1:A10) (= KVARTIL(A1:A10;2) ) 1. Kvartil = KVARTIL(A1:A10;1)
Statistiske beregninger på lommeregner og PC-er Fakultet, kombination, Permutation (se evt. eksempel 8.8)
Fakultet n! = FAKULTET(n) Eksempel: 5! =FAKULTET(5) = 120 Kombination K(n,p) = KOMBIN(n;p) Eksempel: K(5,3)==KOMBIN(5;3) = 10 Permutation P(n,p = PERMUT(n;p) Eksempel: P(5,3) = PERMUT(5;3) = 60 Normalfordeling.
Lad X være normalfordelt med middelværdi og spredning
1)P X( x)= NORMFORDELING(x ;; ;1) 2)P X( x)= 1 - NORMFORDELING(x ;; ;1)
3)P a( X b) P X( b)P X( a)NORMFORDELING(b ;; ;1) -NORMFORDELING(a ;; ;1) Fraktil : xp P X( xp) p NORMINV(p;; )
Eksempel: u0 975. = NORMINV(0,975;0;1) = 1,959961 t - fordeling. (se evt. eksempel 5.3 side 44)
Lad T være t - fordelt med f frihedsgrader..
1) P T( t)= TFORDELING(abs(t); f ;1)
(bemærk: TFORDELING(abs(t); f ;1) udregner “øvre hale” af fordelingen)
2) P T( t)+P T( t)= TFORDELING(abs(t); f ;2) (udregner “halen” til begge sider)
Bemærk: Man må må udnytte symmetrien i t-fordelingen, for værdier mindre end 0 (svarende til < 0.5) Eksempel:
Lad T være t - fordelt med 12 frihedsgrader
1) P X( 1) =P X( 1)= TFORDELING(abs(-1);12;1) = 0,168525 2) t0 975. (12) = TINV(0,05;12) = 2,178813
= - TINV(0,05;12) = - 2,178813 t0 025. (12)
- fordeling. (se evt.eksempel 5,8 side 49)
2
Lad X være 2- fordelt med f frihedsgrader = CHIFORDELING(x;f) P X( x)
(bemærk: CHIFORDELING(x;f) udregner “øvre hale” af fordelingen) Fraktil
Hypergeometrisk fordeling (se evt. eksempel 9.2 side 91) Lad X være hypergeometrisk fordelt med parametrene N, M og n
= HYPGEOFORDELING(x ; n ; M ; N) P X( x)
Eksempel: Lad N = 600, M = 10 og n = 25
= HYPGEOFORDELING(1;25;10;600)+HYPGEOFORDELING(0;25;10;600) = 0,938876 P X( 1)
TI - 83 Binomialfordeling ( se evt. eksempel 9.5 side 96)
Lad X være binomialfordelt med parametrene n og p
= BINOMIALFORDELING(x ; n; p; 0) P X( x)
= BINOMIALFORDELING(x ; n; p; 1) P X( x)
Eksempel (jævnfør eksempel 72)
Lad X være binomialfordelt med n = 6 og p = 0.15
= BINOMIALFORDELING(3;6;0,15;0) = 0,041453 P X( 3)
= 1- =1 - BINOMIALFORDELING(2;6;0,15;1) = 0,047339 P X( 3) P X( 2)
Poissonfordeling (se evt. eksempel 9.10 side 102) Lad X være Poissonfordelt med middelværdien
= POISSON(x; ; 0) P X( x)
= POISSON(x; ; 1) P X( x)
Eksempel
Lad X være Poissonfordelt med middelværdien 10 P(X = 4) = POISSON(4; 10;0) = 0.018917
= 1 - POISSON(4;10;1) = 0,970747 P X( 4)
Eksponentialfordeling
Lad T være eksponentialfordelt med middelværdien. EKSPFORDELING(t,1/ ,1)
P T t( )
Eksempel:
Lad T være eksponentialfordelt med middelværdi =2 EKSPFORDELING(3;1/2;1) = 0,77687
P T( 3)
Konfidensintervaller
Konfidensinterval middelværdi for 1 normalfordelt variabel. kendt eksakt
Radius r i et 95% konfidensinterval for :x r x u (se evt. eksempel 5.2 side 42)
0 975. n r = KONFIDENSINTERVAL(0,05; , n).
Eksempel. Lad stikprøven have n =6 værdier, lad spredning = 0.25 og gennemsnit x =8 r =KONFIDENSINTERVAL(0,05;0,25;6). Resultat 0,200038
95% konfidensinterval: 8,00.200
Konfidensinterval for middelværdi for 1 normalfordelt variabel . ikke kendt eksakt se eksempel 5.4 side 45
Konfidensinterval for sandsynlighed p for 1 binomialfordelt variabel.
se eksempel 9.7 side 98 Hypotesetest
1 normalfordelt variabel
kendt eksakt se eksempel 6.1 side 55
ikke kendt eksakt se eksempel 6.3 side 57
2 normalfordelte variable 1) Ikke parvise observationer:
data givet: se Excel-program i eksempel 7.1 side 72 data ikke givet: se Excel-program i eksempel 7.2 side 73 2) Parvise observationer:
se Excel-program i eksempel 7.3 side 74 1 binomialfordelt variabel
se eksempel 9.5 side 96
Statistiske beregninger på lommeregner og PC-er MAPLE
Beregn gennemsnit og spredning af tallene 1 3 4 8
> with(stats):
data:=[1,3,4,8];
data := [1, 3, 4, 8]
> describe[mean](data);
4
> describe[standarddeviation[1]](data);
Beregne korrelationskoefficient for den i eksempel 9.2 nævnte stikprøve (1,2), (0,0), (2,2), (2,2), (1,0), (2,2), (0,2), (2,2), (0,2), (2,2) . Programudførelse:
> data1:=[1,0,2,2,1,2,0,2,0,2]; x- værdier
data1 := [1, 0, 2, 2, 1, 2, 0, 2, 0, 2] udskrift
> data2:=[2,0,2,2,0,2,2,2,2,2]; y-værdier
data2 := [2, 0, 2, 2, 0, 2, 2, 2, 2, 2] udskrift
> describe[linearcorrelation](data1,data2): evalf(");
.4014775343 resultat
Normalfordeling.
Find for n(113.3,5.6) P X( 116.1). Programudførelse:
> with(stats):
> with(statevalf):
> cdf[normald[113.3,5.6]](116.1);
Facit .6914624613 fordeling.
2
Find en tests P-værdi: P Q( 27.26) idet frihedsgradstallet er 19 (jævnfør eksempel 5.6) Programudførelse:
> with(stats):
> with(statevalf):
> 1-cdf[chisquare[19]](27.36);
Facit: .0965431211 t - fordeling.
Find en tests P-værdi: P T( -1.31) idet frihedsgradstallet er 14 (jævnfør eksempel 5.5) Programudførelse:
> with(stats):
> with(statevalf):
> cdf[studentst[14]](-1.31);
Facit: .1056420798
Find for binomialfordelingen b(100,0.3) P X( 35) Programudførelse:
> with(stats):
> with(statevalf):
> dcdf[binomiald[100,0.3]](35);
Facit: .8839213940
MATHCAD
MATHCAD 1) Generelt:
Sandsynlighedsfunktioner :
Skriv funktionens navn eller vælg fra (øverste) værktøjslinie
\Probability Density (dfunktionsnavn). Tæthedsfunktion ,
f x( ) P X( a)
\Probability Distribution (pfunktionsnavn). Fordelingsfunktion eller
f x( ) P X( a)
\Probability Distribution (qfunktionsnavn) Invers tæthedsfunktion: Find .
f x( ) P X( xp)p xp
Rækkefølgen af parametrene kan findes ved at placere cursor på navnet og trykke på tasten F1.
2) Sandsynlighedsfordelinger.
Normalfordeling n( , )
a) Find , pP a( X b) hvor a ,b, , er givne konstanter.
pnorm(b, ) - pnorm(a, ) pP a( X b )P X b( )P X( a) , , Eksempel: , p P X( 116. ) hvor113. , 5 p = pnorm(11.6, 11.3,5) = 0.524 b) Find :xp P X( xp)p, hvor p, , er givne konstanter. xp=qnorm(p, , )
Eksempel:P X( xp)0 7. ,hvor11 4, , 6 xp=qnorm(0.7,11.4,6) =14.55 t - fordeling.
Lad T være t - fordelt med frihedsgradstallet f.
a) Find , p P a T b( ) hvor a og b er givne konstanter.
pt(b,f) -pt(a,f) pP a( X b )P X b( )P X( a)
Eksempel: , p P T( 1 3. ) med f = 14 p = pt(-1.3,14) = 0.1073 b) Find t( ):f P T( t( ))f ( given konstant). t( )f = qt( ,f )
Eksempel: t0 975. (12) = qt (0.975,12) = 2.179
fordeling.
2
Lad Q være 2 fordelt med frihedsgradstallet f.
a) Find , p P a Q b( ) hvor a og b er givne konstanter. p = pchisq(b,f) - pshisq(a,f) Eksempel:Find , p P Q( 27 3. ) med f = 19 p 1 P Q( 27 3. )=1- pchisq(27.3,19) = 0.0979 b) Find fraktilen2(f ) : P Q( 2( ))f ( given konstant). 2( )f = qchisq( ,f )
Eksempel: 0 0252. ( )8 = qchisq(0.025,8) = 2.18
Binomialfordeling.
Lad X være binomialfordelt b(n,p) a) P(X=x) =dbinom(x,n,p)
pbinom(x,n,p) P X( x)
Eksempel :q = P(3 X 6), hvor n = 10 og p = 0.3
q = P X( 6)P X( 2) = pbinom(6,10, 0.3)-pbinom(2,10,0.3) = 0.6066 b) Find det hele tal m for hvilket P X m( ) m = qbinom(p, n, )
Eksempel: Lad X være binomialfordelt med p = 0.3 og n = 10.
Find det hele tal m for hvilket P X( m)0 95. m = qbinom(0.3, 10,0.95 ) = 9
Statistiske beregninger på lommeregner og PC-er Poissonfordeling.
Lad X være Poissonfordelt p() a) P(X=x) =dpois(x,)
ppois(x, ) P X( x)
Eksempel: p = P X( 94) , hvor = 147.6 p = ppois(94,147.6) = 1.54 10 -6 b) Find det hele tal m for hvilket P X m( ) m = qpois( , )
Eksempel: Lad X være Poissonfordelt med = 147.6.
Find det hele tal m for hvilket P X( m)0 95. m = qpois(0.95, 147.6 ) =168 Hypergeometrisk fordeling:
Lad X være hyprgeometrisk fordelt h(N,M,n) a) P(X=x) =dhypgeo(x,M, N-M,n)
phypgeo(x,M,N-M,n) P X( x)
3) Gennemsnit, varians og spredning
Find gennemsnit , varians og spredning af tallene 1, 3, 4, 8
Opret en søjlematrix v:=
1 3 4 8
Vælg fra værktøjslinie f x( )\ Category: Statistics \ Function Name: eksempelvis mean Eksempel : Gennemsnit: mean (v) =4 Mean({1,3,4,8}) = 4
Varians: Var(v) = 8.667 Spredning: Stdev (v) = 2.944
APPENDIX
n N ≤ 1
10
M N
p≤ 1 10
1 10
9
10 5 5
< p< ∧ ≤n p⋅ ≤n−
APPENDIX . Oversigt over approksimationer.
1) Når n og benyttes, at .
N > 1 10
M N ≤ 1
10 h N M n( , , )= h N n M( , , )
2) For p≥ 9 benyttes, i stedet for at tælle Xgammel = “antal af successer”, så at tælle X = antal fiaskoer dvs.
10
og .
p=1− pgammel X= n− Xgammel
3) Husk heltalskorrektion ved approksimation med normalfordeling. (se næste side)
APPENDIX
Fig. 1. Heltalskorrektion
Approksimation af binomialfordeling til normalfordeling.
Det kan vises, at tæthedsfunktionen for binomialfordelingen b (n, p) nærmer sig ubegrænset til normalfordelingen
, hvor og , når n vokser ubegrænset1) .
n( , )µ σ µ =n p⋅ σ = n p⋅ ⋅(1−p)
Approksimation af en binomialfordeling med en normalfor-deling anses, når 1 i praksis for at være
tilfreds-10 9
<p<10
stillende, såfremt n p⋅ ≥5 (og n⋅(1− p)≥5).
Da binomialfordelingen kun antager heltalsværdier, medens en normalfordeling kan antage alle værdier på talaksen, svarer hvert helt tal ved binomialfordelingen til et interval af længden 1 ved normalfordelingen. På figur 1 er derfor tegnet en firkant, der har bredden 1, og hvis højde er udregnet ved binomialfordelingen. Arealet P X( =4)
under normalfordelingskurven fra x = 3.5 til x = 4,5 er med tilnærmelse lig firkantens areal. Man siger, at man ved approksimationen må heltalskorrigere (korrigeres for kontinuitet).
Ved approksimationen benyttes derfor følgende anførte formler, gældende for en binomialfordelt variabel X fordelt
b (n, p), hvor 1 og .
10 9
≤p≤10 5≤n p⋅ ≤n−5
Eksempel 7.13: Approksimation af binomialfordeling med normalfordeling.
En kunde til de i eksempel 2.3 producerede plastikkasser køber kasserne i partier på 2000. Kunden godkender et parti efter en stikprøvekontrol, hvor der udtages 100 kasser. Hvis antallet af defekte kasser i stikprøven højst er 14 godkendes hele partiet. I modsat fald kasseres partiet.
Hvor stor er sandsynligheden for at et parti bliver godkendt, hvis der er 300 defekte kasser i hele partiet på de 2000.
Løsning:
Lad X være antallet af defekte kasser i stikprøven. Vi ønsker at udregne P X( ≤14). Umiddelbart er X hypergeometrisk fordelt med N = 2000, M = 300, og n = 100.
Da stikprøvestørrelsen er lille n kan fordelingen af X umiddelbart approksimeres med N = <
binomialfordelingen b (100, p), hvor p M . Dette giver ved benyttelse af en lommeregner som
= N = 300 = 2000 015. TI-89 at P X( ≤14) = 45.72%.
Idet n p⋅ =15 5> , kan i stedet for approksimeres med normalfordelingen med µ=15ogσ = 15 0 85⋅ . =3 57. . Ved hjælp af denne approksimation kan vi beregne:
normCdf( , 14.5, 15, 3.57) = 44.43%
P X( ≤14)= − ∞
Det ses, at der er ca. 1.5 % afvigelse, hvilket normalt ingen betydning har.
1) Matematisk formulering: Når X er fordelt b(n, p), vil for den tilsvarende normerede variabel
Y X n p gælde, at for ethvert tal y.
= − ⋅
P Y( ≤y)→Φ( )y
Facitliste
FACITLISTE
KAPITEL 2 2.1 -2.2 -2.3
2.4 (1) - (2) ca 24%
2.5 (1) - (2) ca 0.052 2.6 (1) - (2) ca 13%
2.7 (1) - (2) 24.8 24.5 2.8 (1) - (2) (3) -KAPITEL 4
4.1 (1) 0.7734 0.0548 0.1718 (2) 0.7480
4.2 (1) 69.15% (2) 10.88% (3) 112.2 (4) 117.3 6.535 4.3 (1) 86.64% (2) 0.008 (3) 0.020
4.4 (1) 5.94% (2) 27.71% (3) [783.51; 816.49]
4.5 (1) 9.5 1.265 (2) 12.45 (3) 2.41%
4.6 (1) 92.8%
4.7 (1) 97.71% (2) 25.45 4.8 (1) 65 0.4 (2) 77.34%
KAPITEL 5
5.1 (1) 12.13 0.6783 (2) [11.65 ; 12.61] (3) [10.52 ; 13.74] (4) [11.73 ; 12.53]
5.2 (1) 2259.92 35.569 (2) [2237 ; 2283] (3) [2178 ; 2341]
5.3 (1) 74.0362 0.00124 (2) [74.035; 74.037]
5.4 (1) 750.2 (2) [740.1 ; 760.3] (3) 19.13 (4) [14.0 ; 30.2]
5.5 (1) 7.83 0.363 (2) [7.45 ; 8.22] (3) 53 5.6 [25.20 ; 60.39]
5.7 [0.00083 ; 0.00231]
5.8 (a) [4.23 ; 4.29] (b) 22 (c ) [4.16 ; 4.36] (d) [0.028 ; 0.076]
5.9 (1) [0.965 ; 1.111] (2) [0.0263; 0.1714]
KAPITEL 6
6.1 (1) nej P-værdi = 2.27%
6.2 ja 3.45% (2) 58.0 (3) [55.84; 60.16]
6.3 (1) 84.47 6.85 (2) ja P-værdi = 0.44% (3) [81.27 ; 87.67] (4) 25.7%
6.4 (a)nej P-værdi = 12.1% (b) [7.93 ; 8.49 ] 6.5 (a) ja P-værdi = 0.157% (b) [24.07 ; 35.56]
6.6 nej P-værdi = 6.45%
6.7 (1) ja, P-værdi = 0.012 (2) 0.987 (3) [0.68 ; 1.80 ] 6.8 ja, P-værdi =
18 10 .
96.9 (1) 19.5 (2) nej, P-værdi =0.1% , (eller P-værdi =0.135%) 6.10 (1) 12 (2) ja P-værdi = 0.48 (3) nej
137
Facitliste
6.11 (1) 24 (2) ja P-værdi = 0.16% (3) nej [2.59 ; 2.67]
6.12 (1) 26 (2) ja P-værdi = 2 5 10. 13 (3) ja KAPITEL 7
7.1 P - værdi = 0.1044
7.2 (1) P - værdi = 0.001 (2) [0.69 ; 3.13]
7.3 P - værdi = 0.0204
7.4 (1) P - værdi = 0.0714 (2) P - værdi = 0.401 7.5 (1) 18 (2) P - værdi = 0.00017 , [11.9 ; 15.0]
7.6 P - værdi = 0.589 7.7 P - værdi = 0.1398 7.8 (1) nej P-værdi =29.9%
7.9 (1) nej, P-værdi =9.85% (2) [0.22 ;7.28 ] 7.10 (1) - (2) Ja, P-værdi =3.63%
KAPITEL 8
8.1 0.1 0.8 0.2 0.7 8.2 (1) 0.9134 (2) 0.9678
8.3 (1) 8.75% (2) 38.75% (3) 41.25% (4)11.25%
8.4 (1) 6.4% (2) 78.4% (3) 7.2%
8.5 (a) 30.24% (b) 0.24% (c ) 99.76% (d) 4.04% (e) 44.04% (f) 21.44%
8.6 1.283 1012 8.7 (a) - (b) 736 8.8 (a) 6 (b) 24 8.9 (a) 100 /b) 2400 8.10 60
8.11 (1) 27.1% 36.0% 9.756% (2) 53.34% (3) 49.20%
8.12 340
8.13 (1) 5 (2) 9 8.14 30.24%
8.15 9 10 7 KAPITEL 9
9.1 (1) 41.3% 2)- 3) 0.6
9.2 (A) 0.018% (B) 1.29% ( C) 38.24%
9.3 44.57%
9.4 (1) ja (2) 49.73%
9.5 (1) 17.68% (2) 59.28%
9.6 2.58%
9.7 5.83%
9.8 5.6%
9.9 94.9%
9.10 40.33%
9.11 13%
9.12 nej, P-værdi =0.08%
Facitliste
9.13 (1) 0.9% (2) nej
9.14 (1) ja, P-værdi = 2.53% (2) 0.12 (3) [0.056 ; 0.184]
9.15 ja p = 0.43%
9.16 (1) 0.108 (2) [0.089 ; 0.127]
9.17 [0.799 ; 0.847]
9.18 1522 9.19 77.86%
9.20 (1) 7.94% (2) 11.8%
9.21 (1) (a) 60.6% (b) 91.6% (c) 6.2% (2) 4.4%
9.22 (1) 30.1% (2) 87.9% (3) 4 9.23 50.37%
9.24 (1) 15 (2) 81.9%
9.25 75.3%
9.26 6.56%
9.27 92.2%
9.28 44.6%
9.29 (1) nej P-værdi = 7.84% (2) 100.8 (4) [85.56 ; 116.04]
9.30 (1) 4.68 (2) [4.47 ; 4.89] (3) 69.44
9.31 (1a) 11 (1b) [4.5 ; 17.5] (2a) 1.1 (2b) [0.45 ; 1.75]
9.32 (1) 0.539% (2) 0.119%
9.33 7.31%
9.34 0.188%
KAPITEL 10
10.1 (1) 2.90 (2) 14.6% (3) 16.98
10.2 (1) 77.88% (2) 10.45% (3) 77.88% (4) 9.48%
10.3 1
10.4 (1) 79.8% (2) 99.33% (3) 22.8 (4) 14 KAPITEL 11
11.1.1 (a1) - (a2) - (a3) nej (a4) 2.3 1.8 1.345 1.470 (a5) 12.6 (b1) 2.2 1.5 1.316 1.5811
11.1.2 (a6) 0.06 0.0304 (b2) 0.6667 0.3203 11.1.3 (a7) 52 15.52 (b3) 53.33 17.51
11.2.1 (a1) - (a2) nej (a3) 0.9 0.5 0.830 0.5 (a4) 0.9707 (b1) 0.6 0.6 0.843 0.516
11.2.2 (a5) 0.15 0.36 (b2) 0.2667 0.6124 11.2.3 (a6) 15300 3716.18 (b3) 15800 4131.18
11.3.1 (a1) - (a2) nej a3) 4.2 3.2 1.4 0.9798 (a4) 0.625 (b1) 4 3.2 1.633 1.033 11.3.2 (a5) 0.16 0.0342 (b2) 0.4444 0.2635
11.3.3 (a6) 316 44.36 (b3) 300 28.28 11.4.1 178.33 71.833 11.428 10,870 11.4.2 100.97 0.8128
11.4.3 139.13 2.089 11.5 4.6344
139
Facitliste
11.6 3.559 11.7 3.3466
Facitliste
for linearkomb. af normalf. variable 25, 30 alternativ hypotese 53
approksimation 99
binomial til normalfordeling 135 binomial til Poissonfordeling 135
hypergeometrisk til binomialford. 95, 135 Poisson til normalfordeling 135 chi i anden fordeling 44
D eksponential- 110 hypergeometrisk- 86
kontinuert variabel 20 foreningsmængde 75
generaliseret hypergeometrisk ford. 98 gennemsnit 7, 27, 34
Stikord
konfidensinterval 35, 37 , 39, 43, 44 konfidensinterval
1 normalfordelt variabel 35, 37, 39, 43, 44 2 normalfordelte variable , differens 67, 71 binomialfordeling 93, 100
Poissonfordeling 98, 101 kontinuert stokastisk variabel 17 korrelationskoefficient 115, 118 kovarians 115, 118
observationer, parvise 69 opgaver kapitel
relativ usikkerhed 23 repræsentativ stikprøve 33 S
SAK 10
Facitliste Stikord
sandsynlighed 16, 75 additionssætning 76
af middelværdi 48, 58 af spredning 54, 60
uafhængige stokastiske variable 15
udfald 15
diskret variabel 16, 86 kontinuert variabel 19 variationsbredde 5