10 ANDRE KONTINUERTE FORDELINGER
10.4 Weibullfordelingen
Hvis komponenterne i et elektronisk apparat ikke “slides”, dvs. den fremtidige levetid ikke afhænger af den foregående tid, er som nævnt i afsnit 10.3 eksponentialfordelingen velegnet som model for apparatets levetid.
Hvis derimod de pågældende komponenters eventuelle svigten afhænger af den forløbne tid, kan man ofte med fordel benytte den i det følgende nævnte Weibullfordeling som approksimativ model for apparatets levetid (model for apparatets pålidelighed).
Det kan vises, at Weibullfordelingen wei k( , )
µ
har middelværdien E X( )= µ⋅Γkk+1 1)Det ses, at Weibullfordelingen kan opfattes som en generalisation af eksponentialfordelingen, idet wei( , )1µ =exp( )µ .
Såfremt levetiderne for komponenter i et apparat aftager jo længere tid apparatet har været i funktion (på grund af slid), kan man benytte en Weibullfordeling med k > 1 som approksimativ model for apparatets levetid.
DEFINITION af Weibulfordeling. Lad k og µ være positive tal. Sandsynlighedsfordelingen for en kontinuert stokastisk variabel X med tæthedsfunktionen f ( x ) bestemt ved
f x
1) Gammafunktionen er defineret i “Supplement til statistiske grundbegreber”
10.6 Den 2-dimensionale normalfordeling
Indenfor det biokemiske eller biologiske område (forsøgsdyrs reaktionstid, cellevækst m.v.) er den stokastiske variabel X ikke normalfordelt, men hvis man foretager en logaritmisk transformation Y = lnX er Y (approksimativt) normalfordelt.
Man siger så, at X er logaritmisk normalfordelt.
Tæthedsfunktionen for X er bestemt ved f x for x > 0.
Nedenfor er tegnet en logaritmisk normalfordeling med middelværdi 8 og spredning 5.
10.6 DEN 2-DIMENSIONALE NORMALFORDELING
Flerdimensionale fordelinger vil blive omtalt nærmere i kapitel 11. Her nævnes uden forklaring et eksempel herpå.
DEFINITION af 2-dimensional normalfordeling Lad µ µ1, 2 være reelle tal og σ1,σ2 være positive tal. Sandsynlighedsfordelingen for 2-dimensional kontinuert stokastisk variabel (X1,X2) med tæthedsfunktion bestemt ved
f x e
kaldes den 2-dimensionale normalfordeling med parametrene µ µ1, 2,σ1og σ2.
Det kan vises, at E X( 1)=µ1, E X( 2)=µ2,
, og
σ(X1)=σ1 σ(X2)=σ2 ρ(X1,X2)=ρ ( defineres i kapitel 9).
Grafen ses overfor.
Andre kontinuerte fordelinger
OPGAVER
Opgave 10.1
På et betalingsnummer måltes man i tidsrummet fra kl 20 til 22 tiden t (antal minutter) mellem på hinanden følgende telefonopkald. Følgende resultater fandtes:
Beliggenhed af t ]0;1] ]1;2] ]2;3] ]3;4] ]4;5] ]5;6] ]6;7] ]7;8] ]8;9] ]9;10] ]10;∞[
Antal observationer 36 21 16 13 7 9 6 1 2 6 0
Det antages, at antallet N af telefonopkald til nummeret er Poissonfordelt. Lad T være tiden mellem to opkald.
1) Angiv fordelingsfunktionen for T, og giv et estimat for middelværdien µ.
Vink: Antage, at for alle observationer i et interval er tidsrummet mellem observationerne intervallets midterværdi.
2) På baggrund af den i spørgsmål 1 fundne estimat for µ, ønskes bestemt P(2<T≤3). 3) Af tabellen ses, at i intervallet ]2; 3] forekommer i alt 16 observationer. Angiv hvor mange
observationer man må forvente, ud fra resultatet i spørgsmål 2.
Opgave 10.2
Om en bestemt type elektriske komponenter vides, at deres levetider er eksponentialfordelte med en middellevetid på 800 timer.
1) Find sandsynligheden for, at en komponent holder mindst 200 timer.
2) Find sandsynligheden for, at en komponent holder mellem 600 og 800 timer.
3) En komponent har holdt i 900 timer. Find sandsynligheden for, at den kan holde i mindst 200 timer mere.
4) I et elektrisk system indgår netop én komponent af denne type. Hver gang komponenten svigter, udskiftes den øjeblikkeligt med en ny komponent af samme type. Find sandsynligheden for, at komponenten udskiftes 12 gange i løbet af 8000 timer.
Opgave 10.3
Antag, at levetiderne for en bestemt slags elektroniske komponenter er uafhængige og alle er eksponentialfordelt
med en middellevetid på 3 (år). Betragt et delsystem bestående af 3 sådanne komponenter i seriekobling:(en seriekobling ophører at fungere, når én af komponenterne ophører at fungere).
Bestem middellevetiden for et sådant system.
Opgave 10.4
Nedbrydningstiden i den menneskelige organisme for et givet kvantum af et bestemt stof antages at være eksponentialfordelt med middelværdien 5 timer.
Ved et forsøg indsprøjtes stoffet samtidig i 10 patienter.
1) Beregn sandsynligheden (afrundet til et helt antal procent) for, at stoffet hos en tilfældig valgt patient vil være nedbrudt efter 8 timers forløb.
2) Beregn sandsynligheden for, at stoffet efter 8 timers forløb vil være nedbrudt hos mindst 5 af patienterne.
3) Efter hvor mange timers forløb vil der være ca. 90% sandsynlighed for, at stoffet er nedbrudt hos samtlige 10 patienter?
4) Hvor mange patienter skal indgå i en ny undersøgelse, hvis der skal være ca. 95%
sandsynlighed for, at der er mindst en patient, hvis organisme efter 8 timers forløb endnu ikke har nedbrudt stoffet?
11.1 Indledning
X1 X2
150 160 170 180 190 200 45
150 160 170 180 190 200 45
150 160 170 180 190 200 14
11 FLERDIMENSIONAL STOKASTISK VARIABEL
ESSENS
Kovariansen
V X X (
i,
j) = E ( ( X
i− µ
1) ( ⋅ X
2− µ
2) )
er et mål for to variables tendens til at variere i takt med hinanden (samvarians). Kovariansen er f.eks. positiv(negativ), når afvigelsen har en tendens til at være positivt (negativt) proportional med afvigelsen . ErXi −
µ
i Xj−µjog statistisk uafhængige, bliver kovariansen 0 (men man kan ikke slutte den anden vej).
X
i XjKorrelationskoefficienten ρ er normeret , så .
( , ) (σ σ, )
Poolet estimat s f s f s f s med frihedsgrader benyttes,
f f f
Flerdimensional statistisk variabel naturligt at samle dem i et ordnet sæt , som kaldes en k-dimensional stokastisk variabel.
r
X = (X1,X2,...,Xk) Eksempelvis:
* Et levnedsmiddel kan af en tilfældig udtaget forbruger bedømmes ved en karakter X1 for smagen og en karakter X2 for lugten. Så er Xr = (X X1, 2)= (Smag, Lugt) en 2-dimensional stokastisk variabel.
* Et tilfældigt eksperiment går ud på at udtage en tilfældig person og måle vedkommendes højde X1 og masse
. Så er en 2-dimensional stokastisk variabel.
X2 Xr = (X1,X2)= (Højde, Masse) på rød terning, Antal øjne op på hvid terning) en 2-dimensional stokastisk variabel.
For hver af de 1-dimensionale stokastiske variable X X1, 2,...,Xk har vi defineret:
* Fordelingsfunktioner F F1, 2,...,Fk:
og når de er kontinuerte variable:
, , . . . , . og når de er kontinuerte variable:
11.1 Indledning
Af definitionen på middelværdi følger linearitetsreglen:
( ) ( ) ( )
.E a g X⋅ ( i)+b h X⋅ ( i) = a E g X⋅ ( i) +b E h X⋅ ( i)
For en k-dimensional stokastisk variabel definerer vi analogt:
r
og når de er kontinuerte variable:
( )
En stikprøve af størrelsen n på en stokastisk variabel defineres somr
X = (X1,X2,...,Xk)
( ) ( )
r r r
X X1, 2,...,Xn = (X11,X21,...,Xk1),(X12,X22,...,Xk2),...,(X1n,X2n,...,Xkn)
hvor er statistisk uafhængige variable, der hver har samme fordeling som .
r r r
X X1, 2,...,Xn
r X
Eksempel 11.1. 2-dimensional stokastisk variabel.
Et levnedsmiddel kan af en tilfældig forbruger bedømmes ved en karakterX1 for smagen og en karakter X2 for lugten. KarakterenX1 kan antage værdierne 0, 1 og 2, mensX2 kun kan antage værdierne 0 og 2.
b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a3) .
Flerdimensional stokastisk variabel LØSNING:
a1) Ved summation ned gennem de lodrette søjler i tabellen for tæthedsfunktionen
fås den 1-dimensionale tæthedsfunktion :
f x x( ,1 2)≡ P X( 1= x1∧ X2 = x2) f x1( )1 = P X( 1= x1)
, , .
f1( )0 = 0 2 0 1. + . = 0 3. f1( )1 = 0 1 0 2. + . = 0 3. f1( )2 =01 0 3. + . = 0 4.
Ved summation hen gennem de vandrette rækker i tabellen for tæthedsfunktionen f x x( 1, 2) fås analogt den 1-dimensionale tæthedsfunktion f2(x2):
, .
f2( )0 =0 2 01 0 1. + . + . = 0 4. f2( )2 =0 1 0 2 0 3. + . + . =0 6.
a2) De variable X1 og X2 er statistisk uafhængige, hvis og kun hvis f x x( ,1 2)= f x1( )1 ⋅ f2(x2)for alle værdier af ( ,x x1 2) i definitionsmængden. Men da f.eks. f1( )0 ⋅ f2( )0 = 0 3 0 4. ⋅ . =012. er forskellig fra
, er og ikke statistisk uafhængige.
f( , )0 0 = 0 2. X1 X2
b1) Stikprøvens x1-værdier 1, 0, 2, 2, 1, 2, 0, 2, 0, 2 kan indtastes på en lommeregner, der finder gennemsnittet og standardafvigelsen som tilnærmelser til middelværdi og spredning for . Man finder:
x1
s
1 µ1 σ1 X1Det ses, at estimaterne har en vis lighed med de eksakte værdier i spørgsmål a3).
11.2 KOVARIANS OG KORRELATIONSKOEFFICIENT
Vi har omtalt, at hver stokastisk variabel har en varians. Men et par variable X1 og X2 kan have en tendens til at variere i overensstemmelse med hinanden (samvarians), således at afvigelserne X1−µ1 og X2−µ2 overvejende har samme fortegn (positiv korrelation) eller overvejende har modsat fortegn (negativ korrelation). Eksempelvis kan en høj forekomst af ét vitamin i et levnedsmiddel ofte være ledsaget af en høj forekomst af et andet vitamin (positiv korrelation).
Og studerendes højde og masse kan også have en positiv korrelation.
Vi betragter igen en k-dimensional stokastisk variabel . For et par af variable og r
X= (X1,X2,...,Xk) Xi Xj
defineres kovariansen (“samvariansen”)
( )
V X( i,Xj)≡E (Xi −µi) (⋅ Xj −µj)
(den giver jo et vist mål for, om afvigelserne Xi − µi og Xj−µj i middel har samme fortegn eller modsat fortegn).
Sættes i = j, fås V X X( i, i)= E
(
(Xi−µi)2)
, som er identisk med variansen V X( i) for variablen Xi11.1 Indledning
Man kan vise (se nedenfor), at V X( i,Xj)=E X
(
i⋅Xj)
−µi⋅µj, som for i = j giver V X( i)=E X(
i2)
−µi2. Bevis:( )
.V X X( i, j)≡ E (Xi−µi) (⋅ Xj−µj) = E X X( i j−µiXj− Xiµj+ µ µi j) Anvendes linearitetsreglen kan sidste led omformes:
= E X X( i j)−µiE X( j)− E X( i)µj +µ µi j = E X X( i j)−µ µi j −µ µi j +µ µi j=E X X( i j)−µ µi j
For bedre at kunne vurdere hvor meget de variable varierer i “takt” med hinanden, divideres kovariansen med spredningerne, så man får den såkaldte korrelationskoefficient:
ρ Da dette andengradspolynomium i
λ
aldrig er negativt, kan diskriminanten ikke være positiv, dvs.( ) ( )
. Man kan (som det ses nedenfor) vise, atog stat. uafhængige
Estimater for kovarians, varians og korrelationskoefficient
Ud fra en stikprøve (x y1, 1), (x2,y2), . . ., (xn,yn) kan man beregne
( SAP = “Sum af Afvigelsers Produkter” , SAK = “Sum af Afvigelsers Kvadrater” ) og heraf danne estimater for kovarians, varianser og korrelationskoefficient:
kovarians: V X Y SAP og varianser: ,
Flerdimensional stokastisk variabel
Det kan således vises (for enhver fordelingstype), at
, ,
Altså fås ved hjælp af linearitetsreglen:
( ) ( )
Som nævnt er SAK en forkortelse for “Sum af Afvigelsers Kvadrater”. De afvigelser der tænkes på er de n differenser . De har summen 0, så når n - 1 af dem er kendt, er den sidste fastlagt. Da SAK således X1− X X, 2− X,...,Xn− X
kun er baseret på n - 1 uafhængige differenser, siger man, at SAK har f = n - 1 frihedsgrader. Det er også antallet af frihedsgrader der optræder i estimatet for varians: s SAK
f
X 2=
Ofte har man taget k stikprøver på variable med samme varians σ2, så vi får k uafhængige estimater for den samme varians σ2:
og det er da fordelagtigt at forene dem i et såkaldt fællesestimat eller poolet estimat:
s f s f s f s .
Det ses, at spool2 har den rigtige middelværdi σ2, idet linearitetsreglen giver .
11.3 Linearkombination
Eksempel 11.2. Kovarians. Korrelationskoefficient.
Vi betragter igen den 2-dimensionale fordeling fra eksempel 11.1.
a5) Find kovariansen og korrelationskoefficienten.
b2) Benyt stikprøven til at finde estimater for kovariansen og korrelationskoefficienten.
LØSNING:
a5) Idet vi i eksempel 11.1 har fundet µ1=11. ,µ2 =12. , σ = 0 69. og σ = 0 96. , finder vi nu kovariansen og korrelationskoefficienten :
V X( 1,X2) ρ(X1,X2)
Det ses, at estimaterne har en vis lighed med de eksakte værdier i spørgsmål a5).
11.3 LINEARKOMBINATION
Vi bruger ofte stikprøven til at danne gennemsnittet X X X X
n nX
Ved en linearkombination L for en k-dimensional stokastisk variabel forstås et udtryk af r
X =(X1,X2,...,Xk) formen
, hvor er konstanter.
L= a0+a X1 1+a X2 2+...+a Xk k a a a0, 2, 3,...,ak For middelværdien af L giver linearitetsreglen:
E L( )=a0+a E X1 ( 1)+a E X2 ( 2) ...+ +a E Xk ( k).
For variansen af en linearkombination L gælder kvadratreglen:
V L a V X a V X ak V Xk a a V Xi j i Xj
Flerdimensional stokastisk variabel
c) V X (X’erne statistisk uafhængige)
n V X stikprøvestørrelsen n. For at få et gennemsnit med en 10 gange mindre spredning, skal stikprøven altså gøres 100 gange større!
Bevis for kvadratreglen. Vi finder
( )
( )
Eksempel 11.3. Linearkombination af stokastiske variable.
Et levnedsmiddel leveres i poser. Lad X1 og X2 [mg/kg] betegne koncentrationerne af to stoffer A og B i en
Opgaver til kapitel 11
OPGAVER
Opgave 11.1.1 (2-dimensional stokastisk variabel)
Et spil i et casino går ud på at trække en tilfældig seddel fra en urne (og lægge sedlen tilbage igen). Urnen indeholder 10 sedler, og på hver seddel står 2 tal (X1,X2):
(1,0) (3,0) (4,0)
(1,0) (3,3) (4,3)
(1,3) (4,3)
(1,3) (1,3)
a1) Find den 2-dimensionale tæthedsfunktionf x x( 1, 2):
a2) Find de 1-dimensionale tæthedsfunktioner f x1( 1)og f2(x2). a3) Er X1 og X2 statistisk uafhængige ?
a4) Find middelværdierne µ1= E X( 1)og µ2 = E X( 2)samt spredningerne σ1(X1) og σ2(X2). a5) Find middelværdien E X
(
1 X2)
.⋅ 2
b) Antag, at man i stedet kender en stikprøve på (X1,X2):
(1,3), (1,0), (1,0), (4,3), (3,0), (4,3), (1,0), (3,0), (3,3 ), (1,3).
b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a4).
Opgave 11.1.2 (kovarians, korrelationskoefficient)
a6) Find kovariansen V X( 1,X2) og korrelationskoefficienten ρ(X1,X2). b2) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a6).
Opgave 11.1.3 (linearkombination)
For det i opgave 11.1.1 og 11.1.2 omtalte casino aftales et spil, hvor gevinsten er G= 20 10+ X1+5X2.
a7) Find gevinstens middelværdi E G( ) og spredningσ( )G .
b3) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a7).
Opgave 11.2.1 (2-dimensional stokastisk variabel)
Under en produktion kan der optræde fejl. Lad (X1,X2)=( Antal gange der optræder fejl af type 1, Antal gange der optræder fejl af type 2) i en tilfældig produktion. VariablenX1 kan antage værdierne 0, 1 og 2, mensX2 kun kan antage værdierne 0 og 1.
a) Antag, at man teoretisk kender tæthedsfunktionenf x x( 1, 2):
f x x( 1, 2) x1
0 1 2
x2 0 0.3 0.1 0.1
1 0.1 0.2 0.2
a1) Find de 1-dimensionale tæthedsfunktioner f x1( 1)og f2(x2). a2) Er X1 og X2 statistisk uafhængige ?
a3) Find middelværdierne µ1= E X( 1)og µ2 = E X( 2)samt spredningerne σ1(X1) og σ2(X2). a4) Find middelværdien E
(
X1+ X2)
.b) Antag, at man i stedet kender en stikprøve på (X1,X2):
(0,1), (0,0), (1,1), (1,1), (0,0), (0,0), (0,1), (2,1), (0,0 ), (2,1).
b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a3).
Opgave 11.2.2 (kovarians, korrelationskoefficient) Vi betragter igen produktionsprocessen fra opgave 11.2.1.
a5) Find kovariansen V X( 1,X2) og korrelationskoefficienten ρ(X1,X2). b2) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a5).
Flerdimensional stokastisk variabel Opgave 11.2.3 (linearkombination)
For den i opgave 11.2.1 og 11.2.2 omtalte produktionsproces er fortjenesten F= 20000−3000X1−4000X2.
a6) Find fortjenestens middelværdi E F( ) og spredning σ( )F .
b3) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a6).
Opgave 11.3.1 (2-dimensional stokastisk variabel)
År 4001. En sonde er vendt hjem med oplysninger om individer på en fremmed planet. De kan have 2, 4 eller 6 øjne, og 2 eller 4 ører. Lad (X1,X2)= (Antal øjne, Antal ører) for et tilfældigt udtaget individ på planeten.
a) Professor Cosmussen har teoretisk opstillet tæthedsfunktionenf x x( 1, 2): a4) Find middelværdien E .
X X
b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a3).
Opgave 11.3.2 (kovarians, korrelationskoefficient) Vi betragter igen individerne fra opgave 11.2.1.
a5) Find kovariansen V X( 1,X2) og korrelationskoefficienten ρ(X1,X2). b2) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a5).
Opgave 11.3.3 (linearkombination)
For de i opgave 11.3.1 og 11.3.2 omtalte individer har professor Cosmussen opstillet en formel for deres masse:
kg.
M = 200+20X1+10X2
a6) Find massens middelværdi E M( ) og spredning σ(M).
b3) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a6).
Opgave 11.4.1 (2-dimensional stokastisk variabel)
Lad (X1,X2)= ( Højde [cm], Masse [kg] ) af en tilfældigt udtaget studerende på 3. halvår.
Vi betragter igen de i opgave 11.4.1 og 11.4.2 omtalte studerende. En frugtavler har opstillet en formel for den timeløn, han vil give dem som frugtplukkere:
kroner/time.
L=100+0 3. X1−0 2. X2
Opgaver til kapitel 11 Opgave 11.5 (poolet estimat)
Koncentrationen af et stof A blev målt i 3 partier råvarer:
Råvare 1: 56, 60, 54, 49, 61 Råvare 2: 78, 73, 80
Råvare 3: 66, 62, 70, 72, 60
Det antages, at der er samme spredning i de 3 tilfælde. Find et estimat spool for spredningenσ. Opgave 11.6 (poolet estimat)
Koncentrationen af et stof A blev målt i 2 levnedsmidler:
Levnedsmiddel 1: 87, 89, 94, 86, 89, 95 Levnedsmiddel 2: 93, 99, 94, 91, 98 . Det antages, at der er samme spredning i de 2 tilfælde. Find et estimat spool for spredningen σ. Opgave 11.7 (poolet estimat)
Koncentrationen af et stof A blev målt i mælken fra 5 køer:
Ko 1: 44, 48, 46, 43, 45 Ko 2: 40, 38, 41 Ko 3: 43, 45, 42, 42 Ko 4: 36, 32 Ko 5: 50
Det antages, at der er samme spredning i de 5 tilfælde. Find et estimat spool for spredningen σ.
Statistiske beregninger på lommeregner og PC-er
STATISTISKE BEREGNINGER PÅ LOMMEREGNER TI89 SAMT PÅ PC-PROGRAMMERNE TI-Nspire, EXCEL, MAPLE OG MATHCAD
TI 89
1) Generelt:Beregning af sandsynlighedsfordelinger:
Metode 1 Vælg HOME\ CATALOG,, F3\ vælg den ønskede fordeling\ENTER
(tryk evt på “forbogstav” for hurtigt at komme til det ønskede navn).
Fordel: Hurtig ved beregning af sandsynligheder, såsom P(X < 0.87) da resultatet straks indsættes på HOME-linien.
Ulempe: Man skal huske parametrenes rækkefølge (de kan dog ses nederst på skærmen) Metode 2: Vælg APPS\ Stats/List\F5\vælg den ønskede fordeling\ENTER
Fordel: Der fremkommer nu en menu, som er næsten selvforklarende.
Ulempe:Skal resultatet ned på HOME-linien (man vil regne videre), bliver det lidt besværligt:
HOME, Var-Link\I StatsVar mappen markeres den ønskede størrelse, ENTER
Tal indlagt på liste Vælg APPS\ Stats/List\ indtast data i eksempelvis “list1"
Fordele og ulemper som under metode 2 ovenfor
Beregning af gennemsnit , spredning , middelværdi osv.
1) Hvis tal indlagt på liste 1
F4\ 1: 1-Var Stats , I menu sættes “List” til “List1" (Benyt evt. Var-Link til at finde List1) Udskriften består af en række statistiske størrelser.
2) Anvendes med få tal og kun ønsker beregning af en enkelt størrelse.
HOME\ MATH\6.Statistics\
Gennemsnit: Mean ({liste}) , Varians: Variance({liste}), Spredning: stdDev({liste}) Beregning af test
1) Hvis tal indlagt på liste(r)
F6\i menu vælg relevant test\ENTER\Data\ENTER\udfyld menu\ENTER
2) Oprindelige data ikke kendt, men kun middelværdi osv.
Som ovenfor, men nu vælges Stats fremfor Data
Beregning af konfidensintervaller 1) Hvis tal indlagt på liste(r)
F7\i menu vælg relevant konfidensinterval\ENTER\Data\ENTER\udfyld menu\ENTER
2) Oprindelige data ikke kendt, men kun middelværdi osv.
Som ovenfor, men nu vælges Stats fremfor Data
Oprette en “Folder”: VAR-Link\ F1\ 5: Create Folder\ Skriv navn på folder.
Vælg en mappe som den aktuelle mappe: MODE\ Current Folder\navn
Formål: Det kan være praktisk ikke at gemme alle sine resultater i MAIN.
TI89 2) Sandsynlighedsfordelinger.
Normalfordeling n(μ,σ)
a) pP a( X b), hvor a ,b,μ,σ er givne konstanter(a og b kunne evt. være 4): p = normcdf(a b, , , ) b) Find :xp P X( xp)p, hvor p, μ, σ er givne konstanter. xp=invNorm(p,μ,σ) t - fordeling. Lad T være t - fordelt med frihedsgradstallet f.
a) Find p = P(a # T # b), hvor a og b er givne konstanter.(a og b kunne evt. være 4): p = tCdf(a,b,f) b) Find t( ):f P T( t( ))f ( given konstant). t( )f invt( ,f ) χ2 - fordeling. Lad Q være χ2 - fordelt med frihedsgradstallet f.
a) Find , p P a Q b( ) hvor a og b er givne konstanter. p = chi2Cdf(a,b,f) b) Find fraktilen2( )f : P Q( 2( ))f ( given konstant). invChi2( ,f) Binomialfordeling. Lad X være binomialfordelt b(n,p)
Find P l( X m), hvor0 l m m n og l og m er hele tal. binomtCdf(n,p,l,m) Poissonfordeling. Lad X være Poissonfordelt p()
Find P l( X m), hvor0 l m og l og m er hele tal. poissCdf(,l,m) 3) Konfidensintervaller
Normalfordeling. 1 variabel
1) ukendt: F7\ 1: T-Interval (hvis oprindelige data ikke kendt så Stats ellers Data) 2) kendt: F7\ 1: Z-Interval (hvis oprindelige data ikke kendt så vælg Stats ellers Data) Normalfordeling. 2 variable
F7\ 4: 2-SampTint\ udfyld menu(se eksempel 7.1, parvis så eksempel 7.3) Binomialfordeling.
F7, 5: 1-Prop-ZInt (Kræver der kan approksimeres til normalfordeling) Poissonfordeling: findes ikke, så her må formel for konfidensinterval benyttes 4) Hypotesetest
Normalfordeling. 1 variabel
1) kendt: F6\ 1: Z-Test (hvis oprindelige data ikke kendt så Stats ellers Data) 2) ukendt: F6\ 1: T-Test (hvis oprindelige data ikke kendt så Stats ellers Data) Normalfordeling. 2 variable
F6\ 4: 2-SampTtest\ udfyld menu (se eksempel 7.1 eller 7.3) Binomialfordeling.
F7, 5: 1-Prop-ZTest (Kræver der kan approksimeres til normalfordeling) Poissonfordeling: findes ikke, så her må formel for konfidensinterval benyttes
Statistiske beregninger på lommeregner og PC-er
TI-Nspire 1) Generelt:
Beregning af sandsynlighedsfordelinger:
Vælg Beregninger\Statistik\Fordelinger\ vælg den ønskede fordeling\udfyld menu\ENTER
Huskes fordelingens navn og parametrenes rækkefølge kan man skrive direkte Tal indlagt på liste Lister og regneark giv en liste et navn og indtal tal i listen Beregning af gennemsnit , spredning , middelværdi osv.
1) Hvis tal indlagt på liste
Lister og regneark giv en liste et navn og indtal tal i listen vælg statistik statistiske beregninger statistik med 1 variabel udfyld menuer Enter.
Blandt mange tal findes det ønskede
2) Anvendes med få tal og kun ønsker beregning af en enkelt størrelse.
Beregninger\statistik\listematematik\vælg
Middel: mean({liste}), Stikprøvevarians: varSamp({liste}), Standardafvigelse for stikprøve:
stDevSamp({liste})
Beregning af test 1) normal, 1 variabel
1) Lister og regneark udfyld liste (husk overskrift) Statistik t-test for 1 variabel menu:data udfyld menu ENTER
2) Oprindelige data ikke kendt, men kun middelværdi osv.
Som ovenfor, men nu vælges Stats fremfor Data
2) normal, 2 variable
1)Lister og regneark Udfyld lister med overskrift m1 og m2 Statistik t-test for 2 variable menu:data ok menu: List1: skriv m1 List 2: Skriv m2 “alternative Hyp” samlet: nej (hvis parvise observationer så ja vælg variabelreference ok
2) Oprindelige data ikke kendt, men kun middelværdi osv.
Som ovenfor, men nu vælges Stats fremfor Data
Beregning af konfidensintervaller
Som under test blot vælges nu konfidensintervaller
De konkrete beregninger af en given sandsynlighedsfordeling konfidensinterval eller test svarer til det der står under TI89
Excel
Excel
1) Generelt Forudsætninger.
Da ikke alle de anvendte statistiske funktioner er indbygget fra starten, skal man først vælge et tilføjelsesprogram:
I Excel 2003: Vælg “Funktioner”, “Tilføjelsesprogrammer”, marker “Problemløser”
I Excel 2007: Vælg “Excel-Office-knappen”, “Excel indstillinger (findes forneden)”, Tilføjelsesprogrammer”,
”Udfør”, ”marker Analysis toolpak, Analysis toolpak VBA, Problemløser”, “Installer”.
Inddata.
Vi vil i det følgende for kortheds skyld antage, at den første stikprøves værdier står i cellerne A1, A2, A3 . . . A10.
Kræves der flere variable vil den næste stå i cellerne B1, B2, B3 . . . B8, osv.
Man angiver “udskriftsområdet” eller “inputområdet” f.eks en søjle placere i cellerne A1:A10 ved a) at markere området A1 til A10
b) at skrive eksempelvis A1:A10
c) at give det et navn: Vælg “Indsæt” i Excel 2003: Navn i Excel 2007:Formler Definer i menu skriv søjlens navn og (nederst)A1:A10
Skrive , beregne og kopiere formler.
Vælg den celle hvor resultatet skal stå. Lad det være B1: På værktøjslinien foroven skriv = formel skrives ENTER Resultatet står nu i celle B1
Hvis selve formlen skal stå i en anden celle. Lad det være A1: Cursor placeres i B1 I formelfelt markeres formlen uden lighedstegn og man kopierer den (CTRL C)” ENTER (så formlen igen er beregnet i B1 Cursor over i A1 og paste (CTRL V)
Udskrive gitterlinier og række og kolonneoverskrifter
Excel 2003: Vælg Filer Sideopsætning Ark Marker gitterlinier marker række- og kolonneoverskrifter.
Excel 2007: Vælg Sidelayout Under“Gitterlinier” marker “Udskriv” Under “Overskrifter” marker “Udskriv”
2: Indsætte og tegne diagrammer Lagkage eller søjle: se eksempel 2.1 side 2 Kurve: se eksempel 2.4 side 4
Tegne histogram: se eksempel 2.5 side 6 3: Beregne statistiske størrelser og funktioner
Beregning af “Karakteristiske tal” (se evt. ekempel 2.9) Data indtastes i eksempelvis søjle A1 til A10
Excel 2003: Funktioner Dataanalyse Beskrivende statistik udfyld inputområde Resumestatistik Excel 2007: Data Dataanalyse Beskrivende statistik udfyld inputområde Resumestatistik Valg af statistiske størrelser (funktioner)
1) Vælg den celle hvor resultatet skal stå (eksempelvis A1).
2) På værktøjslinien foroven:
2a) Tryk på fx
2b) På den fremkommne menu vælges den ønskede funktion eksempelvis “NORMALFORDELING”
2c) Der fremkommer en menu med anvisning på, hvordan den skal udfyldes.
Gennemsnit, spredning, median, kvartil
Navnene anføres nedenunder, men den fremkomne menu gør det let at indsætte de rette parametre.
Gennemsnit = x MIDDEL(A1:A10) Spredning s = STDAFV (A1:A10)
Median m = MEDIAN(A1:A10) (= KVARTIL(A1:A10;2) ) 1. Kvartil = KVARTIL(A1:A10;1)
Statistiske beregninger på lommeregner og PC-er Fakultet, kombination, Permutation (se evt. eksempel 8.8)
Fakultet n! = FAKULTET(n) Eksempel: 5! =FAKULTET(5) = 120 Kombination K(n,p) = KOMBIN(n;p) Eksempel: K(5,3)==KOMBIN(5;3) = 10 Permutation P(n,p = PERMUT(n;p) Eksempel: P(5,3) = PERMUT(5;3) = 60 Normalfordeling.
Lad X være normalfordelt med middelværdi og spredning
1)P X( x)= NORMFORDELING(x ;; ;1) 2)P X( x)= 1 - NORMFORDELING(x ;; ;1)
3)P a( X b) P X( b)P X( a)NORMFORDELING(b ;; ;1) -NORMFORDELING(a ;; ;1) Fraktil : xp P X( xp) p NORMINV(p;; )
Eksempel: u0 975. = NORMINV(0,975;0;1) = 1,959961 t - fordeling. (se evt. eksempel 5.3 side 44)
Lad T være t - fordelt med f frihedsgrader..
1) P T( t)= TFORDELING(abs(t); f ;1)
(bemærk: TFORDELING(abs(t); f ;1) udregner “øvre hale” af fordelingen)
2) P T( t)+P T( t)= TFORDELING(abs(t); f ;2) (udregner “halen” til begge sider)
Bemærk: Man må må udnytte symmetrien i t-fordelingen, for værdier mindre end 0 (svarende til < 0.5) Eksempel:
Lad T være t - fordelt med 12 frihedsgrader
1) P X( 1) =P X( 1)= TFORDELING(abs(-1);12;1) = 0,168525 2) t0 975. (12) = TINV(0,05;12) = 2,178813
= - TINV(0,05;12) = - 2,178813 t0 025. (12)
- fordeling. (se evt.eksempel 5,8 side 49)
2
Lad X være 2- fordelt med f frihedsgrader = CHIFORDELING(x;f) P X( x)
(bemærk: CHIFORDELING(x;f) udregner “øvre hale” af fordelingen) Fraktil
Hypergeometrisk fordeling (se evt. eksempel 9.2 side 91) Lad X være hypergeometrisk fordelt med parametrene N, M og n
= HYPGEOFORDELING(x ; n ; M ; N) P X( x)
Eksempel: Lad N = 600, M = 10 og n = 25
= HYPGEOFORDELING(1;25;10;600)+HYPGEOFORDELING(0;25;10;600) = 0,938876 P X( 1)
TI - 83 Binomialfordeling ( se evt. eksempel 9.5 side 96)
Lad X være binomialfordelt med parametrene n og p
= BINOMIALFORDELING(x ; n; p; 0) P X( x)
= BINOMIALFORDELING(x ; n; p; 1) P X( x)
Eksempel (jævnfør eksempel 72)
Lad X være binomialfordelt med n = 6 og p = 0.15
= BINOMIALFORDELING(3;6;0,15;0) = 0,041453 P X( 3)
= 1- =1 - BINOMIALFORDELING(2;6;0,15;1) = 0,047339 P X( 3) P X( 2)
Poissonfordeling (se evt. eksempel 9.10 side 102) Lad X være Poissonfordelt med middelværdien
= POISSON(x; ; 0) P X( x)
= POISSON(x; ; 1) P X( x)
Eksempel
Lad X være Poissonfordelt med middelværdien 10 P(X = 4) = POISSON(4; 10;0) = 0.018917
= 1 - POISSON(4;10;1) = 0,970747 P X( 4)
Eksponentialfordeling
Lad T være eksponentialfordelt med middelværdien. EKSPFORDELING(t,1/ ,1)
P T t( )
Eksempel:
Lad T være eksponentialfordelt med middelværdi =2 EKSPFORDELING(3;1/2;1) = 0,77687
P T( 3)
Konfidensintervaller
Konfidensinterval middelværdi for 1 normalfordelt variabel. kendt eksakt
Radius r i et 95% konfidensinterval for :x r x u (se evt. eksempel 5.2 side 42)
0 975. n r = KONFIDENSINTERVAL(0,05; , n).
Eksempel. Lad stikprøven have n =6 værdier, lad spredning = 0.25 og gennemsnit x =8 r =KONFIDENSINTERVAL(0,05;0,25;6). Resultat 0,200038
95% konfidensinterval: 8,00.200
Konfidensinterval for middelværdi for 1 normalfordelt variabel . ikke kendt eksakt se eksempel 5.4 side 45
Konfidensinterval for sandsynlighed p for 1 binomialfordelt variabel.
se eksempel 9.7 side 98 Hypotesetest
1 normalfordelt variabel
kendt eksakt se eksempel 6.1 side 55
ikke kendt eksakt se eksempel 6.3 side 57
2 normalfordelte variable 1) Ikke parvise observationer:
data givet: se Excel-program i eksempel 7.1 side 72 data ikke givet: se Excel-program i eksempel 7.2 side 73 2) Parvise observationer:
se Excel-program i eksempel 7.3 side 74 1 binomialfordelt variabel
se eksempel 9.5 side 96
Statistiske beregninger på lommeregner og PC-er MAPLE
Beregn gennemsnit og spredning af tallene 1 3 4 8
> with(stats):
data:=[1,3,4,8];
data := [1, 3, 4, 8]
> describe[mean](data);
4
> describe[standarddeviation[1]](data);
Beregne korrelationskoefficient for den i eksempel 9.2 nævnte stikprøve (1,2), (0,0), (2,2), (2,2), (1,0), (2,2), (0,2), (2,2), (0,2), (2,2) . Programudførelse:
> data1:=[1,0,2,2,1,2,0,2,0,2]; x- værdier
data1 := [1, 0, 2, 2, 1, 2, 0, 2, 0, 2] udskrift
> data2:=[2,0,2,2,0,2,2,2,2,2]; y-værdier
data2 := [2, 0, 2, 2, 0, 2, 2, 2, 2, 2] udskrift
> describe[linearcorrelation](data1,data2): evalf(");
.4014775343 resultat
Normalfordeling.
Find for n(113.3,5.6) P X( 116.1). Programudførelse:
> with(stats):
> with(statevalf):
> cdf[normald[113.3,5.6]](116.1);
Facit .6914624613 fordeling.
2
Find en tests P-værdi: P Q( 27.26) idet frihedsgradstallet er 19 (jævnfør eksempel 5.6) Programudførelse:
> with(stats):
> with(statevalf):
> 1-cdf[chisquare[19]](27.36);
Facit: .0965431211 t - fordeling.
Find en tests P-værdi: P T( -1.31) idet frihedsgradstallet er 14 (jævnfør eksempel 5.5) Programudførelse:
> with(stats):
> with(statevalf):
> cdf[studentst[14]](-1.31);
Facit: .1056420798
Find for binomialfordelingen b(100,0.3) P X( 35) Programudførelse:
> with(stats):
> with(statevalf):
> dcdf[binomiald[100,0.3]](35);
Facit: .8839213940
MATHCAD
MATHCAD 1) Generelt:
Sandsynlighedsfunktioner :
Skriv funktionens navn eller vælg fra (øverste) værktøjslinie
\Probability Density (dfunktionsnavn). Tæthedsfunktion ,
f x( ) P X( a)
\Probability Distribution (pfunktionsnavn). Fordelingsfunktion eller
f x( ) P X( a)
\Probability Distribution (qfunktionsnavn) Invers tæthedsfunktion: Find .
f x( ) P X( xp)p xp
Rækkefølgen af parametrene kan findes ved at placere cursor på navnet og trykke på tasten F1.
2) Sandsynlighedsfordelinger.
Normalfordeling n( , )
a) Find , pP a( X b) hvor a ,b, , er givne konstanter.
pnorm(b, ) - pnorm(a, ) pP a( X b )P X b( )P X( a) , , Eksempel: , p P X( 116. ) hvor113. , 5 p = pnorm(11.6, 11.3,5) = 0.524 b) Find :xp P X( xp)p, hvor p, , er givne konstanter. xp=qnorm(p, , )
Eksempel:P X( xp)0 7. ,hvor11 4, , 6 xp=qnorm(0.7,11.4,6) =14.55 t - fordeling.
Lad T være t - fordelt med frihedsgradstallet f.
a) Find , p P a T b( ) hvor a og b er givne konstanter.
pt(b,f) -pt(a,f) pP a( X b )P X b( )P X( a)
Eksempel: , p P T( 1 3. ) med f = 14 p = pt(-1.3,14) = 0.1073 b) Find t( ):f P T( t( ))f ( given konstant). t( )f = qt( ,f )
Eksempel: t0 975. (12) = qt (0.975,12) = 2.179
fordeling.
2
Lad Q være 2 fordelt med frihedsgradstallet f.
a) Find , p P a Q b( ) hvor a og b er givne konstanter. p = pchisq(b,f) - pshisq(a,f) Eksempel:Find , p P Q( 27 3. ) med f = 19 p 1 P Q( 27 3. )=1- pchisq(27.3,19) = 0.0979 b) Find fraktilen2(f ) : P Q( 2( ))f ( given konstant). 2( )f = qchisq( ,f )
Eksempel: 0 0252. ( )8 = qchisq(0.025,8) = 2.18
Binomialfordeling.
Lad X være binomialfordelt b(n,p) a) P(X=x) =dbinom(x,n,p)
pbinom(x,n,p) P X( x)
Eksempel :q = P(3 X 6), hvor n = 10 og p = 0.3
q = P X( 6)P X( 2) = pbinom(6,10, 0.3)-pbinom(2,10,0.3) = 0.6066 b) Find det hele tal m for hvilket P X m( ) m = qbinom(p, n, )
Eksempel: Lad X være binomialfordelt med p = 0.3 og n = 10.
Eksempel: Lad X være binomialfordelt med p = 0.3 og n = 10.