• Ingen resultater fundet

Weibullfordelingen

In document STATISTISKE GRUNDBEGREBER (Sider 118-0)

10 ANDRE KONTINUERTE FORDELINGER

10.4 Weibullfordelingen

Hvis komponenterne i et elektronisk apparat ikke “slides”, dvs. den fremtidige levetid ikke afhænger af den foregående tid, er som nævnt i afsnit 10.3 eksponentialfordelingen velegnet som model for apparatets levetid.

Hvis derimod de pågældende komponenters eventuelle svigten afhænger af den forløbne tid, kan man ofte med fordel benytte den i det følgende nævnte Weibullfordeling som approksimativ model for apparatets levetid (model for apparatets pålidelighed).

Det kan vises, at Weibullfordelingen wei k( , )

µ

har middelværdien E X( )= µΓkk+1 1)

Det ses, at Weibullfordelingen kan opfattes som en generalisation af eksponentialfordelingen, idet wei( , )1µ =exp( )µ .

Såfremt levetiderne for komponenter i et apparat aftager jo længere tid apparatet har været i funktion (på grund af slid), kan man benytte en Weibullfordeling med k > 1 som approksimativ model for apparatets levetid.

DEFINITION af Weibulfordeling. Lad k og µ være positive tal. Sandsynlighedsfordelingen for en kontinuert stokastisk variabel X med tæthedsfunktionen f ( x ) bestemt ved

f x

1) Gammafunktionen er defineret i “Supplement til statistiske grundbegreber”

10.6 Den 2-dimensionale normalfordeling

Indenfor det biokemiske eller biologiske område (forsøgsdyrs reaktionstid, cellevækst m.v.) er den stokastiske variabel X ikke normalfordelt, men hvis man foretager en logaritmisk transformation Y = lnX er Y (approksimativt) normalfordelt.

Man siger så, at X er logaritmisk normalfordelt.

Tæthedsfunktionen for X er bestemt ved f x for x > 0.

Nedenfor er tegnet en logaritmisk normalfordeling med middelværdi 8 og spredning 5.

10.6 DEN 2-DIMENSIONALE NORMALFORDELING

Flerdimensionale fordelinger vil blive omtalt nærmere i kapitel 11. Her nævnes uden forklaring et eksempel herpå.

DEFINITION af 2-dimensional normalfordeling Lad µ µ1, 2 være reelle tal og σ12 være positive tal. Sandsynlighedsfordelingen for 2-dimensional kontinuert stokastisk variabel (X1,X2) med tæthedsfunktion bestemt ved

f x e

kaldes den 2-dimensionale normalfordeling med parametrene µ µ1, 21og σ2.

Det kan vises, at E X( 1)=µ1, E X( 2)=µ2,

, og

σ(X1)=σ1 σ(X2)=σ2 ρ(X1,X2)=ρ ( defineres i kapitel 9).

Grafen ses overfor.

Andre kontinuerte fordelinger

OPGAVER

Opgave 10.1

På et betalingsnummer måltes man i tidsrummet fra kl 20 til 22 tiden t (antal minutter) mellem på hinanden følgende telefonopkald. Følgende resultater fandtes:

Beliggenhed af t ]0;1] ]1;2] ]2;3] ]3;4] ]4;5] ]5;6] ]6;7] ]7;8] ]8;9] ]9;10] ]10;∞[

Antal observationer 36 21 16 13 7 9 6 1 2 6 0

Det antages, at antallet N af telefonopkald til nummeret er Poissonfordelt. Lad T være tiden mellem to opkald.

1) Angiv fordelingsfunktionen for T, og giv et estimat for middelværdien µ.

Vink: Antage, at for alle observationer i et interval er tidsrummet mellem observationerne intervallets midterværdi.

2) På baggrund af den i spørgsmål 1 fundne estimat for µ, ønskes bestemt P(2<T≤3). 3) Af tabellen ses, at i intervallet ]2; 3] forekommer i alt 16 observationer. Angiv hvor mange

observationer man må forvente, ud fra resultatet i spørgsmål 2.

Opgave 10.2

Om en bestemt type elektriske komponenter vides, at deres levetider er eksponentialfordelte med en middellevetid på 800 timer.

1) Find sandsynligheden for, at en komponent holder mindst 200 timer.

2) Find sandsynligheden for, at en komponent holder mellem 600 og 800 timer.

3) En komponent har holdt i 900 timer. Find sandsynligheden for, at den kan holde i mindst 200 timer mere.

4) I et elektrisk system indgår netop én komponent af denne type. Hver gang komponenten svigter, udskiftes den øjeblikkeligt med en ny komponent af samme type. Find sandsynligheden for, at komponenten udskiftes 12 gange i løbet af 8000 timer.

Opgave 10.3

Antag, at levetiderne for en bestemt slags elektroniske komponenter er uafhængige og alle er eksponentialfordelt

med en middellevetid på 3 (år). Betragt et delsystem bestående af 3 sådanne komponenter i seriekobling:(en seriekobling ophører at fungere, når én af komponenterne ophører at fungere).

Bestem middellevetiden for et sådant system.

Opgave 10.4

Nedbrydningstiden i den menneskelige organisme for et givet kvantum af et bestemt stof antages at være eksponentialfordelt med middelværdien 5 timer.

Ved et forsøg indsprøjtes stoffet samtidig i 10 patienter.

1) Beregn sandsynligheden (afrundet til et helt antal procent) for, at stoffet hos en tilfældig valgt patient vil være nedbrudt efter 8 timers forløb.

2) Beregn sandsynligheden for, at stoffet efter 8 timers forløb vil være nedbrudt hos mindst 5 af patienterne.

3) Efter hvor mange timers forløb vil der være ca. 90% sandsynlighed for, at stoffet er nedbrudt hos samtlige 10 patienter?

4) Hvor mange patienter skal indgå i en ny undersøgelse, hvis der skal være ca. 95%

sandsynlighed for, at der er mindst en patient, hvis organisme efter 8 timers forløb endnu ikke har nedbrudt stoffet?

11.1 Indledning

X1 X2

150 160 170 180 190 200 45

150 160 170 180 190 200 45

150 160 170 180 190 200 14

11 FLERDIMENSIONAL STOKASTISK VARIABEL

ESSENS

Kovariansen

V X X (

i

,

j

) = E ( ( X

i

− µ

1

) ( ⋅ X

2

− µ

2

) )

er et mål for to variables tendens til at variere i takt med hinanden (samvarians). Kovariansen er f.eks. positiv(negativ), når afvigelsen har en tendens til at være positivt (negativt) proportional med afvigelsen . Er

Xi

µ

i Xj−µj

og statistisk uafhængige, bliver kovariansen 0 (men man kan ikke slutte den anden vej).

X

i Xj

Korrelationskoefficienten ρ er normeret , så .

( , ) (σ σ, )

Poolet estimat s f s f s f s med frihedsgrader benyttes,

f f f

Flerdimensional statistisk variabel naturligt at samle dem i et ordnet sæt , som kaldes en k-dimensional stokastisk variabel.

r

X = (X1,X2,...,Xk) Eksempelvis:

* Et levnedsmiddel kan af en tilfældig udtaget forbruger bedømmes ved en karakter X1 for smagen og en karakter X2 for lugten. Så er Xr = (X X1, 2)= (Smag, Lugt) en 2-dimensional stokastisk variabel.

* Et tilfældigt eksperiment går ud på at udtage en tilfældig person og måle vedkommendes højde X1 og masse

. Så er en 2-dimensional stokastisk variabel.

X2 Xr = (X1,X2)= (Højde, Masse) på rød terning, Antal øjne op på hvid terning) en 2-dimensional stokastisk variabel.

For hver af de 1-dimensionale stokastiske variable X X1, 2,...,Xk har vi defineret:

* Fordelingsfunktioner F F1, 2,...,Fk:

og når de er kontinuerte variable:

, , . . . , . og når de er kontinuerte variable:

11.1 Indledning

Af definitionen på middelværdi følger linearitetsreglen:

( ) ( ) ( )

.

E a g X ( i)+b h X ( i) = a E g X ( i) +b E h X ( i)

For en k-dimensional stokastisk variabel definerer vi analogt:

r

og når de er kontinuerte variable:

( )

En stikprøve af størrelsen n på en stokastisk variabel defineres som

r

X = (X1,X2,...,Xk)

( ) ( )

r r r

X X1, 2,...,Xn = (X11,X21,...,Xk1),(X12,X22,...,Xk2),...,(X1n,X2n,...,Xkn)

hvor er statistisk uafhængige variable, der hver har samme fordeling som .

r r r

X X1, 2,...,Xn

r X

Eksempel 11.1. 2-dimensional stokastisk variabel.

Et levnedsmiddel kan af en tilfældig forbruger bedømmes ved en karakterX1 for smagen og en karakter X2 for lugten. KarakterenX1 kan antage værdierne 0, 1 og 2, mensX2 kun kan antage værdierne 0 og 2.

b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a3) .

Flerdimensional stokastisk variabel LØSNING:

a1) Ved summation ned gennem de lodrette søjler i tabellen for tæthedsfunktionen

fås den 1-dimensionale tæthedsfunktion :

f x x( ,1 2) P X( 1= x1 X2 = x2) f x1( )1 = P X( 1= x1)

, , .

f1( )0 = 0 2 0 1. + . = 0 3. f1( )1 = 0 1 0 2. + . = 0 3. f1( )2 =01 0 3. + . = 0 4.

Ved summation hen gennem de vandrette rækker i tabellen for tæthedsfunktionen f x x( 1, 2) fås analogt den 1-dimensionale tæthedsfunktion f2(x2):

, .

f2( )0 =0 2 01 0 1. + . + . = 0 4. f2( )2 =0 1 0 2 0 3. + . + . =0 6.

a2) De variable X1 og X2 er statistisk uafhængige, hvis og kun hvis f x x( ,1 2)= f x1( )1 f2(x2)for alle værdier af ( ,x x1 2) i definitionsmængden. Men da f.eks. f1( )0 f2( )0 = 0 3 0 4. . =012. er forskellig fra

, er og ikke statistisk uafhængige.

f( , )0 0 = 0 2. X1 X2

b1) Stikprøvens x1-værdier 1, 0, 2, 2, 1, 2, 0, 2, 0, 2 kan indtastes på en lommeregner, der finder gennemsnittet og standardafvigelsen som tilnærmelser til middelværdi og spredning for . Man finder:

x1

s

1 µ1 σ1 X1

Det ses, at estimaterne har en vis lighed med de eksakte værdier i spørgsmål a3).

11.2 KOVARIANS OG KORRELATIONSKOEFFICIENT

Vi har omtalt, at hver stokastisk variabel har en varians. Men et par variable X1 og X2 kan have en tendens til at variere i overensstemmelse med hinanden (samvarians), således at afvigelserne X1µ1 og X2µ2 overvejende har samme fortegn (positiv korrelation) eller overvejende har modsat fortegn (negativ korrelation). Eksempelvis kan en høj forekomst af ét vitamin i et levnedsmiddel ofte være ledsaget af en høj forekomst af et andet vitamin (positiv korrelation).

Og studerendes højde og masse kan også have en positiv korrelation.

Vi betragter igen en k-dimensional stokastisk variabel . For et par af variable og r

X= (X1,X2,...,Xk) Xi Xj

defineres kovariansen (“samvariansen”)

( )

V X( i,Xj)E (Xi µi) ( Xj µj)

(den giver jo et vist mål for, om afvigelserne Xi − µi og Xjµj i middel har samme fortegn eller modsat fortegn).

Sættes i = j, fås V X X( i, i)= E

(

(Xiµi)2

)

, som er identisk med variansen V X( i) for variablen Xi

11.1 Indledning

Man kan vise (se nedenfor), at V X( i,Xj)=E X

(

iXj

)

µiµj, som for i = j giver V X( i)=E X

(

i2

)

µi2. Bevis:

( )

.

V X X( i, j) E (Xiµi) ( Xjµj) = E X X( i jµiXj Xiµj+ µ µi j) Anvendes linearitetsreglen kan sidste led omformes:

= E X X( i j)µiE X( j) E X( i)µj +µ µi j = E X X( i j)µ µi j µ µi j +µ µi j=E X X( i j)µ µi j

For bedre at kunne vurdere hvor meget de variable varierer i “takt” med hinanden, divideres kovariansen med spredningerne, så man får den såkaldte korrelationskoefficient:

ρ Da dette andengradspolynomium i

λ

aldrig er negativt, kan diskriminanten ikke være positiv, dvs.

( ) ( )

. Man kan (som det ses nedenfor) vise, at

og stat. uafhængige

Estimater for kovarians, varians og korrelationskoefficient

Ud fra en stikprøve (x y1, 1), (x2,y2), . . ., (xn,yn) kan man beregne

( SAP = “Sum af Afvigelsers Produkter” , SAK = “Sum af Afvigelsers Kvadrater” ) og heraf danne estimater for kovarians, varianser og korrelationskoefficient:

kovarians: V X Y SAP og varianser: ,

Flerdimensional stokastisk variabel

Det kan således vises (for enhver fordelingstype), at

, ,

Altså fås ved hjælp af linearitetsreglen:

( ) ( )

Som nævnt er SAK en forkortelse for “Sum af Afvigelsers Kvadrater”. De afvigelser der tænkes på er de n differenser . De har summen 0, så når n - 1 af dem er kendt, er den sidste fastlagt. Da SAK således X1X X, 2X,...,XnX

kun er baseret på n - 1 uafhængige differenser, siger man, at SAK har f = n - 1 frihedsgrader. Det er også antallet af frihedsgrader der optræder i estimatet for varians: s SAK

f

X 2=

Ofte har man taget k stikprøver på variable med samme varians σ2, så vi får k uafhængige estimater for den samme varians σ2:

og det er da fordelagtigt at forene dem i et såkaldt fællesestimat eller poolet estimat:

s f s f s f s .

Det ses, at spool2 har den rigtige middelværdi σ2, idet linearitetsreglen giver .

11.3 Linearkombination

Eksempel 11.2. Kovarians. Korrelationskoefficient.

Vi betragter igen den 2-dimensionale fordeling fra eksempel 11.1.

a5) Find kovariansen og korrelationskoefficienten.

b2) Benyt stikprøven til at finde estimater for kovariansen og korrelationskoefficienten.

LØSNING:

a5) Idet vi i eksempel 11.1 har fundet µ1=11. ,µ2 =12. , σ = 0 69. og σ = 0 96. , finder vi nu kovariansen og korrelationskoefficienten :

V X( 1,X2) ρ(X1,X2)

Det ses, at estimaterne har en vis lighed med de eksakte værdier i spørgsmål a5).

11.3 LINEARKOMBINATION

Vi bruger ofte stikprøven til at danne gennemsnittet X X X X

n nX

Ved en linearkombination L for en k-dimensional stokastisk variabel forstås et udtryk af r

X =(X1,X2,...,Xk) formen

, hvor er konstanter.

L= a0+a X1 1+a X2 2+...+a Xk k a a a0, 2, 3,...,ak For middelværdien af L giver linearitetsreglen:

E L( )=a0+a E X1 ( 1)+a E X2 ( 2) ...+ +a E Xk ( k).

For variansen af en linearkombination L gælder kvadratreglen:

V L a V X a V X ak V Xk a a V Xi j i Xj

Flerdimensional stokastisk variabel

c) V X (X’erne statistisk uafhængige)

n V X stikprøvestørrelsen n. For at få et gennemsnit med en 10 gange mindre spredning, skal stikprøven altså gøres 100 gange større!

Bevis for kvadratreglen. Vi finder

( )

( )

Eksempel 11.3. Linearkombination af stokastiske variable.

Et levnedsmiddel leveres i poser. Lad X1 og X2 [mg/kg] betegne koncentrationerne af to stoffer A og B i en

Opgaver til kapitel 11

OPGAVER

Opgave 11.1.1 (2-dimensional stokastisk variabel)

Et spil i et casino går ud på at trække en tilfældig seddel fra en urne (og lægge sedlen tilbage igen). Urnen indeholder 10 sedler, og på hver seddel står 2 tal (X1,X2):

(1,0) (3,0) (4,0)

(1,0) (3,3) (4,3)

(1,3) (4,3)

(1,3) (1,3)

a1) Find den 2-dimensionale tæthedsfunktionf x x( 1, 2):

a2) Find de 1-dimensionale tæthedsfunktioner f x1( 1)og f2(x2). a3) Er X1 og X2 statistisk uafhængige ?

a4) Find middelværdierne µ1= E X( 1)og µ2 = E X( 2)samt spredningerne σ1(X1) og σ2(X2). a5) Find middelværdien E X

(

1 X2

)

.

2

b) Antag, at man i stedet kender en stikprøve på (X1,X2):

(1,3), (1,0), (1,0), (4,3), (3,0), (4,3), (1,0), (3,0), (3,3 ), (1,3).

b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a4).

Opgave 11.1.2 (kovarians, korrelationskoefficient)

a6) Find kovariansen V X( 1,X2) og korrelationskoefficienten ρ(X1,X2). b2) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a6).

Opgave 11.1.3 (linearkombination)

For det i opgave 11.1.1 og 11.1.2 omtalte casino aftales et spil, hvor gevinsten er G= 20 10+ X1+5X2.

a7) Find gevinstens middelværdi E G( ) og spredningσ( )G .

b3) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a7).

Opgave 11.2.1 (2-dimensional stokastisk variabel)

Under en produktion kan der optræde fejl. Lad (X1,X2)=( Antal gange der optræder fejl af type 1, Antal gange der optræder fejl af type 2) i en tilfældig produktion. VariablenX1 kan antage værdierne 0, 1 og 2, mensX2 kun kan antage værdierne 0 og 1.

a) Antag, at man teoretisk kender tæthedsfunktionenf x x( 1, 2):

f x x( 1, 2) x1

0 1 2

x2 0 0.3 0.1 0.1

1 0.1 0.2 0.2

a1) Find de 1-dimensionale tæthedsfunktioner f x1( 1)og f2(x2). a2) Er X1 og X2 statistisk uafhængige ?

a3) Find middelværdierne µ1= E X( 1)og µ2 = E X( 2)samt spredningerne σ1(X1) og σ2(X2). a4) Find middelværdien E

(

X1+ X2

)

.

b) Antag, at man i stedet kender en stikprøve på (X1,X2):

(0,1), (0,0), (1,1), (1,1), (0,0), (0,0), (0,1), (2,1), (0,0 ), (2,1).

b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a3).

Opgave 11.2.2 (kovarians, korrelationskoefficient) Vi betragter igen produktionsprocessen fra opgave 11.2.1.

a5) Find kovariansen V X( 1,X2) og korrelationskoefficienten ρ(X1,X2). b2) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a5).

Flerdimensional stokastisk variabel Opgave 11.2.3 (linearkombination)

For den i opgave 11.2.1 og 11.2.2 omtalte produktionsproces er fortjenesten F= 200003000X14000X2.

a6) Find fortjenestens middelværdi E F( ) og spredning σ( )F .

b3) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a6).

Opgave 11.3.1 (2-dimensional stokastisk variabel)

År 4001. En sonde er vendt hjem med oplysninger om individer på en fremmed planet. De kan have 2, 4 eller 6 øjne, og 2 eller 4 ører. Lad (X1,X2)= (Antal øjne, Antal ører) for et tilfældigt udtaget individ på planeten.

a) Professor Cosmussen har teoretisk opstillet tæthedsfunktionenf x x( 1, 2): a4) Find middelværdien E .

X X

b1) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a3).

Opgave 11.3.2 (kovarians, korrelationskoefficient) Vi betragter igen individerne fra opgave 11.2.1.

a5) Find kovariansen V X( 1,X2) og korrelationskoefficienten ρ(X1,X2). b2) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a5).

Opgave 11.3.3 (linearkombination)

For de i opgave 11.3.1 og 11.3.2 omtalte individer har professor Cosmussen opstillet en formel for deres masse:

kg.

M = 200+20X1+10X2

a6) Find massens middelværdi E M( ) og spredning σ(M).

b3) Benyt stikprøven til at finde estimater for størrelserne i spørgsmål a6).

Opgave 11.4.1 (2-dimensional stokastisk variabel)

Lad (X1,X2)= ( Højde [cm], Masse [kg] ) af en tilfældigt udtaget studerende på 3. halvår.

Vi betragter igen de i opgave 11.4.1 og 11.4.2 omtalte studerende. En frugtavler har opstillet en formel for den timeløn, han vil give dem som frugtplukkere:

kroner/time.

L=100+0 3. X10 2. X2

Opgaver til kapitel 11 Opgave 11.5 (poolet estimat)

Koncentrationen af et stof A blev målt i 3 partier råvarer:

Råvare 1: 56, 60, 54, 49, 61 Råvare 2: 78, 73, 80

Råvare 3: 66, 62, 70, 72, 60

Det antages, at der er samme spredning i de 3 tilfælde. Find et estimat spool for spredningenσ. Opgave 11.6 (poolet estimat)

Koncentrationen af et stof A blev målt i 2 levnedsmidler:

Levnedsmiddel 1: 87, 89, 94, 86, 89, 95 Levnedsmiddel 2: 93, 99, 94, 91, 98 . Det antages, at der er samme spredning i de 2 tilfælde. Find et estimat spool for spredningen σ. Opgave 11.7 (poolet estimat)

Koncentrationen af et stof A blev målt i mælken fra 5 køer:

Ko 1: 44, 48, 46, 43, 45 Ko 2: 40, 38, 41 Ko 3: 43, 45, 42, 42 Ko 4: 36, 32 Ko 5: 50

Det antages, at der er samme spredning i de 5 tilfælde. Find et estimat spool for spredningen σ.

Statistiske beregninger på lommeregner og PC-er

STATISTISKE BEREGNINGER PÅ LOMMEREGNER TI89 SAMT PÅ PC-PROGRAMMERNE TI-Nspire, EXCEL, MAPLE OG MATHCAD

TI 89

1) Generelt:

Beregning af sandsynlighedsfordelinger:

Metode 1 Vælg HOME\ CATALOG,, F3\ vælg den ønskede fordeling\ENTER

(tryk evt på “forbogstav” for hurtigt at komme til det ønskede navn).

Fordel: Hurtig ved beregning af sandsynligheder, såsom P(X < 0.87) da resultatet straks indsættes på HOME-linien.

Ulempe: Man skal huske parametrenes rækkefølge (de kan dog ses nederst på skærmen) Metode 2: Vælg APPS\ Stats/List\F5\vælg den ønskede fordeling\ENTER

Fordel: Der fremkommer nu en menu, som er næsten selvforklarende.

Ulempe:Skal resultatet ned på HOME-linien (man vil regne videre), bliver det lidt besværligt:

HOME, Var-Link\I StatsVar mappen markeres den ønskede størrelse, ENTER

Tal indlagt på liste Vælg APPS\ Stats/List\ indtast data i eksempelvis “list1"

Fordele og ulemper som under metode 2 ovenfor

Beregning af gennemsnit , spredning , middelværdi osv.

1) Hvis tal indlagt på liste 1

F4\ 1: 1-Var Stats , I menu sættes “List” til “List1" (Benyt evt. Var-Link til at finde List1) Udskriften består af en række statistiske størrelser.

2) Anvendes med få tal og kun ønsker beregning af en enkelt størrelse.

HOME\ MATH\6.Statistics\

Gennemsnit: Mean ({liste}) , Varians: Variance({liste}), Spredning: stdDev({liste}) Beregning af test

1) Hvis tal indlagt på liste(r)

F6\i menu vælg relevant test\ENTER\Data\ENTER\udfyld menu\ENTER

2) Oprindelige data ikke kendt, men kun middelværdi osv.

Som ovenfor, men nu vælges Stats fremfor Data

Beregning af konfidensintervaller 1) Hvis tal indlagt på liste(r)

F7\i menu vælg relevant konfidensinterval\ENTER\Data\ENTER\udfyld menu\ENTER

2) Oprindelige data ikke kendt, men kun middelværdi osv.

Som ovenfor, men nu vælges Stats fremfor Data

Oprette en “Folder”: VAR-Link\ F1\ 5: Create Folder\ Skriv navn på folder.

Vælg en mappe som den aktuelle mappe: MODE\ Current Folder\navn

Formål: Det kan være praktisk ikke at gemme alle sine resultater i MAIN.

TI89 2) Sandsynlighedsfordelinger.

Normalfordeling n(μ,σ)

a) pP a( X b), hvor a ,b,μ,σ er givne konstanter(a og b kunne evt. være 4): p = normcdf(a b, , , )  b) Find :xp P X( xp)p, hvor p, μ, σ er givne konstanter. xp=invNorm(p,μ,σ) t - fordeling. Lad T være t - fordelt med frihedsgradstallet f.

a) Find p = P(a # T # b), hvor a og b er givne konstanter.(a og b kunne evt. være 4): p = tCdf(a,b,f) b) Find t( ):f P T( t( ))f ( given konstant). t( )f invt(,f ) χ2 - fordeling. Lad Q være χ2 - fordelt med frihedsgradstallet f.

a) Find , pP a Q b(   ) hvor a og b er givne konstanter. p = chi2Cdf(a,b,f) b) Find fraktilen2( )f : P Q( 2( ))f ( given konstant). invChi2( ,f) Binomialfordeling. Lad X være binomialfordelt b(n,p)

Find P l(  Xm), hvor0   l m m n og l og m er hele tal. binomtCdf(n,p,l,m) Poissonfordeling. Lad X være Poissonfordelt p()

Find P l(  Xm), hvor0 l m og l og m er hele tal. poissCdf(,l,m) 3) Konfidensintervaller

Normalfordeling. 1 variabel

1)ukendt: F7\ 1: T-Interval (hvis oprindelige data ikke kendt så Stats ellers Data) 2) kendt: F7\ 1: Z-Interval (hvis oprindelige data ikke kendt så vælg Stats ellers Data) Normalfordeling. 2 variable

F7\ 4: 2-SampTint\ udfyld menu(se eksempel 7.1, parvis så eksempel 7.3) Binomialfordeling.

F7, 5: 1-Prop-ZInt (Kræver der kan approksimeres til normalfordeling) Poissonfordeling: findes ikke, så her må formel for konfidensinterval benyttes 4) Hypotesetest

Normalfordeling. 1 variabel

1) kendt: F6\ 1: Z-Test (hvis oprindelige data ikke kendt så Stats ellers Data) 2)ukendt: F6\ 1: T-Test (hvis oprindelige data ikke kendt så Stats ellers Data) Normalfordeling. 2 variable

F6\ 4: 2-SampTtest\ udfyld menu (se eksempel 7.1 eller 7.3) Binomialfordeling.

F7, 5: 1-Prop-ZTest (Kræver der kan approksimeres til normalfordeling) Poissonfordeling: findes ikke, så her må formel for konfidensinterval benyttes

Statistiske beregninger på lommeregner og PC-er

TI-Nspire 1) Generelt:

Beregning af sandsynlighedsfordelinger:

Vælg Beregninger\Statistik\Fordelinger\ vælg den ønskede fordeling\udfyld menu\ENTER

Huskes fordelingens navn og parametrenes rækkefølge kan man skrive direkte Tal indlagt på liste Lister og regneark giv en liste et navn og indtal tal i listen Beregning af gennemsnit , spredning , middelværdi osv.

1) Hvis tal indlagt på liste

Lister og regneark giv en liste et navn og indtal tal i listen vælg statistik statistiske beregninger statistik med 1 variabel udfyld menuer Enter.

Blandt mange tal findes det ønskede

2) Anvendes med få tal og kun ønsker beregning af en enkelt størrelse.

Beregninger\statistik\listematematik\vælg

Middel: mean({liste}), Stikprøvevarians: varSamp({liste}), Standardafvigelse for stikprøve:

stDevSamp({liste})

Beregning af test 1) normal, 1 variabel

1) Lister og regneark udfyld liste (husk overskrift) Statistik t-test for 1 variabel menu:data udfyld menu ENTER

2) Oprindelige data ikke kendt, men kun middelværdi osv.

Som ovenfor, men nu vælges Stats fremfor Data

2) normal, 2 variable

1)Lister og regneark Udfyld lister med overskrift m1 og m2 Statistik t-test for 2 variable menu:data ok menu: List1: skriv m1 List 2: Skriv m2 “alternative Hyp” samlet: nej (hvis parvise observationer så ja vælg variabelreference ok

2) Oprindelige data ikke kendt, men kun middelværdi osv.

Som ovenfor, men nu vælges Stats fremfor Data

Beregning af konfidensintervaller

Som under test blot vælges nu konfidensintervaller

De konkrete beregninger af en given sandsynlighedsfordeling konfidensinterval eller test svarer til det der står under TI89

Excel

Excel

1) Generelt Forudsætninger.

Da ikke alle de anvendte statistiske funktioner er indbygget fra starten, skal man først vælge et tilføjelsesprogram:

I Excel 2003: Vælg “Funktioner”, “Tilføjelsesprogrammer”, marker “Problemløser”

I Excel 2007: Vælg “Excel-Office-knappen”, “Excel indstillinger (findes forneden)”, Tilføjelsesprogrammer”,

”Udfør”, ”marker Analysis toolpak, Analysis toolpak VBA, Problemløser”, “Installer”.

Inddata.

Vi vil i det følgende for kortheds skyld antage, at den første stikprøves værdier står i cellerne A1, A2, A3 . . . A10.

Kræves der flere variable vil den næste stå i cellerne B1, B2, B3 . . . B8, osv.

Man angiver “udskriftsområdet” eller “inputområdet” f.eks en søjle placere i cellerne A1:A10 ved a) at markere området A1 til A10

b) at skrive eksempelvis A1:A10

c) at give det et navn: Vælg “Indsæt” i Excel 2003: Navn i Excel 2007:Formler Definer i menu skriv søjlens navn og (nederst)A1:A10

Skrive , beregne og kopiere formler.

Vælg den celle hvor resultatet skal stå. Lad det være B1: På værktøjslinien foroven skriv = formel skrives ENTER Resultatet står nu i celle B1

Hvis selve formlen skal stå i en anden celle. Lad det være A1: Cursor placeres i B1 I formelfelt markeres formlen uden lighedstegn og man kopierer den (CTRL C)” ENTER (så formlen igen er beregnet i B1 Cursor over i A1 og paste (CTRL V)

Udskrive gitterlinier og række og kolonneoverskrifter

Excel 2003: Vælg Filer Sideopsætning Ark Marker gitterlinier marker række- og kolonneoverskrifter.

Excel 2007: Vælg Sidelayout Under“Gitterlinier” marker “Udskriv” Under “Overskrifter” marker “Udskriv”

2: Indsætte og tegne diagrammer Lagkage eller søjle: se eksempel 2.1 side 2 Kurve: se eksempel 2.4 side 4

Tegne histogram: se eksempel 2.5 side 6 3: Beregne statistiske størrelser og funktioner

Beregning af “Karakteristiske tal” (se evt. ekempel 2.9) Data indtastes i eksempelvis søjle A1 til A10

Excel 2003: Funktioner Dataanalyse Beskrivende statistik udfyld inputområde Resumestatistik Excel 2007: Data Dataanalyse Beskrivende statistik udfyld inputområde Resumestatistik Valg af statistiske størrelser (funktioner)

1) Vælg den celle hvor resultatet skal stå (eksempelvis A1).

2) På værktøjslinien foroven:

2a) Tryk på fx

2b) På den fremkommne menu vælges den ønskede funktion eksempelvis “NORMALFORDELING”

2c) Der fremkommer en menu med anvisning på, hvordan den skal udfyldes.

Gennemsnit, spredning, median, kvartil

Navnene anføres nedenunder, men den fremkomne menu gør det let at indsætte de rette parametre.

Gennemsnit = x MIDDEL(A1:A10) Spredning s = STDAFV (A1:A10)

Median m = MEDIAN(A1:A10) (= KVARTIL(A1:A10;2) ) 1. Kvartil = KVARTIL(A1:A10;1)

Statistiske beregninger på lommeregner og PC-er Fakultet, kombination, Permutation (se evt. eksempel 8.8)

Fakultet n! = FAKULTET(n) Eksempel: 5! =FAKULTET(5) = 120 Kombination K(n,p) = KOMBIN(n;p) Eksempel: K(5,3)==KOMBIN(5;3) = 10 Permutation P(n,p = PERMUT(n;p) Eksempel: P(5,3) = PERMUT(5;3) = 60 Normalfordeling.

Lad X være normalfordelt med middelværdi og spredning

1)P X( x)= NORMFORDELING(x ;; ;1) 2)P X( x)= 1 - NORMFORDELING(x ;; ;1)

3)P a(  Xb) P X( b)P X( a)NORMFORDELING(b ;; ;1) -NORMFORDELING(a ;; ;1) Fraktil : xp P X( xp) p NORMINV(p;;)

Eksempel: u0 975. = NORMINV(0,975;0;1) = 1,959961 t - fordeling. (se evt. eksempel 5.3 side 44)

Lad T være t - fordelt med f frihedsgrader..

1) P T( t)= TFORDELING(abs(t); f ;1)

(bemærk: TFORDELING(abs(t); f ;1) udregner “øvre hale” af fordelingen)

2) P T(  t)+P T( t)= TFORDELING(abs(t); f ;2) (udregner “halen” til begge sider)

Bemærk: Man må må udnytte symmetrien i t-fordelingen, for værdier mindre end 0 (svarende til < 0.5) Eksempel:

Lad T være t - fordelt med 12 frihedsgrader

1) P X(  1) =P X( 1)= TFORDELING(abs(-1);12;1) = 0,168525 2) t0 975. (12) = TINV(0,05;12) = 2,178813

= - TINV(0,05;12) = - 2,178813 t0 025. (12)

- fordeling. (se evt.eksempel 5,8 side 49)

2

Lad X være 2- fordelt med f frihedsgrader = CHIFORDELING(x;f) P X( x)

(bemærk: CHIFORDELING(x;f) udregner “øvre hale” af fordelingen) Fraktil

Hypergeometrisk fordeling (se evt. eksempel 9.2 side 91) Lad X være hypergeometrisk fordelt med parametrene N, M og n

= HYPGEOFORDELING(x ; n ; M ; N) P X(  x)

Eksempel: Lad N = 600, M = 10 og n = 25

= HYPGEOFORDELING(1;25;10;600)+HYPGEOFORDELING(0;25;10;600) = 0,938876 P X( 1)

TI - 83 Binomialfordeling ( se evt. eksempel 9.5 side 96)

Lad X være binomialfordelt med parametrene n og p

= BINOMIALFORDELING(x ; n; p; 0) P X(  x)

= BINOMIALFORDELING(x ; n; p; 1) P X( x)

Eksempel (jævnfør eksempel 72)

Lad X være binomialfordelt med n = 6 og p = 0.15

= BINOMIALFORDELING(3;6;0,15;0) = 0,041453 P X( 3)

= 1- =1 - BINOMIALFORDELING(2;6;0,15;1) = 0,047339 P X( 3) P X( 2)

Poissonfordeling (se evt. eksempel 9.10 side 102) Lad X være Poissonfordelt med middelværdien

= POISSON(x; ; 0) P X(  x) 

= POISSON(x; ; 1) P X( x) 

Eksempel

Lad X være Poissonfordelt med middelværdien 10 P(X = 4) = POISSON(4; 10;0) = 0.018917

= 1 - POISSON(4;10;1) = 0,970747 P X( 4)

Eksponentialfordeling

Lad T være eksponentialfordelt med middelværdien. EKSPFORDELING(t,1/ ,1)

P T t(  ) 

Eksempel:

Lad T være eksponentialfordelt med middelværdi =2 EKSPFORDELING(3;1/2;1) = 0,77687

P T( 3)

Konfidensintervaller

Konfidensinterval middelværdi for 1 normalfordelt variabel. kendt eksakt

Radius r i et 95% konfidensinterval for :x r x u (se evt. eksempel 5.2 side 42)

   0 975. n r = KONFIDENSINTERVAL(0,05;, n).

Eksempel. Lad stikprøven have n =6 værdier, lad spredning = 0.25 og gennemsnit x =8 r =KONFIDENSINTERVAL(0,05;0,25;6). Resultat 0,200038

95% konfidensinterval: 8,00.200

Konfidensinterval for middelværdi for 1 normalfordelt variabel . ikke kendt eksakt se eksempel 5.4 side 45

Konfidensinterval for sandsynlighed p for 1 binomialfordelt variabel.

se eksempel 9.7 side 98 Hypotesetest

1 normalfordelt variabel

kendt eksakt se eksempel 6.1 side 55

ikke kendt eksakt se eksempel 6.3 side 57

2 normalfordelte variable 1) Ikke parvise observationer:

data givet: se Excel-program i eksempel 7.1 side 72 data ikke givet: se Excel-program i eksempel 7.2 side 73 2) Parvise observationer:

se Excel-program i eksempel 7.3 side 74 1 binomialfordelt variabel

se eksempel 9.5 side 96

Statistiske beregninger på lommeregner og PC-er MAPLE

Beregn gennemsnit og spredning af tallene 1 3 4 8

> with(stats):

data:=[1,3,4,8];

data := [1, 3, 4, 8]

> describe[mean](data);

4

> describe[standarddeviation[1]](data);

Beregne korrelationskoefficient for den i eksempel 9.2 nævnte stikprøve (1,2), (0,0), (2,2), (2,2), (1,0), (2,2), (0,2), (2,2), (0,2), (2,2) . Programudførelse:

> data1:=[1,0,2,2,1,2,0,2,0,2]; x- værdier

data1 := [1, 0, 2, 2, 1, 2, 0, 2, 0, 2] udskrift

> data2:=[2,0,2,2,0,2,2,2,2,2]; y-værdier

data2 := [2, 0, 2, 2, 0, 2, 2, 2, 2, 2] udskrift

> describe[linearcorrelation](data1,data2): evalf(");

.4014775343 resultat

Normalfordeling.

Find for n(113.3,5.6) P X( 116.1). Programudførelse:

> with(stats):

> with(statevalf):

> cdf[normald[113.3,5.6]](116.1);

Facit .6914624613 fordeling.

2

Find en tests P-værdi: P Q( 27.26) idet frihedsgradstallet er 19 (jævnfør eksempel 5.6) Programudførelse:

> with(stats):

> with(statevalf):

> 1-cdf[chisquare[19]](27.36);

Facit: .0965431211 t - fordeling.

Find en tests P-værdi: P T(-1.31) idet frihedsgradstallet er 14 (jævnfør eksempel 5.5) Programudførelse:

> with(stats):

> with(statevalf):

> cdf[studentst[14]](-1.31);

Facit: .1056420798

Find for binomialfordelingen b(100,0.3) P X( 35) Programudførelse:

> with(stats):

> with(statevalf):

> dcdf[binomiald[100,0.3]](35);

Facit: .8839213940

MATHCAD

MATHCAD 1) Generelt:

Sandsynlighedsfunktioner :

Skriv funktionens navn eller vælg fra (øverste) værktøjslinie

\Probability Density (dfunktionsnavn). Tæthedsfunktion ,

f x( ) P X( a)

\Probability Distribution (pfunktionsnavn). Fordelingsfunktion eller

f x( ) P X( a)

\Probability Distribution (qfunktionsnavn) Invers tæthedsfunktion: Find .

f x( ) P X( xp)p xp

Rækkefølgen af parametrene kan findes ved at placere cursor på navnet og trykke på tasten F1.

2) Sandsynlighedsfordelinger.

Normalfordeling n( , )

a) Find , pP a( X b) hvor a ,b, , er givne konstanter.

pnorm(b, ) - pnorm(a, ) pP a( X b )P X b( )P X( a)  ,  , Eksempel: , p P X( 116. ) hvor113. , 5 p = pnorm(11.6, 11.3,5) = 0.524 b) Find :xp P X( xp)p, hvor p, , er givne konstanter. xp=qnorm(p, , ) 

Eksempel:P X( xp)0 7. ,hvor11 4, ,6 xp=qnorm(0.7,11.4,6) =14.55 t - fordeling.

Lad T være t - fordelt med frihedsgradstallet f.

a) Find , pP a T b(   ) hvor a og b er givne konstanter.

pt(b,f) -pt(a,f) pP a( X b )P X b( )P X( a)

Eksempel: , p P T(  1 3. ) med f = 14 p = pt(-1.3,14) = 0.1073 b) Find t( ):f P T( t( ))f ( given konstant). t( )f = qt(,f )

Eksempel: t0 975. (12) = qt (0.975,12) = 2.179

fordeling.

2

Lad Q være 2 fordelt med frihedsgradstallet f.

a) Find , pP a Q b(   ) hvor a og b er givne konstanter. p = pchisq(b,f) - pshisq(a,f) Eksempel:Find , p P Q( 27 3. ) med f = 19 p 1 P Q( 27 3. )=1- pchisq(27.3,19) = 0.0979 b) Find fraktilen2(f ) : P Q( 2( ))f ( given konstant). 2( )f = qchisq(,f )

Eksempel: 0 0252. ( )8 = qchisq(0.025,8) = 2.18

Binomialfordeling.

Lad X være binomialfordelt b(n,p) a) P(X=x) =dbinom(x,n,p)

pbinom(x,n,p) P X( x)

Eksempel :q = P(3 X 6), hvor n = 10 og p = 0.3

q = P X( 6)P X( 2) = pbinom(6,10, 0.3)-pbinom(2,10,0.3) = 0.6066 b) Find det hele tal m for hvilket P X m( ) m = qbinom(p, n,)

Eksempel: Lad X være binomialfordelt med p = 0.3 og n = 10.

Eksempel: Lad X være binomialfordelt med p = 0.3 og n = 10.

In document STATISTISKE GRUNDBEGREBER (Sider 118-0)