Hopp til innhold

Normalfordeling

Fra Wikipedia, den frie encyklopedi
Normalfordelingen

Normalfordelingen, eller Gauss-kurven, er i matematikken (hovedsakelig i sannsynlighetsteori og statistikk) den desidert viktigste fordelingen. En normalfordelt variabel antar ofte verdien som ligger nær middelverdien, og sjelden verdien som har stor avvikelse. Derfor ser normalfordelingen ut som en klokke (bjelle), og internasjonalt brukes ofte betegnelsen bell curve. Vi kan bruke egenskaper ved normalfordelingen for å analysere statistikker ved å regne dataen vår om til Z-skår.

Normalfordelingen er statistikkens desidert viktigste fordeling. Dette henger sammen med et matematisk resultat som kalles for sentralgrenseteoremet. Resultatet innebærer at summen av et stort antall uavhengige tilfeldige variabler er tilnærmet normalfordelt under visse allmenne forutsetninger, uavhengig av hvilken fordeling disse variablene hadde i utgangspunktet. Dette resulterer i at normalfordelingen dukker opp flere steder i naturen og samfunnet, og flere hendelser kan med stor nøyaktighet beskrives av normalfordelingen.

Forekomst

[rediger | rediger kilde]

Årsaken til at normalfordelingen anvendes så mye er sentralgrenseteoremet. I bl.a. naturvitenskap, sosiologi og økonomi er det normalt at man ikke forstår hvordan en viss mekanisme fungerer, men man kan teoretisk sett motivere til bruk av normalfordelinger ettersom det ofte er slik at fenomener oppstår gjennom mange små, uavhengige, tilfeldige variasjoner.

IQ-tester lages ofte med antagelser om at intelligensen er normalfordelt. En IQ-test vil gi resultater som er normalfordelte med en forventningsverdi på 100, ved å omskalere testresultatene til en normalfordeling. Hvorvidt intelligens virkelig er normalfordelt er uvisst.

Eksempel – kaste mynt

[rediger | rediger kilde]

Dersom man kaster en mynt 100 ganger og kaller summen for X, så vil X være binomisk fordelt. Men ettersom hvert myntkast er uavhengig av alle de øvrige kastene, vil X være tilnærmet normalfordelt med en forventningsverdi på 50. Ofte er det mye enklere å anta en tilnærmet verdi på en tilfeldig variabel med en normalfordeling enn å beregne eksakte sannsynligheter, og ettersom mange tilfeldige fenomener er summer av veldig mange små, tilfeldige forskyvninger, fungerer det utmerket. Historisk sett var muligheten til å anta tilnærmede verdier på store binomiske fordelinger det første anvendelsesområdet for normalfordelingen.

Definisjon

[rediger | rediger kilde]

Normalfordelingen har tetthetsfunksjonen:

Normalfordelingen for ulike verdier av μ og σ²
,

der μ og σ er normalfordelingens karakteristiske konstanter: μ er forventningsverdien, og σ er fordelingens standardavvik. Denne normalfordelingen betegnes med .

Normalfordelingens tetthetsfunksjon kan ikke integreres med vanlige endimensjonale metoder, ettersom den ikke har noen antiderivert funksjon som kan uttrykkes analytisk. Området under kurven kan derimot ha en verdi på 1 ved bruk av andre metoder, noe den må være for å være en ordentlig sannsynlighetsfordeling.

En standardisert normalfordeling har μ = 0 og σ = 1.

Fordelingsfunksjon for normalfordeling

Fordelingsfunksjonen for en standardisert normalfordeling betegnes vanligvis med og sammenhengen mellom fordelingsfunksjonen og tetthetsfunksjonen sier at:

.

Fordelingsfunksjonen angir sannsynligheten for at en normalfordelt variabel Y er mindre eller lik et gitt tall x:

.

Sannsynligheten for at en normalfordelt variabel havner i et intervall er:

.

Egenskaper

[rediger | rediger kilde]

Følgende egenskaper gjelder for normalfordelinger:

Fordelingsfunksjon

[rediger | rediger kilde]

Fordelingsfunksjonen for en vilkårlig normalfordelt variabel kan lett utledes fra fordelingsfunksjonen for en standard-normalfordelt variabel:

.

Denne egenskapen gjør at tabeller for normalfordelinger bare gir oss fordelingsfunksjonen , ettersom alle andre normalfordelinger på denne måten kan gjøres om til en med forventningsverdi på 0 og standardavvik på 1.

.

Denne symmetrien gjør at alle tabeller bare gir oss for positive tall x.

Lineær forandring

[rediger | rediger kilde]

Dersom og er konstanter, er den lineære formen

,

det vil si at forventningsverdien forandres på samme lineære måte, og standardavviket øker med faktoren a.

Summen av to normalfordelte variabler

[rediger | rediger kilde]

Dersom og så vil summen være

.

Differanser av normalfordelte variabler fungerer analogt.

Sentralgrenseteoremet

[rediger | rediger kilde]

Hovedartikkel: Sentralgrenseteoremet

Sentralgrenseteoremet sier at summen av mange uavhengige, likt fordelte, stokastiske variabler med endelig varians er tilnærmet normalfordelt. Med matematisk notasjon: Dersom er uavhengige stokastiske variabler med samme forventningsverdi og varians, og så er normalfordelt med forventningsverdi og varians

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy