0% fanden dieses Dokument nützlich (0 Abstimmungen)
40 Ansichten10 Seiten

Statistik Zusammenfassung

Das Dokument behandelt grundlegende Konzepte der Statistik, einschließlich Beobachtungseinheiten, Grundgesamtheit, Stichproben und Merkmale. Es erläutert deskriptive und inferenzstatistische Methoden, verschiedene Verteilungsarten, Zufallsvariablen sowie Schätz- und Testverfahren. Zudem werden spezifische statistische Analysen wie Korrelations- und Regressionsanalysen beschrieben, um Zusammenhänge zwischen Variablen zu untersuchen.

Hochgeladen von

Hamzah Darwich
Copyright
© © All Rights Reserved
Wir nehmen die Rechte an Inhalten ernst. Wenn Sie vermuten, dass dies Ihr Inhalt ist, beanspruchen Sie ihn hier.
Verfügbare Formate
Als PDF, TXT herunterladen oder online auf Scribd lesen
0% fanden dieses Dokument nützlich (0 Abstimmungen)
40 Ansichten10 Seiten

Statistik Zusammenfassung

Das Dokument behandelt grundlegende Konzepte der Statistik, einschließlich Beobachtungseinheiten, Grundgesamtheit, Stichproben und Merkmale. Es erläutert deskriptive und inferenzstatistische Methoden, verschiedene Verteilungsarten, Zufallsvariablen sowie Schätz- und Testverfahren. Zudem werden spezifische statistische Analysen wie Korrelations- und Regressionsanalysen beschrieben, um Zusammenhänge zwischen Variablen zu untersuchen.

Hochgeladen von

Hamzah Darwich
Copyright
© © All Rights Reserved
Wir nehmen die Rechte an Inhalten ernst. Wenn Sie vermuten, dass dies Ihr Inhalt ist, beanspruchen Sie ihn hier.
Verfügbare Formate
Als PDF, TXT herunterladen oder online auf Scribd lesen
Sie sind auf Seite 1/ 10

1 Beobachtungseinheit (Proband) z.B. weibliche Sportstudentin, Erythrozyt eines Menschen S.

2 Grundgesamtheit = Menge aller Beobachtungseinheiten (Beschreibung mit Parametern) S. 1,22

3 Stichprobe = Teilmenge, die die GG repräsentiert (Beschreibung mit statistischen Maßzahlen) S. 1,22

4 Merkmal (Variable) = Größen, die Beobachtungseinheiten beschreiben S. 1


S. 2
Klassifikation der Merkmale:

Qualitativ/kategorial quantitativ/metrisch

nominal ordinal (Rangfolge) Sonderfall: diskret stetig

durch Namen z.B. Trainingszustand binär, dichotom zählen z.B. Zahl messen
gekennzeichn. gut – schlecht 2 Kategorien der Medaillen z.B. KG
z.B. Sportart z.B. m/w Alter

5 Merkmalsausprägung (Daten) = Werte, die ein Merkmal annehmen kann S. 1

6 Deskriptive Statistik = Aufbereitung, Beschreibung empirisch gewonnener Daten S. 2


Methoden: tabellarische Darstellung, graphische Darst., statist. Kenngrößen berechnen
Inferenzstatistik = schließende Statistik
Methoden: Schätzen, statistische Tests

7 Histogramm: Klassen werden als Rechtecke dargestellt (Fläche ~ Häufigkeit) S. 5


(x-Achse: Merkmal, y-Achse absolute Häufigkeit)

8 Empirische Verteilungsfunktion/kumulierte Häufigkeitsfunktion => Aufsummieren der rel. H. S. 6


gibt an, welcher Anteil aller Beobachtungen kleiner oder gleich einem bestimmten Wert ist

9 Statistische Maßzahlen: S. 6
10 Lokalisationsmaße (Lagemaße) => Charakterisierung der erfassten Daten bzgl. Der Lage des S. 6
Zentrums der Verteilung

- Arithmetisches Mittel (mean) = !! Ausreißerabhängig!!

- Modalwert (Modus/mode) = Xmod der Wert der am häufigsten vorkommt


!! nur bei eingipfligen Histogrammen!!
- Median = 50% Quantil = 0,5 =50% der Werte sind größer/kleiner !! Ausreißerabhängig!!
=> Rangliste: x(1), x(2), x(3), …, x(n) wenn n ungerade: x(1), x(2), x(3) => x(2)
wenn n gerade: : x(1), x(2), x(3), x(4) => (x(2), x(3)):2 = x(2,5)
- Quantile = Werte die Beobachtungsreihen in nicht überlappende Abschnitte unterteilen S. 7

=> Rangliste x(1), x(2), x(3), …, x(n) 0,25-Quantil = n x 0,25 (wenn ung. Zahl => aufrunden)
Perzentile 0,01; 0,02… Dezile: 0,1; 0,2… Quartile: 0,25; 0,5; 0,75

11 Streuungsmaße = geben an, wie stark die Daten um einen zentralen Wert streuen S. 8
(zum jeweiligen Lokalisationsmaßgehört ein Streuungsmaß)
Tabelle
S. 9
- Varianz s² = Mittlere Abweichung vom Mittelwert

- Standardabweichung beschreibt die Streuung von Daten z.B. einer Stichprobe


- Spannweite (range) R = Xmax – Xmin
- Quartilsabstand QA = 0,75 - 0,25
12 Fehlerbalken = beschreibt Variabiltät der Einzelwerte ±S S. 10

13 Boxplot S. 10
S. 11

14 Zufallsexperiment: Eigenschaften - es gibt einen Versuchsplan S. 12


- beliebig oft wiederholbar
- es gibt genau definierte Versuchsergebnisse (mind. 2)
- Ergebnis ist nicht vorhersagbar

15 Ereignis A z.B. „gerade Augenzahl“ S. 12


- elementares Ereignis = es ist nur ein Versuchsausgang enthalten
- sicheres Ereignis = enthält alle möglichen Versuchsausgänge
- unmögliches Ereignis = kann nie eintreten

Beziehungen zwischen Ereignissen:


S. 13
- komplementär = Ᾱ zu A P(Ᾱ)=1-P(A)

- vereinigt = (mindestens eines der Ereignisse)


P( )= P(A)+P(B)-P( ) bei disjunkt: P( )= P(A)+P(B)

- geschnitten (Durchschnitt) = (beide treten ein)


P( )=P(AIB) x P(B)=P(BIA) x P(A) bei unabhängigen: P( )=P(A) x P(B)

- disjunkt/unvereinbar: = (gleichzeitiges Eintreten unmöglich => schließen sich S. 14


gegenseitig aus)

16 Klassische Definition der Wahrscheinlichkeit P(A) = S. 15

- Nichtnegativität: 0 ≤ P(A) ≤ 1
- Normierung: für das sichere Ereignis gilt P(S)=1
- Additivität: für disjunkte Ereignisse A und B gilt P( )=P(A) x P(B)

17 Frequentistische Definition der Wahrscheinlichkeit S. 17


Gesetz der großen Zahlen: die relative Häufigkeit (A) strebt mitwachsendem n gegen einen
Grenzwert <= Wahrscheinlichkeit P(A)

18 Bedingte Wahrscheinlichkeit (bei abhängigen Ereignissen) P(AIB) => A unter der Bedingung B S. 19

19 Zufallsvariable = Variablen, die ihren möglichen Wert in Abhängigkeit von Zufall, gemäß S. 23
bestimmter Verteilungen annehmen (es gibt stetige und diskrete ZV)

20 Diskrete Zufallsvariablen => falls nur abzählbar verschiedene Versuchsausgänge x1, x2, …, xn S. 23
auftreten können
Darstellung der Wahrs.en für eine ZV, dass diese einen Wert kleiner oder gleich x annimmt
= Verteilungsfunktion F(X) (Treppenkurve) F(X)=P(X≤x)

21 Binomialverteilung = wichtigste diskrete Zufallsvariable S. 24


(2 verschiedene Ausgänge z.B. Raucher/Nichtraucher) => Treffer k (1) oder Versager (0)
Bernoulli-Experiment: Trefferwahrscheinlichkeit p=P(X=1) S. 24
(X ist B(n,p) verteilt) n=Anzahl Wiederholungen des Bernoulli-Experiments

„n über k Binomialkoeffizient“ Taschenrechner: = Anzahl der Versuchsausg.


mit k aus n Treffern

Wahrscheinlichkeit für k aus n Treffern = P(X=k) =

- Erwartungswert E(X) = µ ≈ arithmetisches Mittel für Werte der Wahrscheinlichkeitsfunktion


=> Maß für die Lage des Zentrums E(X)=n x p
- Varianz V(X) = n x p x (1-p) ơ² => Maß für die Streuung um das Zentrum
- Standardabweichung von X:

22 Stetige Zufallsvariablen => beschreiben quantitativ stetige Merkmale (Messgrößen) S. 24


=> können jeden Wert annehmen

23 Gauß-/Normalverteilung = wichtigste stetige Zufallsvariable S. 28


Dichtefunktion Eigenschaften: glockenförmig, symmetrisch um Erwartungswert, Wendepunkt
im Abstand der Standardabweichung vom Erwartungswert,
nähert sich nach -∞ und +∞
Eindeutige Festlegung durch 2 Parameter: Erwartungswert µ und Varianz
Verteilungsfunktion: S. 29
Standardbereiche:
68,3% der Werte liegen zwischen
µ- ơ und µ + ơ

24 Standardnormalverteilung: N(0,1) Tabelle S. 88 S. 30


=> Vereinfachung der Normalverteilung durch Umwandlung => (Normierung)
=> Zufallsvariable X wird zu Z standardisiert Z= E(Z) = 0; V(Z) = 1
=> (Z) Wert (Tabelle) gibt die Wsk. an, dass die Zufallsgröße Z höchstens den Wert Zp annimmt

P(X ≤ ●) => Umwandlung: P( ≤ ) = P(Z ≤ ●) = (●) aus Tabelle

25 Schätzer: sind Zufallsgrößen, Kenngrößen, die auf Grund ihrer Eigenschaften:… S. 33


- Konsistenz: Schätzer liefert umso genauere Ergebn., je mehr Beobacht. zur Verfügung stehen S. 34
- Erwartungstreue: Schätzer soll im Mittel den richtigen Wert liefern => eine systematische
Abweichung des mittleren Schätzwertes vom wahren Wert heißt Bias/Verzerrung
… zur Schätzung eines Parameters der GG geeignet ist

26 Punktschätzer: Schätzer, die einen Wert angeben z.B. arithmetisches Mittel einer Stichprobe S. 35
(ein Parameter wird geschätzt) als Schätzer für des wahren Mittelwert µ

Schätzer Mittelwert : Erwartungswert E( ) = µ => µ ist der Mittelwert aller Mittelwerte


Varianz V( ) = Standardabweichung (Streuung)
= Standardfehler des unbekannten
Mittelwerts /
=> Standardabweichung immer kleiner, je größer die Stichprobe
=> Maß für Genauigkeit der Punktschätzung

27 Intervallschätzer: Aussagen über die Genauigkeit der Schätzung (es wird um den S. 36
Punktschätzer ein Intervall konstruiert (Konfidenzintervall))
Konfidenzintervall gibt an, mit welchem Maß an Vertrauen es den wahren Parameter enthält
(je breiter das Intervall, desto größer die Wahrs., dass es den Parameter enthält)
= Wahrs. Dafür, dass der Parameter nicht im Intervall liegt
=> je größer die Sicherheit eines Konfidenzintervalls, desto größer das Intervall (=unschärfer)
=> je kleiner der Stichprobenumfang, desto größer das Intervall
Konfidenzintervall ermitteln: S. 37
- Wert ơ ist bekannt:

- Wert ơ ist unbekannt:

- bei Binomialverteilung (2 mögliche Ergebnisse):

28 α = Signifikanzniveau = S. 42
Irrtumswahrscheinlich-
keit => gibt Wahrs. an,
H0 fälschlich abzulehnen
üblich: 0,05; 0,01;0,001

β = Wahrs. für das Beibe-


halten einer falschen H0
Power (Güte) = Wahrs. einen real vorhandenen Effekt (kein Zufall) aufzudecken

Tests zum Vergleich von Lagemaßen Tabelle S. 48 S. 48

29 t-Test (Normwertvergleich) S. 50
Funktion: überprüfen, ob der Mittelwert einer GG mit einem vorgegebenen Erwartungswert
übereinstimmt
30 t-Test für 2 unabhängige Stichproben, Merkmal normalverteilt S. 51

31 U-Test nach Mann-Whitney S. 55


2 Stichproben, unabhängig, Umfänge n, m jeweils ≥ 4 (k=m+n), Merkmal nicht normalverteilt
32 t-Test für Paardifferenzen 2 Stichproben, abhängig, Merkmal normalverteilt S. 53

33 Wilcoxon-Test 2 Stichproben, abhängig, Merkmal nicht normalverteilt S. 58

34 Statistische Analyse des Zusammenhangs zweier Merkmale: z.B. Alter und BD S. 61


- Vorhandensein und Stärke eines Zusammenhangs => Korrelationsanalyse
- Beschreibung der Art des Zusammenhangs durch Funktion => Regressionsanalyse
35 Scatterplot/Streudiagramm: Darstellung des Zusammenh. von metrisch skalierten Merkmalen S. 61
- zu jeder Beobachtungseinheit gehört ein Wertepaar (x,y) der beiden Merkmale (X und Y)
- macht die Form des Zusammenhangs sichtbar (keiner, linear, nichtlinear)
- dient auch zur Identifikation von Ausreißern (Datenfehler oder tatsächlicher Ausreißer?)
36 Korrelationsanalyse: entweder… S. 63
- Berechnung des Produktmoment-Korrelationskoeffizienten nach Pearson
- beide Merkmale aus normalverteilten GG?
- stehen die Merkmale in einer linearen Abhängigkeit zueinander? sonst…:
(- oder Berechnung des Spearman’schen Rangkorrelationskoeffizienten)
- nicht lineare monotone Zusammenhänge
S. 64
Korellationskoeffizient r:

S. 66
Statistische Prüfung der Korrelationskoeffizienten:
Zeigt r Unabhängigkeit (H0) oder Korrelation (Zusammenhang) (HA) an?

S. 67
Fehlerquellen bei der Korrelationsanalyse:
- Ausreißer
- Inhomogenität (Datenmaterial besteht aus 2 Teilmengen => nur deshalb Korrelation)
- Gemeinsamkeitskorrelation (2 Merkmale haben keinen Zusammenhang aber unterliegen einer
unbekannten 3. Größe => partielle Korrelation Skript S. 68
- selektionsbedingte Korrelation
- Formale Korrelation

37 Regressionsanalyse: = Ziel die „beste“ Gerade zu best. die durch die Daten gelegt werden kann S. 69
Annahmen bei der linearen Regression:
- der wahre Zusammenhang ist linear
- die Daten streuen gleichm. um die Regressionsgerade über den gesamten betrachteten Bereich
- die Stichprobe ist homogen
S. 70
Bestimmung der Regressionsgerade = Methode der kleinsten Quadrate:
Y=a+bxX (a=Achsenabschnitt, b= Regressionskoeffizient = Steigung)

- Wenn eindeutig klar ist, welches Merkmal das abhängige (Zielgröße) und welches das S. 71
unabhängige (Einflussgröße) ist, dann kann nur eine Regressionsanalyse von Y auf X
durchgeführt werden (wenn nicht: in beide Richtungen)
- der Schnittpunkt der beiden Regres.geraden (von Y auf X und von X auf Y) ist der Schwerpunkt
S. 70

byx gibt an, um wie viele Einheiten Y im Mittel zunimmt bzw. abnimmt, wenn X um eine Einheit
zunimmt.
Bsp. Der Regressionskoeffizient gibt an, dass … (HFpost) … im Mittel um … bxy …
zunimmt/abnimmt, wenn … (HFprae) … um eine Einheit zunimmt

Regressionsgerade zeichnen: in Y = a + b x X einfach 2 Punkte einsetzen

Zusammenhang zwischen Korrelationskoeffizienten r und Regressionskoeffizient b:


r² = byx x bxy

38 S. 72
Statistische Prüfung des Regressionskoeffizienten bxy:
H0 : βyx = 0 => Anstieg der Regressionsgeraden in der GG ist Null
HA : βyx ‡ 0 => Anstieg der Regressionsgeraden in der GG ist ungleich Null

Beurteilung mit Hilfe des Konfidenzintervalls: S. 73

Wenn das 95%-Konfidenzintervall die Null nicht enthält, kann H0 bei einer
Irrtumswahrscheinlichkeit von α=5% verworfen werden

39 Güte einer linearen Regression: S. 73


Bestimmtheitsmaß B = gibt den Anteil der Variabilität der Zielgröße Y an, der durch die Variation
der Einflussgröße X erklärt wird
=> je größer B, desto besser passen sich die Werte der Regressionsgeraden an

B = r² 0 ≤ B ≤ 1 Bsp.: … 88% … der Variabilität … des BD … lassen sich durch die


Variation des … Alters … erklären.

40 Kontingenztafel: Darstellung des Zus. von 2 nicht metrisch (=> nominal) skalierten Merkmalen S. 77
= Kreuztabelle = Kontingenztafel = Mehrfeldertafel
Merkmal X => Ausprägung 1… - k Merkmal Y => Ausprägung 1… - m

Darstellung der beobachteten Häufigkeiten in einer k*m-Tafel


(k = Anzahl der Zeilen, m = Anzahl der Spalten)
Zusätzlich: Darstellung von Zeilen-, Spalten-, Gesamtprozenten
Spalten- und Zeilensummen = Randsummen

41 Chi-Quadrat-Test ( -Test): besteht ein Zusammenhang zwischen X und Y oder ist es ein S. 79
Zufallsbefund?
42 Risikomaße (beschreiben Wahrs., z.B. dass man in einem bestimmten Zeitraum erkrankt) Übung
- Relatives Risiko RR => 10
Risikovergleich bei Kohortenstudien (Beobachtungen) RR =
(prospektiv, 2 Gruppen: eine weist Merkmal auf eine nicht)
- Odds Ratio (OR) =>
Quotientenverhältnis in Fall-Kontrollstudien (retrospektiv) OR =
=> nicht RR da Inzidenzen nicht geschätzt werden können (=Häufigkeit von Neuerkrankungen)

43

44

45

Das könnte Ihnen auch gefallen

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy