Statistik Zusammenfassung
Statistik Zusammenfassung
3 Stichprobe = Teilmenge, die die GG repräsentiert (Beschreibung mit statistischen Maßzahlen) S. 1,22
Qualitativ/kategorial quantitativ/metrisch
durch Namen z.B. Trainingszustand binär, dichotom zählen z.B. Zahl messen
gekennzeichn. gut – schlecht 2 Kategorien der Medaillen z.B. KG
z.B. Sportart z.B. m/w Alter
9 Statistische Maßzahlen: S. 6
10 Lokalisationsmaße (Lagemaße) => Charakterisierung der erfassten Daten bzgl. Der Lage des S. 6
Zentrums der Verteilung
=> Rangliste x(1), x(2), x(3), …, x(n) 0,25-Quantil = n x 0,25 (wenn ung. Zahl => aufrunden)
Perzentile 0,01; 0,02… Dezile: 0,1; 0,2… Quartile: 0,25; 0,5; 0,75
11 Streuungsmaße = geben an, wie stark die Daten um einen zentralen Wert streuen S. 8
(zum jeweiligen Lokalisationsmaßgehört ein Streuungsmaß)
Tabelle
S. 9
- Varianz s² = Mittlere Abweichung vom Mittelwert
13 Boxplot S. 10
S. 11
- Nichtnegativität: 0 ≤ P(A) ≤ 1
- Normierung: für das sichere Ereignis gilt P(S)=1
- Additivität: für disjunkte Ereignisse A und B gilt P( )=P(A) x P(B)
18 Bedingte Wahrscheinlichkeit (bei abhängigen Ereignissen) P(AIB) => A unter der Bedingung B S. 19
19 Zufallsvariable = Variablen, die ihren möglichen Wert in Abhängigkeit von Zufall, gemäß S. 23
bestimmter Verteilungen annehmen (es gibt stetige und diskrete ZV)
20 Diskrete Zufallsvariablen => falls nur abzählbar verschiedene Versuchsausgänge x1, x2, …, xn S. 23
auftreten können
Darstellung der Wahrs.en für eine ZV, dass diese einen Wert kleiner oder gleich x annimmt
= Verteilungsfunktion F(X) (Treppenkurve) F(X)=P(X≤x)
26 Punktschätzer: Schätzer, die einen Wert angeben z.B. arithmetisches Mittel einer Stichprobe S. 35
(ein Parameter wird geschätzt) als Schätzer für des wahren Mittelwert µ
27 Intervallschätzer: Aussagen über die Genauigkeit der Schätzung (es wird um den S. 36
Punktschätzer ein Intervall konstruiert (Konfidenzintervall))
Konfidenzintervall gibt an, mit welchem Maß an Vertrauen es den wahren Parameter enthält
(je breiter das Intervall, desto größer die Wahrs., dass es den Parameter enthält)
= Wahrs. Dafür, dass der Parameter nicht im Intervall liegt
=> je größer die Sicherheit eines Konfidenzintervalls, desto größer das Intervall (=unschärfer)
=> je kleiner der Stichprobenumfang, desto größer das Intervall
Konfidenzintervall ermitteln: S. 37
- Wert ơ ist bekannt:
28 α = Signifikanzniveau = S. 42
Irrtumswahrscheinlich-
keit => gibt Wahrs. an,
H0 fälschlich abzulehnen
üblich: 0,05; 0,01;0,001
29 t-Test (Normwertvergleich) S. 50
Funktion: überprüfen, ob der Mittelwert einer GG mit einem vorgegebenen Erwartungswert
übereinstimmt
30 t-Test für 2 unabhängige Stichproben, Merkmal normalverteilt S. 51
S. 66
Statistische Prüfung der Korrelationskoeffizienten:
Zeigt r Unabhängigkeit (H0) oder Korrelation (Zusammenhang) (HA) an?
S. 67
Fehlerquellen bei der Korrelationsanalyse:
- Ausreißer
- Inhomogenität (Datenmaterial besteht aus 2 Teilmengen => nur deshalb Korrelation)
- Gemeinsamkeitskorrelation (2 Merkmale haben keinen Zusammenhang aber unterliegen einer
unbekannten 3. Größe => partielle Korrelation Skript S. 68
- selektionsbedingte Korrelation
- Formale Korrelation
37 Regressionsanalyse: = Ziel die „beste“ Gerade zu best. die durch die Daten gelegt werden kann S. 69
Annahmen bei der linearen Regression:
- der wahre Zusammenhang ist linear
- die Daten streuen gleichm. um die Regressionsgerade über den gesamten betrachteten Bereich
- die Stichprobe ist homogen
S. 70
Bestimmung der Regressionsgerade = Methode der kleinsten Quadrate:
Y=a+bxX (a=Achsenabschnitt, b= Regressionskoeffizient = Steigung)
- Wenn eindeutig klar ist, welches Merkmal das abhängige (Zielgröße) und welches das S. 71
unabhängige (Einflussgröße) ist, dann kann nur eine Regressionsanalyse von Y auf X
durchgeführt werden (wenn nicht: in beide Richtungen)
- der Schnittpunkt der beiden Regres.geraden (von Y auf X und von X auf Y) ist der Schwerpunkt
S. 70
byx gibt an, um wie viele Einheiten Y im Mittel zunimmt bzw. abnimmt, wenn X um eine Einheit
zunimmt.
Bsp. Der Regressionskoeffizient gibt an, dass … (HFpost) … im Mittel um … bxy …
zunimmt/abnimmt, wenn … (HFprae) … um eine Einheit zunimmt
38 S. 72
Statistische Prüfung des Regressionskoeffizienten bxy:
H0 : βyx = 0 => Anstieg der Regressionsgeraden in der GG ist Null
HA : βyx ‡ 0 => Anstieg der Regressionsgeraden in der GG ist ungleich Null
Wenn das 95%-Konfidenzintervall die Null nicht enthält, kann H0 bei einer
Irrtumswahrscheinlichkeit von α=5% verworfen werden
40 Kontingenztafel: Darstellung des Zus. von 2 nicht metrisch (=> nominal) skalierten Merkmalen S. 77
= Kreuztabelle = Kontingenztafel = Mehrfeldertafel
Merkmal X => Ausprägung 1… - k Merkmal Y => Ausprägung 1… - m
41 Chi-Quadrat-Test ( -Test): besteht ein Zusammenhang zwischen X und Y oder ist es ein S. 79
Zufallsbefund?
42 Risikomaße (beschreiben Wahrs., z.B. dass man in einem bestimmten Zeitraum erkrankt) Übung
- Relatives Risiko RR => 10
Risikovergleich bei Kohortenstudien (Beobachtungen) RR =
(prospektiv, 2 Gruppen: eine weist Merkmal auf eine nicht)
- Odds Ratio (OR) =>
Quotientenverhältnis in Fall-Kontrollstudien (retrospektiv) OR =
=> nicht RR da Inzidenzen nicht geschätzt werden können (=Häufigkeit von Neuerkrankungen)
43
44
45