Kapitel
Die statistische Inferenz befasst sich mit Methoden, die es ermöglichen, aus der Analyse einer Stichprobe allgemeine Schlussfolgerungen über eine Grundgesamtheit zu ziehen. Darüber hinaus wird der Grad der Zuverlässigkeit oder Konfidenz der erzielten Ergebnisse untersucht. Im Folgenden geben wir dir einen Überblick über die gängigsten Methoden der statistischen Inferenz.
Arten von Stichproben
Eine Stichprobe besteht aus einer Teilmenge einer Grundgesamtheit. Die Stichprobe wird mit
gekennzeichnet und die Grundgesamtheit mit
. Es werden folgende Arten der Stichprobe unterschieden:
Einfache Zufallsstichprobe
Bei einer Zufallsstichprobe werden alle Elemente der Grundgesamtheit aufgezählt. Dann werden
Elemente zufällig aus der Grundgesamtheit ausgewählt..
1 Wenn nach der Auswahl eines Elements
dieses nicht erneut ausgewählt werden kann, wird die Stichprobe als Stichprobe ohne Wiederholung bezeichnet.
2 Kann dagegen das Element
mehr als einmal ausgewählt werden, so spricht man von einer Stichprobe mit Wiederholung.
Systematische Zufallsstichprobe
Bei der systematischen Stichprobe wird ein zufälliger Ausgangspunkt
gewählt. Davon ausgehend werden die anderen Elemente in gleichmäßigen Intervallen entnommen, bis die Stichprobe vollständig ist. Das heißt:
, wobei
zufällig ist.
Geschichtete Zufallsstichprobe
Bei geschichteten Zufallsstichproben wird die Grundgesamtheit natürlich in verschiedene Klassen oder Schichten unterteilt (diese müssen sich gegenseitig ausschließen); dann wird für jede der Schichten eine einfache Zufallsstichprobe gezogen.
Wenn der Umfang der einzelnen Teilgesamtheiten proportional zum Umfang der Schicht im Verhältnis zur Grundgesamtheit ist, dann handelt es sich um eine geschichtete Stichprobe mit proportionaler Zuordnung.
Cluster-Stichprobe
Auch hier wird die Grundgesamtheit in Klassen unterteilt (die sich jedoch nicht unbedingt gegenseitig ausschließen). Bei Cluster-Stichproben werden eher Klassen als einzelne Elemente untersucht.
Anstatt beispielsweise alle Studierenden einer Universität zu betrachten, nehmen wir eine Stichprobe von Unterrichtsräumen: So werden alle Studierenden in diesen Räumen befragt und die Stichprobe wird vereinfacht.
Verteilung der Stichprobenmittelwerte
Der zentrale Grenzwertsatz gibt Aufschluss über die Verteilung des Mittelwerts einer Stichprobe. Dies ist für statistische Inferenzen sehr wichtig.
Zentraler Grenzwertsatz
Zentraler Grenzwertsatz.
sei eine Grundgesamtheit mit dem Mittelwert
und der Standardabweichung
. Wenn wir eine Stichprobe vom Umfang
nehmen, nähern sich die Mittelwerte
dieser Stichproben einer Normalverteilung mit dem Mittelwert
und der Standardabweichung
. Das heißt:
Die Bedingung, dass
, ist nicht notwendig, wenn die ursprüngliche Grundgesamtheit
einer Normalverteilung folgt.
Folgen des zentralen Grenzwertsatzes
Die folgenden Punkte sind wichtige Folgen des zentralen Grenzwertsatzes:
1 Er ermöglicht es, die Wahrscheinlichkeit zu bestimmen, dass der Mittelwert einer bestimmten Stichprobe innerhalb eines bestimmten Intervalls liegt.
2 Mit ihm lässt sich die Wahrscheinlichkeit berechnen, dass die Summe der Elemente einer Stichprobe grundsätzlich in einem bestimmten Intervall liegt. Dies folgt aus

3 Er hilft uns, von einer Stichprobe auf den Mittelwert der Grundgesamtheit zu schließen.
Schätzung von Stichprobenparametern
Es gibt zwei Möglichkeiten, einen Parameter oder eine Eigenschaft einer Grundgesamtheit zu schätzen: Punktschätzung und Intervallschätzung.
Punktschätzung
Die Punktschätzung erfolgt durch Berechnung einer einzigen Zahl, der Parameterschätzung. Bei einer Stichprobe
wird also eine Zahl
berechnet und als Wert des Parameters der Grundgesamtheit angenommen.
Es gibt folgende Punktschätzungen:
1 Der Mittelwert
einer Grundgesamtheit mit Normalverteilung wird mit dem Durchschnittswert geschätzt

2 Die Standardabweichung
einer Grundgesamtheit mit Normalverteilung wird anhand der Stichprobenabweichung geschätzt

3 Der Anteil
einer Grundgesamtheit mit Binomialverteilung ergibt sich aus dem Stichprobenanteil
,
wobei
die Anzahlder Elemente in
ist, die die gewünschte Eigenschaft erfüllen.
Konfidenzintervalle
Ein Konfidenzintervall
ist ein Intervall, bei dem wir wissen, dass der Parameter mit einem bestimmten Konfidenzniveau in diesem liegt.
Das Konfidenzniveau bezieht sich auf die Wahrscheinlichkeit, dass der zu schätzende Parameter innerhalb unseres Konfidenzintervalls liegt. Es wird in der Regel mit
angegeben.
Der zulässige Schätzungsfehler bezieht sich auf die zulässige Fehlerwahrscheinlichkeit. Diese wird mit
bezeichnet.
Der kritische Wert der Normalverteilung wird mit
angegeben. Für den kritischen Wert gilt:
und somit auch
Charakteristische Intervalle
Für die Normalverteilung
haben die Konfidenzintervalle die Form
Die folgende Tabelle zeigt die charakteristischen Intervalle für die häufigsten
Signifikanzwerte:
![]() | ![]() | ![]() | Charakteristische Intervalle |
|---|---|---|---|
| 0,90 | 0,05 | 1,645 | ![]() |
| 0,95 | 0,025 | 1,96 | ![]() |
| 0,99 | 0,005 | 2,575 | ![]() |
Schätzung des Mittelwerts mit Konfidenzintervall
Um den Mittelwert einer Grundgesamtheit
anhand der Stichprobe
zu schätzen, wird das folgende Konfidenzintervall verwendet
,
wobei
der Durchschnittswert von
,
die Standardabweichung von
und
der Umfang von
ist. Außerdem ist
das gewünschte Konfidenzniveau.
In diesem Fall ist der maximale Schätzungsfehler
.
Darüber hinaus wird der Stichprobenumfang, der für eine gewünschte Genauigkeit erforderlich ist, wie folgt berechnet
Um den erforderlichen Stichprobenumfang zu berechnen, müssen wir die Standardabweichung der Grundgesamtheit kennen. Diese kann mit einer kleinen Stichprobe geschätzt werden, und dann kann eine zweite Stichprobe mit dem erforderlichen Stichprobenumfang durchgeführt werden.
Verhältnisschätzung mit Konfidenzintervall
Angenommen, wir haben eine Grundgesamtheit
, bei der ein Anteil
dieser Grundgesamtheit ein bestimmtes Merkmal erfüllt. Somit folgt der Anteil der Elemente
, die diese Eigenschaft bei einem Stichprobenumfang von
erfüllen, näherungsweise einer Normalverteilung:
Daraus folgt, dass die Schätzung des Anteils
aus dem Anteil von
in einer Stichprobe durch das folgende Intervall erfolgt:
Der maximale Schätzungsfehler ist hier gegeben durch
Statistische Hypothesen und Arten von Tests
Ein statistischer Test ist ein Verfahren, mit dem aus einer Stichprobe auf die Gültigkeit einer Hypothese über einen bestimmten Parameter der Grundgesamtheit geschlossen werden kann.
Die Hypothese, die für die Grundgesamtheit gilt, wird mit
angegeben und als Nullhypothese bezeichnet. Die Nullhypothese muss immer die Form „ist gleich“, „ist kleiner als oder gleich“ oder „ist größer als oder gleich“ haben.
Die Gegenhypothese zur Hypothese der Grundgesamtheit wird mit
angegeben und ist die Alternativhypothese. Diese Hypothese hat die Form „ist anders als“, „ist größer als“ oder „ist kleiner als“.
Schritte zur Durchführung eines Hypothesentests
Das Verfahren zur Durchführung eines Hypothesentests (für den Mittelwert
oder das Verhältnis
) ist im Allgemeinen wie folgt:
1 Die Nullhypothese
und die Alternativhypothese
werden angegeben.
2 Es wird das Konfidenzniveau
oder das Signifikanzniveau
bestimmt.
3 Damit wird der Wert
(für den zweiseitigen Test) oder
(für den einseitigen Test) berechnet.
4 Dann wird der Akzeptanzbereich des Stichprobenparameters konstruiert (weitere Einzelheiten im nächsten Abschnitt).
5 Aus der Grundgesamtheit wird eine Stichprobe mit
gezogen, so dass die Normalverteilung angewendet werden kann.
6 Anhand der Stichlprobe wird
oder
berechnet.
7 Liegt der Wert des Stichprobenparameters innerhalb des Akzeptanzbereichs, so wird die Nullhypothese mit einem Signifikanzniveau von
angenommen. Andernfalls wird
abgelehnt.
Arten von Hypothesentests
Angenommen, wir haben eine Grundgesamtheit
mit einem unbekannten Parameter
(der der Mittelwert, der Anteil oder die Standardabweichung sein kann). Die Tests werden dann als zweiseitig oder einseitig klassifiziert. Diese Tests sind in der folgenden Tabelle zusammengefasst:
| Zweiseitig | ![]() | ![]() |
|---|---|---|
| Einseitig | ![]() | H_A: r < r_0[/latex] |
![]() | ![]() |
Zweiseitiger Test
Der zweiseitige Test ist gegeben, wenn die Nullhypothese die Form
hat. In diesem Fall hat die Alternativhypothese die Form
.
Wenn
der Wert des Parameters in der Stichprobe ist, bedeutet dies, dass die Nullhypothese abgelehnt wird, wenn
im Vergleich zu
zu groß (oberer Bereich) oder zu klein (unterer Bereich) ist.
Für den Fall, dass wir den
Mittelwert der Grundgesamtheit untersuchen wollen, wird das Konfidenzintervall wie folgt konstruiert:
Für den Anteil
lautet das Konfidenzintervall
Einseitiger Test
Beim einseitigen Test gibt es zwei Fälle. Im ersten Fall ist die Nullhypothese vom Typ
und die Alternativhypothese lautet
In diesem Fall ist der Akzeptanzbereich bei der Überprüfung für den Mittelwert 
Der Akzeptanzbereich für den Anteil
ist
Im zweiten Fall ist die Nullhypothese vom Typ
und die Alternativhypothese lautet
kann
oder
sein.
Der Akzeptanzbereich bei der Überprüfung für den Mittelwert
ist somit
Der Akzeptanzbereich für den Anteil
ist
Schließlich müssen wir beachten, dass in den einseitigen Tests die folgenden kritischen Werte am häufigsten vorkommen:
![]() | ![]() | ![]() |
|---|---|---|
| 0,90 | 0,10 | 1,28 |
| 0,95 | 0,05 | 1,645 |
| 0,99 | 0,01 | 2,33 |
Fehlerarten
Bei der Durchführung von Hypothesentests besteht immer die Möglichkeit, Fehler zu machen. Fehler werden als Fehler vom Typ I und vom Typ II klassifiziert.
Ein Fehler vom Typ I tritt auf, wenn wir die Nullhypothese als wahr ablehnen.
Ein Fehler vom Typ II tritt hingegen auf, wenn wir die Nullhypothese annehmen und sie wahr ist.
Die Fehlerarten sind in der folgenden Tabelle zusammengefasst:
![]() | wahr | falsch |
|---|---|---|
| Akzeptieren | Richtige Entscheidung Wahrscheinlichkeit von ![]() | Falsche Entscheidung Fehler Typ II |
| Ablehnen | Falsche Entscheidung Fehler Typ I Wahrscheinlichkeit von ![]() | Richtige Entscheidung |
Die Wahrscheinlichkeit, einen Fehler vom Typ I zu begehen, ist das Signifikanzniveau
.
Andererseits wird die Wahrscheinlichkeit eines Fehlers vom Typ II üblicherweise mit
angegeben. In diesem Fall
ist die Trennschärfe des Tests. Am besten lässt sich
reduzieren, indem man den Stichprobenumfang
so weit wie möglich erweitert.













H_A: r < r_0[/latex]

