Die statistische Inferenz befasst sich mit Methoden, die es ermöglichen, aus der Analyse einer Stichprobe allgemeine Schlussfolgerungen über eine Grundgesamtheit zu ziehen. Darüber hinaus wird der Grad der Zuverlässigkeit oder Konfidenz der erzielten Ergebnisse untersucht. Im Folgenden geben wir dir einen Überblick über die gängigsten Methoden der statistischen Inferenz.

Unsere besten verfügbaren Mathematik-Lehrer
Gregor
5
5 (70 Bewertungen)
Gregor
55€
/h
Gift icon
1. Unterrichtsstunde gratis!
Justin
5
5 (25 Bewertungen)
Justin
40€
/h
Gift icon
1. Unterrichtsstunde gratis!
Sebastian
5
5 (140 Bewertungen)
Sebastian
60€
/h
Gift icon
1. Unterrichtsstunde gratis!
Rafael
5
5 (104 Bewertungen)
Rafael
80€
/h
Gift icon
1. Unterrichtsstunde gratis!
Benjamin
5
5 (30 Bewertungen)
Benjamin
35€
/h
Gift icon
1. Unterrichtsstunde gratis!
Lennart
5
5 (28 Bewertungen)
Lennart
50€
/h
Gift icon
1. Unterrichtsstunde gratis!
Peter
5
5 (93 Bewertungen)
Peter
105€
/h
Gift icon
1. Unterrichtsstunde gratis!
Elisabeth
5
5 (58 Bewertungen)
Elisabeth
34€
/h
Gift icon
1. Unterrichtsstunde gratis!
Gregor
5
5 (70 Bewertungen)
Gregor
55€
/h
Gift icon
1. Unterrichtsstunde gratis!
Justin
5
5 (25 Bewertungen)
Justin
40€
/h
Gift icon
1. Unterrichtsstunde gratis!
Sebastian
5
5 (140 Bewertungen)
Sebastian
60€
/h
Gift icon
1. Unterrichtsstunde gratis!
Rafael
5
5 (104 Bewertungen)
Rafael
80€
/h
Gift icon
1. Unterrichtsstunde gratis!
Benjamin
5
5 (30 Bewertungen)
Benjamin
35€
/h
Gift icon
1. Unterrichtsstunde gratis!
Lennart
5
5 (28 Bewertungen)
Lennart
50€
/h
Gift icon
1. Unterrichtsstunde gratis!
Peter
5
5 (93 Bewertungen)
Peter
105€
/h
Gift icon
1. Unterrichtsstunde gratis!
Elisabeth
5
5 (58 Bewertungen)
Elisabeth
34€
/h
Gift icon
1. Unterrichtsstunde gratis!
Los geht's

Arten von Stichproben

Eine Stichprobe besteht aus einer Teilmenge einer Grundgesamtheit. Die Stichprobe wird mit gekennzeichnet und die Grundgesamtheit mit . Es werden folgende Arten der Stichprobe unterschieden:

Einfache Zufallsstichprobe

Bei einer Zufallsstichprobe werden alle Elemente der Grundgesamtheit aufgezählt. Dann werden Elemente zufällig aus der Grundgesamtheit ausgewählt..

1 Wenn nach der Auswahl eines Elements dieses nicht erneut ausgewählt werden kann, wird die Stichprobe als Stichprobe ohne Wiederholung bezeichnet.

2 Kann dagegen das Element mehr als einmal ausgewählt werden, so spricht man von einer Stichprobe mit Wiederholung.

Systematische Zufallsstichprobe

Bei der systematischen Stichprobe wird ein zufälliger Ausgangspunkt gewählt. Davon ausgehend werden die anderen Elemente in gleichmäßigen Intervallen entnommen, bis die Stichprobe vollständig ist. Das heißt: , wobei zufällig ist.

Geschichtete Zufallsstichprobe

Bei geschichteten Zufallsstichproben wird die Grundgesamtheit natürlich in verschiedene Klassen oder Schichten unterteilt (diese müssen sich gegenseitig ausschließen); dann wird für jede der Schichten eine einfache Zufallsstichprobe gezogen.

Wenn der Umfang der einzelnen Teilgesamtheiten proportional zum Umfang der Schicht im Verhältnis zur Grundgesamtheit ist, dann handelt es sich um eine geschichtete Stichprobe mit proportionaler Zuordnung.

Cluster-Stichprobe

Auch hier wird die Grundgesamtheit in Klassen unterteilt (die sich jedoch nicht unbedingt gegenseitig ausschließen). Bei Cluster-Stichproben werden eher Klassen als einzelne Elemente untersucht.

Anstatt beispielsweise alle Studierenden einer Universität zu betrachten, nehmen wir eine Stichprobe von Unterrichtsräumen: So werden alle Studierenden in diesen Räumen befragt und die Stichprobe wird vereinfacht.

Verteilung der Stichprobenmittelwerte

Der zentrale Grenzwertsatz gibt Aufschluss über die Verteilung des Mittelwerts einer Stichprobe. Dies ist für statistische Inferenzen sehr wichtig.

Zentraler Grenzwertsatz

Zentraler Grenzwertsatz. sei eine Grundgesamtheit mit dem Mittelwert und der Standardabweichung . Wenn wir eine Stichprobe vom Umfang nehmen, nähern sich die Mittelwerte dieser Stichproben einer Normalverteilung mit dem Mittelwert und der Standardabweichung . Das heißt:

Die Bedingung, dass , ist nicht notwendig, wenn die ursprüngliche Grundgesamtheit einer Normalverteilung folgt.

Folgen des zentralen Grenzwertsatzes

Die folgenden Punkte sind wichtige Folgen des zentralen Grenzwertsatzes:

1 Er ermöglicht es, die Wahrscheinlichkeit zu bestimmen, dass der Mittelwert einer bestimmten Stichprobe innerhalb eines bestimmten Intervalls liegt.

2 Mit ihm lässt sich die Wahrscheinlichkeit berechnen, dass die Summe der Elemente einer Stichprobe grundsätzlich in einem bestimmten Intervall liegt. Dies folgt aus

3 Er hilft uns, von einer Stichprobe auf den Mittelwert der Grundgesamtheit zu schließen.

Schätzung von Stichprobenparametern

Es gibt zwei Möglichkeiten, einen Parameter oder eine Eigenschaft einer Grundgesamtheit zu schätzen: Punktschätzung und Intervallschätzung.

Punktschätzung

Die Punktschätzung erfolgt durch Berechnung einer einzigen Zahl, der Parameterschätzung. Bei einer Stichprobe wird also eine Zahl berechnet und als Wert des Parameters der Grundgesamtheit angenommen.

Es gibt folgende Punktschätzungen:

1 Der Mittelwert einer Grundgesamtheit mit Normalverteilung wird mit dem Durchschnittswert geschätzt

2 Die Standardabweichung einer Grundgesamtheit mit Normalverteilung wird anhand der Stichprobenabweichung geschätzt

3 Der Anteil einer Grundgesamtheit mit Binomialverteilung ergibt sich aus dem Stichprobenanteil

,

wobei die Anzahlder Elemente in ist, die die gewünschte Eigenschaft erfüllen.

Konfidenzintervalle

Ein Konfidenzintervall ist ein Intervall, bei dem wir wissen, dass der Parameter mit einem bestimmten Konfidenzniveau in diesem liegt.

Das Konfidenzniveau bezieht sich auf die Wahrscheinlichkeit, dass der zu schätzende Parameter innerhalb unseres Konfidenzintervalls liegt. Es wird in der Regel mit angegeben.

Der zulässige Schätzungsfehler bezieht sich auf die zulässige Fehlerwahrscheinlichkeit. Diese wird mit bezeichnet.

Der kritische Wert der Normalverteilung wird mit angegeben. Für den kritischen Wert gilt:

und somit auch

Charakteristische Intervalle

Für die Normalverteilung haben die Konfidenzintervalle die Form

Die folgende Tabelle zeigt die charakteristischen Intervalle für die häufigsten Signifikanzwerte:

Charakteristische Intervalle
0,900,051,645
0,950,0251,96
0,990,0052,575

Schätzung des Mittelwerts mit Konfidenzintervall

Um den Mittelwert einer Grundgesamtheit anhand der Stichprobe zu schätzen, wird das folgende Konfidenzintervall verwendet

,

wobei der Durchschnittswert von , die Standardabweichung von und der Umfang von ist. Außerdem ist das gewünschte Konfidenzniveau.

In diesem Fall ist der maximale Schätzungsfehler

.

Darüber hinaus wird der Stichprobenumfang, der für eine gewünschte Genauigkeit erforderlich ist, wie folgt berechnet

Um den erforderlichen Stichprobenumfang zu berechnen, müssen wir die Standardabweichung der Grundgesamtheit kennen. Diese kann mit einer kleinen Stichprobe geschätzt werden, und dann kann eine zweite Stichprobe mit dem erforderlichen Stichprobenumfang durchgeführt werden.

Verhältnisschätzung mit Konfidenzintervall

Angenommen, wir haben eine Grundgesamtheit , bei der ein Anteil dieser Grundgesamtheit ein bestimmtes Merkmal erfüllt. Somit folgt der Anteil der Elemente , die diese Eigenschaft bei einem Stichprobenumfang von erfüllen, näherungsweise einer Normalverteilung:

Daraus folgt, dass die Schätzung des Anteils aus dem Anteil von in einer Stichprobe durch das folgende Intervall erfolgt:

Der maximale Schätzungsfehler ist hier gegeben durch

Statistische Hypothesen und Arten von Tests

Ein statistischer Test ist ein Verfahren, mit dem aus einer Stichprobe auf die Gültigkeit einer Hypothese über einen bestimmten Parameter der Grundgesamtheit geschlossen werden kann.

Die Hypothese, die für die Grundgesamtheit gilt, wird mit angegeben und als Nullhypothese bezeichnet. Die Nullhypothese muss immer die Form „ist gleich“, „ist kleiner als oder gleich“ oder „ist größer als oder gleich“ haben.

Die Gegenhypothese zur Hypothese der Grundgesamtheit wird mit angegeben und ist die Alternativhypothese. Diese Hypothese hat die Form „ist anders als“, „ist größer als“ oder „ist kleiner als“.

Schritte zur Durchführung eines Hypothesentests

Das Verfahren zur Durchführung eines Hypothesentests (für den Mittelwert oder das Verhältnis ) ist im Allgemeinen wie folgt:

1 Die Nullhypothese und die Alternativhypothese werden angegeben.

2 Es wird das Konfidenzniveau oder das Signifikanzniveau bestimmt.

3 Damit wird der Wert (für den zweiseitigen Test) oder (für den einseitigen Test) berechnet.

4 Dann wird der Akzeptanzbereich des Stichprobenparameters konstruiert (weitere Einzelheiten im nächsten Abschnitt).

5 Aus der Grundgesamtheit wird eine Stichprobe mit gezogen, so dass die Normalverteilung angewendet werden kann.

6 Anhand der Stichlprobe wird oder berechnet.

7 Liegt der Wert des Stichprobenparameters innerhalb des Akzeptanzbereichs, so wird die Nullhypothese mit einem Signifikanzniveau von angenommen. Andernfalls wird abgelehnt.

Arten von Hypothesentests

Angenommen, wir haben eine Grundgesamtheit mit einem unbekannten Parameter (der der Mittelwert, der Anteil oder die Standardabweichung sein kann). Die Tests werden dann als zweiseitig oder einseitig klassifiziert. Diese Tests sind in der folgenden Tabelle zusammengefasst:

Zweiseitig
EinseitigH_A: r < r_0[/latex]

Zweiseitiger Test

Der zweiseitige Test ist gegeben, wenn die Nullhypothese die Form hat. In diesem Fall hat die Alternativhypothese die Form .

Wenn der Wert des Parameters in der Stichprobe ist, bedeutet dies, dass die Nullhypothese abgelehnt wird, wenn im Vergleich zu zu groß (oberer Bereich) oder zu klein (unterer Bereich) ist.

Für den Fall, dass wir den Mittelwert der Grundgesamtheit untersuchen wollen, wird das Konfidenzintervall wie folgt konstruiert:

Für den Anteil lautet das Konfidenzintervall

Einseitiger Test

Beim einseitigen Test gibt es zwei Fälle. Im ersten Fall ist die Nullhypothese vom Typ

und die Alternativhypothese lautet

In diesem Fall ist der Akzeptanzbereich bei der Überprüfung für den Mittelwert

Der Akzeptanzbereich für den Anteil ist

Im zweiten Fall ist die Nullhypothese vom Typ

und die Alternativhypothese lautet

kann oder sein.

Der Akzeptanzbereich bei der Überprüfung für den Mittelwert ist somit

Der Akzeptanzbereich für den Anteil ist

Schließlich müssen wir beachten, dass in den einseitigen Tests die folgenden kritischen Werte am häufigsten vorkommen:

0,900,101,28
0,950,051,645
0,990,012,33

Fehlerarten

Bei der Durchführung von Hypothesentests besteht immer die Möglichkeit, Fehler zu machen. Fehler werden als Fehler vom Typ I und vom Typ II klassifiziert.

Ein Fehler vom Typ I tritt auf, wenn wir die Nullhypothese als wahr ablehnen.

Ein Fehler vom Typ II tritt hingegen auf, wenn wir die Nullhypothese annehmen und sie wahr ist.

Die Fehlerarten sind in der folgenden Tabelle zusammengefasst:

wahrfalsch
AkzeptierenRichtige Entscheidung
Wahrscheinlichkeit von
Falsche Entscheidung
Fehler Typ II
AblehnenFalsche Entscheidung
Fehler Typ I
Wahrscheinlichkeit von
Richtige Entscheidung

Die Wahrscheinlichkeit, einen Fehler vom Typ I zu begehen, ist das Signifikanzniveau .

Andererseits wird die Wahrscheinlichkeit eines Fehlers vom Typ II üblicherweise mit angegeben. In diesem Fall ist die Trennschärfe des Tests. Am besten lässt sich reduzieren, indem man den Stichprobenumfang so weit wie möglich erweitert.

Du findest diesen Artikel toll? Vergib eine Note!

5,00 (1 Note(n))
Loading...

Katrin S.

Ich bin staatlich geprüfte Übersetzerin & Dolmetscherin mit den Arbeitssprachen Englisch, Spanisch, Deutsch. Meine Ausbildung habe ich am SDI München mit dem Fachgebiet Technik abvsolviert und übersetze hauptsächlich im technischen sowie mathematisch-naturwissenschaftlichen Bereich. Bei Superprof darf ich die Mathe-Expert*innen unterstützen, indem ich ihre Artikel ins Deutsche übersetze.