Kapitel
Definition der Häufigkeitsverteilung
Die Häufigkeitsverteilung oder Häufigkeitstabelle ist eine tabellarische Anordnung statistischer Daten, bei der jedem Datenelement die entsprechende Häufigkeit zugewiesen wird.
Arten von Häufigkeiten
Absolute Häufigkeit
Die absolute Häufigkeit gibt an, wie oft ein bestimmter Wert in einer statistischen Untersuchung auftritt.
Eine Münze wird Mal geworfen. Als Ergebnis taucht
Mal Kopf auf
Sie wird mit dargestellt, obwohl manche Autoren auch
schreiben.
Die Summe der absoluten Häufigkeiten ist gleich der Gesamtzahl der Daten und wird mit dargestellt.
Um diese Summen darzustellen, wird der griechische Buchstabe verwendet.
Relative Häufigkeit
Die relative Häufigkeit ist der Quotient aus der absoluten Häufigkeit eines bestimmten Werts und der Gesamtzahl der Daten.
Sie kann in Prozenz ausgedrückt werden und wird mit dargestellt.
Die relative Häufigkeit ist eine Zahl zwischen und
.
Die Summe der relativen Häufigkeiten ist .
Kumulierte Häufigkeit
Die kumulierte Häufigkeit ist die Summe der absoluten Häufigkeiten aller Werte, die kleiner oder gleich dem betrachteten Wert sind.
Sie wird wie folgt dargestellt:
Kumulierte relative Häufigkeit
Die kumulierte relative Häufigkeit ist der Quotient aus der kumulierten Häufigkeit eines bestimmten Werts und der Gesamtzahl der Daten.
Sie kann in Prozent ausgedrückt werden.
Beispiel:
Im Juli wurden in einer Stadt die folgenden Höchsttemperaturen gemessen:
.
In der ersten Spalte der Tabelle werden die Variablen vom kleinsten zum größten Wert sortiert
In der zweiten Spalte erfolgt die Zählung
In die dritte Spalte schreiben wir die absolute Häufigkeit
In die vierte schreiben wir die kumulierte Häufigkeit:
In das erste Feld schreiben wir die erste absolute Häufigkeit:
Im zweiten Feld wird der Wert der vorherigen kumulierten Häufigkeit plus die entsprechende absolute Häufigkeit addiert:
Im dritten Feld wird der vorherige kumulierte Häufigkeitswert plus die entsprechende absolute Häufigkeit addiert:
Die letzte Spalte muss sein (Summe von
).
In die fünfte Spalte schreiben wir die relativen Häufigkeiten . Diese sind das Ergebnis der Division jeder absoluten Häufigkeit durch
In die sechste schreiben wir die kumulierte relative Häufigkeit .
In das erste Feld schreiben wir die erste kumulierte relative Häufigkeit.
Im zweiten Feld wird der Wert der vorherigen kumulierten relativen Häufigkeit plus die entsprechende relative Häufigkeit addiert und so weiter bis zum letzten Feld, das gleich sein muss.
xi | Zählung | fi | Fi | ni | Ni |
---|---|---|---|---|---|
27 | I | 1 | 1 | 0,032 | 0,032 |
28 | II | 2 | 3 | 0,065 | 0,097 |
29 | 6 | 9 | 0,194 | 0,290 | |
30 | 7 | 16 | 0,226 | 0,516 | |
31 | 8 | 24 | 0,258 | 0,774 | |
32 | III | 3 | 27 | 0,097 | 0,871 |
33 | III | 3 | 30 | 0,097 | 0,968 |
34 | I | 1 | 31 | 0,032 | 1 |
31 | 1 |
Diese Art von Häufigkeitstabellen wird bei diskreten Variablen verwendet.
Gruppierte Häufigkeitsverteilung
Die gruppierte Häufigkeitsverteilung oder Tabelle mit gruppierten Daten wird verwendet, wenn die Variablen eine hohe Anzahl von Werten annehmen oder die Variable stetig ist.
Die Werte werden in Intervalle mit gleicher Breite gruppiert, die als Klassen bezeichnet werden. Jeder Klasse wird die entsprechende Häufigkeit zugeordnet.
Klassengrenzen
Jede Klasse wird durch die untere Klassengrenze und die obere Klassengrenze abgegrenzt.
Klassenbreite
Die Klassenbreite ist die Differenz zwischen Obergrenze und Untergrenze der Klasse.
Klassenmitte
Die Klassenmitte ist der Mittelpunkt jedes Intervalls und der Wert, der bei der Berechnung einiger Parameter das gesamte Intervall darstellt.
Die Klassenmitte wird wie folgt dargestellt:
Sie wird wie folgt berechnet: Obergrenze minus Untergrenze , dividiert durch 2
Erstellen einer Tabelle mit gruppierten Daten
.
1. Der kleinste und der größte Wert der Verteilung werden ermittelt. In diesem Fall sind das und
.
2. Wir subtrahieren und suchen nach einer ganzen Zahl, die etwas größer ist als die Differenz und
teilbar durch die Anzahl der Intervalle ist, die wir festlegen wollen.
Die Anzahl der Intervalle sollte zwischen und
liegen.
In diesem Fall, nämlich , erhöhen wir die Zahl auf
, also
Intervalle.
Bei der Bildung von Intervallen wird berücksichtigt, dass die Untergrenze einer Klasse zum Intervall gehört, die Obergrenze jedoch nicht, sondern zum nächsten Intervall gezählt wird.
ist die Klassenmitte, also der mittlere Wert eines jeden Intervalls.
ci | fi | Fi | ni | Ni | |
---|---|---|---|---|---|
[0, 5) | 2,5 | 1 | 1 | 0,025 | 0,025 |
[5, 10) | 7,5 | 1 | 2 | 0,025 | 0,050 |
[10, 15) | 12,5 | 3 | 5 | 0,075 | 0,125 |
[15, 20) | 17,5 | 3 | 8 | 0,075 | 0,200 |
[20, 25) | 22,5 | 3 | 11 | 0,075 | 0,275 |
[25, 30) | 27,5 | 6 | 17 | 0,150 | 0,425 |
[30, 35) | 32,5 | 7 | 24 | 0,175 | 0,600 |
[35, 40) | 37,50 | 10 | 34 | 0,250 | 0,850 |
[40, 45) | 42,5 | 4 | 38 | 0,100 | 0,950 |
[45, 50) | 47,5 | 2 | 40 | 0,050 | 1 |
40 | 1 |
Du hast immer noch Fragen zur Erstellung von Häufigkeitstabellen? Bei Superprof findest du Matheprofis, die dir gerne weiterhelfen.
Die Plattform, die Lehrer/innen und Schüler/innen miteinander verbindet