Kapitel
Was ist ein Histogramm
Ein Histogramm ist die grafische Darstellung in Form von Säulen und zeigt die Häufigkeitsverteilung von Daten. Histogramme dienen dazu, einen allgemeinen "ersten Überblick" über die Verteilung der Grundgesamtheit oder der Stichprobe in Bezug auf ein kontinuierliches, quantitatives Merkmal zu erhalten.
In einem Histogramm besteht die -Achse (oder Abszisse) aus dem Bereich, in dem sich die Daten befinden. Die Grundseiten der Rechtecke bestehen nun aus den Intervallen, in denen wir die Daten gruppieren.
Auf der -Achse (oder Ordinatenachse) haben wir dagegen mehr Optionen und von diesen Optionen hängt die Art des Histogramms ab. Die beiden wichtigsten Arten von Histogrammen sind die folgenden:
-
-
Histogramm der absoluten Häufigkeiten. Stellt die absolute Häufigkeit durch die Höhe der Säulen dar.
-
-
Histogramm der relativen Häufigkeiten. Stellt die relative Häufigkeit durch die Höhe der Säulen dar.
Da wir nun die Eigenschaften eines Histogramms kennen, können wir eines erstellen. Dazu müssen wir folgende Schritte befolgen.
-
-
Wir zeichnen die x-Achse so, dass sie mindestens den Bereich der Daten umfasst und teilen diesen Bereich dann in die angegebenen Intervalle ein.
-
-
-
Wir zeichen die y-Achse so, dass je nach Fall die absoluten oder relativen Häufigkeiten dargestellt werden.
-
-
Die Rechtecke werden mit einer Breite gezeichnet, die gleich und proportional zum Intervall ist (in unserem Fall haben sie alle die gleiche Breite), und einer Höhe, die der absoluten oder relativen Häufigkeit entspricht.
Beispel. Sehen wir uns folgende Daten an
Alter | Personen |
---|---|
[0, 10) | 9 |
[10, 20) | 13 |
[20, 30) | 19 |
[30, 40) | 15 |
[40, 50) | 13 |
[50, 60) | 10 |
[60, 70) | 7 |
[70, 80) | 6 |
[80, 90) | 5 |
[90, 100] | 3 |
Gesamt: | 100 |
Unser Histogramm der absoluten Häufigkeiten würde wie folgt aussehen
Andererseits würde unser Histogramm der relativen Häufigkeiten wie folgt aussehen
Eine Normalverteilungskurve der Häufigkeiten gibt die gleichen Informationen wie ein Histogramm. Dazu wird für jede Klasse des Datensatzes ein Punkt gezeichnet, wobei auf der x-Achse der Wert des Mittelpunkts der Klasse und auf der y-Achse der gleiche Wert wie die Höhe des Rechtecks eingetragen wird. Am Ende verbinden wir jeden Punkt mit dem vorhergehenden und dem darauffolgenden Punkt.
Beispiel. Wir verwenden denselben Datensatz wie im vorhergehenden Beispiel
Alter | Personen (fi) | Kumulierte Häufigkeit (Fi) | ci |
---|---|---|---|
[0, 10) | 9 | 9 | 5 |
[10, 20) | 13 | 22 | 15 |
[20, 30) | 19 | 41 | 25 |
[30, 40) | 15 | 56 | 35 |
[40, 50) | 13 | 69 | 45 |
[50, 60) | 10 | 79 | 55 |
[60, 70) | 7 | 86 | 65 |
[70, 80) | 6 | 92 | 75 |
[80, 90) | 5 | 97 | 85 |
[90, 100] | 3 | 100 | 95 |
Gesamt: | 100 |
Histogramm und Normalverteilungskurve der kumulierten Häufigkeiten
Wenn die kumulierten Häufigkeiten einer Tabelle aus gruppierten Daten dargestellt werden, erhält man ein Histogramm der kumulierten Häufigkeiten und die entsprechende Normalverteilungskurve.
Beispiel. Wir verwenden denselben Datensatz wie im vorhergehenden Beispiel
Alter | Personen (fi) | Kumulierte Häufigkeit (Fi) | ci |
---|---|---|---|
[0, 10) | 9 | 9 | 5 |
[10, 20) | 13 | 22 | 15 |
[20, 30) | 19 | 41 | 25 |
[30, 40) | 15 | 56 | 35 |
[40, 50) | 13 | 69 | 45 |
[50, 60) | 10 | 79 | 55 |
[60, 70) | 7 | 86 | 65 |
[70, 80) | 6 | 92 | 75 |
[80, 90) | 5 | 97 | 85 |
[90, 100] | 3 | 100 | 95 |
Gesamt: | 100 |
Histogramme mit unterschiedlichen Klassenbreiten
In diesem Fall muss das Histogramm die Häufigkeit jedes Intervalls durch die Fläche des Balkens und nicht durch seine Höhe darstellen. Daher berechnen wir die Höhe der einzelnen Balken wie folgt
Hierbei gilt:
-
ist die Höhe des Intervalls
-
ist die absolute oder relative Häufigkeit des Intervalls
ist die Klassenbreite
Die Idee der Normalverteilungskurve der Häufigkeiten bleibt genau die gleiche.
Beispiel. Betrachten wir nun eine andere Gruppierung der Daten
Alter | ci | Personen (fi) | Relative Häufigkeit (fi*) | hi relativ |
---|---|---|---|---|
[0, 10) | 5 | 9 | 0,09 | 0,09/10 = 0,009 |
[10, 20) | 15 | 13 | 0,13 | 0,13/10 = 0,013 |
[20, 30) | 25 | 19 | 0,19 | 0,19/10 = 0,019 |
[30, 60) | 45 | 35 | 0,38 | 0,38/30 = 0,012667 |
[60, 70) | 65 | 7 | 0,07 | 0,07/10 = 0,007 |
[70, 80) | 75 | 6 | 0,06 | 0,06/10 = 0,006 |
[80, 90) | 85 | 5 | 0,05 | 0,05/10 = 0,005 |
[90, 100] | 95 | 3 | 0,03 | 0,03/10 = 0,003 |
Gesamt: | 100 | 1 |
Das Histogramm und die Normalverteilungskurve der relativen Häufigkeiten würde wie folgt aussehen
Die Plattform, die Lehrer/innen und Schüler/innen miteinander verbindet