Das Fach Statistik bereitet dir aktuell Bauchschmerzen? Keine Sorge, sobald du dir erstmal einen guten Überblick verschafft und die wichtigsten Begriffe verinnerlicht hast, ist es gar nicht mehr so schlimm.

Zur besseren Vorbereitung auf deine nächste Statistikklausur oder Uniprüfung haben wir dir die Grundbegriffe dieser Disziplin strukturiert zusammengefasst. Wir hoffen, dass anschließend keine Fragen offenbleiben!

Die besten verfügbaren Lehrkräfte für Statistik
1. Unterrichtseinheit gratis!
Andrea
5
5 (49 Bewertungen)
Andrea
75€
/h
1. Unterrichtseinheit gratis!
Thomas
5
5 (26 Bewertungen)
Thomas
48€
/h
1. Unterrichtseinheit gratis!
Viktor
5
5 (132 Bewertungen)
Viktor
80€
/h
1. Unterrichtseinheit gratis!
Julien
4,9
4,9 (13 Bewertungen)
Julien
25€
/h
1. Unterrichtseinheit gratis!
Rafael
5
5 (24 Bewertungen)
Rafael
42€
/h
1. Unterrichtseinheit gratis!
Boris
5
5 (8 Bewertungen)
Boris
20€
/h
1. Unterrichtseinheit gratis!
Markus
5
5 (22 Bewertungen)
Markus
25€
/h
1. Unterrichtseinheit gratis!
Christoph
5
5 (28 Bewertungen)
Christoph
35€
/h
1. Unterrichtseinheit gratis!
Andrea
5
5 (49 Bewertungen)
Andrea
75€
/h
1. Unterrichtseinheit gratis!
Thomas
5
5 (26 Bewertungen)
Thomas
48€
/h
1. Unterrichtseinheit gratis!
Viktor
5
5 (132 Bewertungen)
Viktor
80€
/h
1. Unterrichtseinheit gratis!
Julien
4,9
4,9 (13 Bewertungen)
Julien
25€
/h
1. Unterrichtseinheit gratis!
Rafael
5
5 (24 Bewertungen)
Rafael
42€
/h
1. Unterrichtseinheit gratis!
Boris
5
5 (8 Bewertungen)
Boris
20€
/h
1. Unterrichtseinheit gratis!
Markus
5
5 (22 Bewertungen)
Markus
25€
/h
1. Unterrichtseinheit gratis!
Christoph
5
5 (28 Bewertungen)
Christoph
35€
/h
1. Unterrichtseinheit gratis>

Allgemeine Grundbegriffe der Datenerhebung

Jede Statistik basiert auf einer Datenerhebung. Es werden Daten gesammelt, strukturiert, ausgewertet, analysiert, interpretiert und zuletzt aufbereitet und präsentiert – doch am Anfang steht immer eine Erhebung von Daten.

Die häufigste Form der Datenerhebung, die Statistiker nutzen,  ist eine Umfrage. Dazu wird eine bestimmte Anzahl an Personen zu einem gewählten Thema befragt und die Antworten systematisch festgehalten.

Grundgesamtheit

Eine Grundgesamtheit umfasst alle Menschen einer bestimmten Gruppe der Gesellschaft, auf die sich die Umfrage bezieht. Untersuchst du beispielsweise die Notenverteilung von Studierenden in Deutschland, so bilden alle Studierende in Deutschland deine Grundgesamtheit.

Stichprobe

Da du wahrscheinlich nicht alle Studierende in Deutschland befragen kannst, arbeitet man in der Statistik mit Stichproben. Deine Stichprobe ist also der Teil deiner Grundgesamtheit, den du im Rahmen deiner Datenerhebung befragst.

Dabei sollte deine Stichprobe die Grundgesamtheit repräsentieren. Du solltest also darauf achten, dass die Verteilung von Alter, Geschlecht, Herkunft, Bildung, Einkommen, Wohnort etc. in etwa der realen Verteilung entspricht.

Was ist eine Stichprobe?
Die Stichprobe sind die Personen, über die du tatsächlich Daten sammelst bzw. vorliegen hast | Quelle: Unsplash

Stichprobenumfang

Der Stichprobenumfang n ist die Größe deiner Stichprobe. Hast du 30 Personen befragt, so ist dein Stichprobenumfang 30. Manchmal wird dieser auch Erhebungsumfang genannt.

Merkmal

Jede einzelne Frage bezieht sich auf ein Merkmal, das abgefragt wird. Mögliche untersuchte Merkmale sind beispielsweise das Alter, das Einkommen, die Lieblingsfarbe, das Studienfach, die Anzahl der Geschwister, Noten etc.

Merkmalsträger

Derjenige, der an deiner Umfrage beantwortet und die Fragen zu einzelnen Merkmalen beantwortet, ist der Merkmalsträger. In der Regel werden die Merkmalsträger anonym behandelt und nur allgemeine demografische Daten zu Alter, Wohnort etc. abgefragt.

Merkmalsausprägung

Bei der Merkmalsausprägung handelt es sich um die unterschiedlichen Antwortmöglichkeiten zu einer Frage nach einem Merkmal – also um die Formen, die ein Merkmal annehmen kann.

Dabei wird zwischen quantitativen und qualitativen Merkmalsausprägungen unterschieden. Klassische quantitative Merkmalsausprägungen sind zum Beispiel das Alter, das Einkommen und die Anzahl der Geschwister. Qualitative Merkmale sind hingegen das Studienfach, die Lieblingsfarbe oder auch Schulnoten.

Klasseneinteilung

Von einer Klasseneinteilung spricht man, wenn mehrere Merkmalsausprägungen zu einer Klasse zusammengefasst werden. Das ist zum Beispiel häufig beim Alter der Fall: Hier werden gerne Altersklassen wie unter 20, 20-29, 30-39, 40-49 etc. gebildet. Es liegt im Ermessen der Datenerhebenden, ob eine Klasseneinteilung sinnvoll ist oder nicht.

Beobachtungswerte

Alle Antworten auf die Fragen, also die genannten Merkmalsausprägungen, stellen die Beobachtungswerte dar. In der Regel ist die Anzahl der Beobachtungswerte gleich dem Stichprobenumfang – es sei denn, eine Mehrfachnennung bzw. mehrere Antworten bei einer Frage sind möglich.

Urliste

In der Urliste werden alle Beobachtungswerte übersichtlich eingetragen und getrennt nach den einzelnen Merkmalen festgehalten. Diese Liste ist die Basis für alle weiterführenden Auswertungen.

Grundbegriffe der deskriptiven Statistik

Die deskriptive oder beschreibende Statistik befasst sich mit der Analyse einer Stichprobe. Die erhobenen Daten werden ausgewertet und in Bezug auf ebendiese Stichprobe interpretiert.

Zentrale Instrumente der deskriptiven Statistik sind die Untersuchung der Zentralmaße sowie der Streuungsmaße. Über diese geben wir dir in diesem Kapitel einen groben Überblick.

Die unterschiedlichen Skalenniveaus

Welche Zentral- und Streuungsmaße du überhaupt errechnen kannst, ist abhängig vom Skalenniveau des jeweiligen Merkmals. Es werden drei unterschiedliche Skalen definiert.

Nominalskala

Bei einer Nominalskala können die Merkmalsausprägungen klar voneinander unterschieden, aber nicht in eine Rangordnung gebracht werden. Es gibt also kein „besser oder schlechter“ oder „größer oder kleiner“. Typische Beispiele für eine Nominalskala sind das Geschlecht oder die Haarfarbe.

Was ist die Nominalskala?
Ein Beispiel für eine Nominalskala ist die Haarfarbe | Quelle: Unsplash

Ordinalskala

Bei einer Ordinalskala können die Merkmalsausprägung zusätzlich zur Unterscheidung auch in eine Reihenfolge gebracht werden. Bei dieser Rangordnung kann aber keine Aussage zu den Abständen zwischen zwei Ausprägungen gebracht werden. Sie können also nicht quantitativ verglichen werden, im Sinne von A ist halb so viel wie B. Beispiels für Ordinalskalen sind Schulnoten oder die Zufriedenheit mit etwas.

Metrische Skala

Metrische Daten können unterschieden und in eine Rangordnung gebracht werden, bei welcher die Abstände klar gemessen werden können. Es gibt zwei Arten von metrischen Skalen: Die Verhältnisskala und die Intervallskala.

Was ist eine metrische Skala?
Die Temperatur ist ein Beispiel für ein metrisches Skalenniveau, genauer gesagt eine Intervallskala | Quelle: Unsplash

Bei einer Intervallskala sind die Abstände konstant, der Nullpunkt aber willkürlich definiert. Das ist zum Beispiel bei Temperaturen in Grad Celsius oder beim Kalenderdatum bzw. Jahr der Fall.

Bei einer Verhältnisskale (bzw. Ratioskala) liegt ein echter, natürlicher Nullpunkt vor – wie beim Gewicht, beim Alter, bei der Größe oder beim Einkommen. Die Verhältnisse sind also exakt vergleichbar und nicht nur anhand von Intervallen.

Zentralmaße der deskriptiven Statistik

Zentralmaße oder Mittelmaße kommen zum Einsatz, um die zentrale Tendenz eines Merkmals zu ermitteln. Nicht jedes Mittelmaß kann für jedes Skalenniveau angewendet werden, daher solltest du mit allen Maßen vertraut sein und jeweils das Passende auswählen.

Arithmetisches Mittel

Beim arithmetischen Mittel handelt es sich um den typischen Durchschnittswert, den du wahrscheinlich bereits im Schlaf errechnen kannst. Dies ist das wichtigste Mittelmaß, das aber nur bei verhältnis- und intervallskalierten Niveaus verwendet werden kann.

Im Grunde rechnest du alle unterschiedlichen Merkmalsausprägungen zusammen und teilst die Summe durch die Anzahl der Merkmalsausprägungen.

Gewichtetes arithmetisches Mittel

Beim gewichteten arithmetischen Mittel wird einbezogen, ob gewisse Merkmalsausprägungen häufiger als einmal vorkamen. Du multiplizierst also jede Merkmalsausprägung mit ihrer relativen Häufigkeit.

Median

Der Median teilt alle Werte in zwei gleich große Teilmengen. Da die Werte dafür geordnet werden müssen, muss mindestens eine Ordinalskala vorliegen. Der Median ist dann der Wert, der sich genau in der Mitte befindet. Handelt es sich um eine gerade Anzahl an Werten, wird das arithmetische Mittel der beiden mittleren Werte errechnet. Ausreißer werden beim Median nicht gesondert berücksichtigt.

Modus / Modalwert

Der Modus oder auch Modalwert genannt ist der Wert, der am häufigsten vorkommt. Er kann bei jedem Skalenniveau ermittelt werden. Es ist möglich, dass eine Stichprobe mehrere Modalwerte hat.

Minimum

Das Minimum ist der kleinste Wert einer Datenmenge.

Maximum

Das Maximum ist hingegen der größte Wert einer Datenmenge.

Streuungsmaße der deskriptiven Statistik

Ein Zentralmaß allein ist häufig nur begrenzt aussagekräftig. Schließlich gibt es keine Aussage darüber, wie sehr die Werte um dieses Mittelmaß herumgestreut sind, ob es große Ausreißer gibt oder nicht. Deshalb werden zusätzlich sogenannte Streuungsmaße untersucht.

Spannweite

Bei der Spannweite handelt es sich um den Abstand vom kleinsten Wert, dem Minimum, zum größten Wert, dem Maximum. Dies ist das am einfachsten zu errechnende Streuungsmaß.

Standardabweichung und Varianz

Die Standardabweichung zeigt die Streuung der Werte um den Mittelwert herum an. Eine hohe Standardabweichung bedeutet, dass die Werte stark gestreut sind. Eine kleine Standardabweichung bedeutet, dass die Werte nah um den Mittelwert herumliegen. Mithilfe der Standardabweichung können zum Beispiel auch Datenreihen miteinander verglichen werden, die denselben Mittelwert haben.

Bei der Standardabweichung handelt es sich um die Wurzel der Varianz. Für die Varianz zieht man von jedem Wert den Mittelwert ab und nimmt das Ergebnis zum Quadrat. Alle so ermittelten Werte addiert man und teilt sie durch den Stichprobenumfang. Die Werte werden zum Quadrat genommen, damit es keine negativen Werte gibt.

Darauf folgt, dass die Varianz und Standardabweichung keinen Aufschluss darüber geben, ob die Werte nach oben oder nach unten gestreut sind. Der Vorteil der Standardabweichung gegenüber der Varianz ist, dass die Dimension des Werts wieder der der Ausgangswerte entspricht und somit leichter zu deuten ist.

Variationskoeffizient

Die Höhe der Standardabweichung ist natürlich auch abhängig von der Höhe der erhobenen Messwerte. Liegt ein hoher Mittelwert vor, wird automatisch auch eine höhere Standardabweichung vorliegen.

Um die Streuung unterschiedlicher Datenreihen miteinander vergleichen zu können, empfiehlt sich deshalb die Ermittlung des Variationskoeffizienten. Dazu dividierst du die Standardabweichung durch den arithmetischen Mittelwert. So erhältst du einen relativen Kennwert, auch relative Standardabweichung genannt.

Quartile

Wenn es sich bei deinem Skalenniveau um eine ordinale Skala handelt, kannst du kein arithmetisches Mittel und so auch keine Standardabweichung und keinen Variationskoeffizienten errechnen. Um dennoch einen Eindruck von der Streuung deiner Messwerte zu bekommen, kannst du die Quartile untersuchen.

Ein Quartil umfasst jeweils 25 % der Messwerte, es liegen also stets vier Quartile vor. Der Median befindet sich genau in der Mitte bei 50 %. Die beiden mittleren Quartile, die also zusammen 50 % der Werte enthalten, wird Quartilsabstand genannt.

Grundbegriffe der induktiven Statistik

Das Ziel der induktiven Statistik ist es, von einer Stichprobe auf die Grundgesamtheit schließen zu können. Dazu bedient man sich der Wahrscheinlichkeitsrechnung. Mit den folgenden Grundbegriffen der induktiven Statistik solltest du dich vertraut machen.

Was sind die wichtigsten Begriffe der induktiven Statistik?
Ein Zufallsexperiment ist eine Methode der induktiven Statistik | Quelle: Unsplash

Zufallsexperiment

Ein Zufallsexperiment ist ein Experiment, dessen Ausgang nicht genau vorhergesagt werden kann. Stattdessen kann lediglich die Wahrscheinlichkeit bestimmter Ereignisse errechnet werden. Ein klassisches Zufallsexperiment ist das Würfelspiel.

Zufallsvariablen

Mit den Zufallsvariablen sind die Merkmale gemeint, dessen Werte beim Zufallsexperiment beobachtet werden und zufällig vorkommen.

Wahrscheinlichkeitsverteilung

Die Wahrscheinlichkeitsverteilung ordnet jedem Ereignis, dass beim Zufallsexperiment auftreten kann, eine Wahrscheinlichkeit zu. Alle Wahrscheinlichkeiten zusammen betrachtet stellen die Wahrscheinlichkeitsverteilung dar, die insgesamt 100 % ergeben sollte.

Hypothesentest

Mit einem Hypothesentest überprüfst du anhand der Erkenntnisse aus deiner Stichprobenuntersuchung, ob eine vorab aufgestellte Hypothese über die betroffene Grundgesamtheit zutrifft.

Schätzverfahren

Hierbei handelt es sich um spezielle Verfahren, mit denen du anhand von Schätzungen von der Stichprobe auf die Grundgesamtheit Rückschlüsse ziehst.

Auf der Suche nach einer Lehrkraft für Statistik?

Dir gefällt unser Artikel?

5,00/5 - 1 vote(s)
Loading...

Miriam

Miriam arbeitet als freie Autorin & Yogalehrerin. Getrieben von großer Neugier liebt sie es, Neues zu entdecken und zu erlernen; sich selbst weiterzuentwickeln und anderen dabei zu helfen.