Statistik gehört zu den Bereichen, mit denen wohl jeder schon einmal Kontakt hatte. Von der Interpretation einer Prozentzahl, dem Lesen eines Diagramms oder sogar der Durchführung eines Chi-Quadrat-Tests gibt es in der Statistik viele Teilgebiete, mit denen Ihr vielleicht schon mal etwas zu tun hattet.

Außerdem ist die Statistik Teil vieler verschiedener Lebensbereiche. In der Wissenschaft wird sie natürlich besonders häufig angewendet, aber auch in der Politik, der Wirtschaft und sogar beim Online-Dating mit Apps! Die Statistik hat eine lange Geschichte, die Grundlagen sind aber schnell erklärt.

Die Statistik teilt sich in verschiedene Teilgebiete, davon ist eins die Inferenzstatistik, auch mathematische Statistik genannt. Die stellen wir Euch hier vor!

Die besten verfügbaren Lehrkräfte für Statistik
1. Unterrichtseinheit gratis!
Andrea
5
5 (49 Bewertungen)
Andrea
75€
/h
1. Unterrichtseinheit gratis!
Thomas
5
5 (26 Bewertungen)
Thomas
48€
/h
1. Unterrichtseinheit gratis!
Viktor
5
5 (132 Bewertungen)
Viktor
80€
/h
1. Unterrichtseinheit gratis!
Julien
4,9
4,9 (13 Bewertungen)
Julien
25€
/h
1. Unterrichtseinheit gratis!
Rafael
5
5 (24 Bewertungen)
Rafael
42€
/h
1. Unterrichtseinheit gratis!
Boris
5
5 (8 Bewertungen)
Boris
20€
/h
1. Unterrichtseinheit gratis!
Markus
5
5 (22 Bewertungen)
Markus
25€
/h
1. Unterrichtseinheit gratis!
Christoph
5
5 (28 Bewertungen)
Christoph
35€
/h
1. Unterrichtseinheit gratis!
Andrea
5
5 (49 Bewertungen)
Andrea
75€
/h
1. Unterrichtseinheit gratis!
Thomas
5
5 (26 Bewertungen)
Thomas
48€
/h
1. Unterrichtseinheit gratis!
Viktor
5
5 (132 Bewertungen)
Viktor
80€
/h
1. Unterrichtseinheit gratis!
Julien
4,9
4,9 (13 Bewertungen)
Julien
25€
/h
1. Unterrichtseinheit gratis!
Rafael
5
5 (24 Bewertungen)
Rafael
42€
/h
1. Unterrichtseinheit gratis!
Boris
5
5 (8 Bewertungen)
Boris
20€
/h
1. Unterrichtseinheit gratis!
Markus
5
5 (22 Bewertungen)
Markus
25€
/h
1. Unterrichtseinheit gratis!
Christoph
5
5 (28 Bewertungen)
Christoph
35€
/h
1. Unterrichtseinheit gratis>

Die Basics der Statistik

Datenanalyse und statistische Methoden sind in aller Munde. Der Grund dafür liegt in der steigenden Relevanz von Daten. Denn egal, wo wir hinschauen, begegnen uns Daten. Die Art und Weise, wie Menschen Lebensmittel einkaufen, kann mit Daten erfasst werden, aber auch die Funktionalität einer Dating App basiert auf statistischen Methoden.

Die Statistik begleitet uns alle immer mehr, zum Beispiel wenn wir Daten und Diagramme betrachten.
Mit Statistik kommen wir alle immer stärker in Berührung - zum Beispiel, wenn wir uns in verschiedenen Apps Diagramme anzeigen lassen. | Quelle: Unsplash

In Bereichen wie der Biostatistik und der Analyse von Unternehmen oder Geschäftsmodellen gab es die Statistik und statistische Daten schon lange bevor der Computer erfunden wurde. Früher, in der Antike, gab es auch schon Statistiker und die nutzten kategorische und numerische Daten, um Bewegungen in der Landwirtschaft, beim Wetter und im Handel aufzuzeichnen und zu analysieren.

Die Bayessche Statistik hat die Arbeit von Statistikern revolutioniert. Seitdem werden anspruchsvollere Methoden zur Erstellung von Prognosen mit einbezogen. Trotzdem beruht die Statistik nach wie vor auf drei Grundideen:

  • Erheben von Daten und Auswahl einer Stichprobengröße
  • Datenanalyse
  • Kreative Wege gehen, um die Daten darzustellen und zu interpretieren

Statistische Berechnungen für Einsteiger

Die detaillierten Einzelheiten der statistischen Analyse wirkt auf den Laien erst einmal kompliziert und schwer greifbar. Deshalb beginnen wir mit den Grundlagen der Statistik und der Wahrscheinlichkeitstheorie. Es ist zwar schwer die vielen Teilgebiete der Statistik in ein paar Absätzen darzustellen, die statistische Datenanalyse ist aber eine Disziplin, mit der wir alle in unserem Alltag etwas zu tun haben.

Denn von der Erstellung des monatlichen Budgets - bei der Arbeit oder im Privaten - bis zur Visualisierung aufschlussreicher Daten hat die Statistik längst ihren Platz in Deinem Alltag gefunden. Die Welt der statistischen Analyse ist groß, da müssen wir zunächst Unterschiede zwischen den beiden großen Teilgebieten der Statistik kennenlernen: Die inferentielle und die deskriptive Statistik.

Die deskriptive Statistik heißt auch beschreibende Statistik. Und genau darum geht es: Die Informationen, die in Rohdaten tatsächlich enthalten sind, werden mit der deskriptiven Statistik greifbar gemacht. Beispielsweise hast Du Unmengen von Daten und möchtest Aussagen über den Mittelwert oder die Abweichung vom Mittelwert treffen. Oder Du möchtest die Spannweite der Daten herausfinden. In der induktiven Statistik ist der Ansatz anders, denn hier betrachtest Du einzelne Werte aus einer großen Grundgesamtheit. Diese Werte analysierst Du und überträgst sie auf die Grundgesamtheit. Somit kannst Du nützliche Vorhersagen und Prognosen treffen.

Die Inferenzstatistik testet eine Hypothese und eine Nullhypothese auf Stichprobendaten, um Kennzahlen zu testen, die wir im wirklichen Leben nicht messen können. Das können zum Beispiel Aussagen über die Bevölkerung sein, die es gibt, obwohl nicht alle Menschen befragt wurden. Mit anderen Worten: In der Inferenzstatistik wird ein Datensatz analysiert, um Aussagen über Phänomene außerhalb dieser Daten zu treffen.

Egal ob es sich um quantitative oder qualitative Daten handelt - die Inferenzstatistik ist eines der wichtigsten Werkzeuge für Data Scientists auf der ganzen Welt. Dabei kommen Konzepte aus der Wahrscheinlichkeitstheorie und Methoden wie die lineare Regression zum Einsatz, dank derer wir hilfreiche Vorhersagen treffen und die Welt besser verstehen können.

Die besten verfügbaren Lehrkräfte für Statistik
1. Unterrichtseinheit gratis!
Andrea
5
5 (49 Bewertungen)
Andrea
75€
/h
1. Unterrichtseinheit gratis!
Thomas
5
5 (26 Bewertungen)
Thomas
48€
/h
1. Unterrichtseinheit gratis!
Viktor
5
5 (132 Bewertungen)
Viktor
80€
/h
1. Unterrichtseinheit gratis!
Julien
4,9
4,9 (13 Bewertungen)
Julien
25€
/h
1. Unterrichtseinheit gratis!
Rafael
5
5 (24 Bewertungen)
Rafael
42€
/h
1. Unterrichtseinheit gratis!
Boris
5
5 (8 Bewertungen)
Boris
20€
/h
1. Unterrichtseinheit gratis!
Markus
5
5 (22 Bewertungen)
Markus
25€
/h
1. Unterrichtseinheit gratis!
Christoph
5
5 (28 Bewertungen)
Christoph
35€
/h
1. Unterrichtseinheit gratis!
Andrea
5
5 (49 Bewertungen)
Andrea
75€
/h
1. Unterrichtseinheit gratis!
Thomas
5
5 (26 Bewertungen)
Thomas
48€
/h
1. Unterrichtseinheit gratis!
Viktor
5
5 (132 Bewertungen)
Viktor
80€
/h
1. Unterrichtseinheit gratis!
Julien
4,9
4,9 (13 Bewertungen)
Julien
25€
/h
1. Unterrichtseinheit gratis!
Rafael
5
5 (24 Bewertungen)
Rafael
42€
/h
1. Unterrichtseinheit gratis!
Boris
5
5 (8 Bewertungen)
Boris
20€
/h
1. Unterrichtseinheit gratis!
Markus
5
5 (22 Bewertungen)
Markus
25€
/h
1. Unterrichtseinheit gratis!
Christoph
5
5 (28 Bewertungen)
Christoph
35€
/h
1. Unterrichtseinheit gratis>

Die deskriptive Statistik

Bevor wir uns der Welt der zentralen Tendenz, der Ordinaten Daten und der Regressionsmodelle widmen, sollten wir erst einmal verstehen, inwiefern sich die induktive Statistik von der deskriptiven Statistik unterscheidet. Dafür werfen wir einen Blick auf die wichtigsten Annahmen und Methoden aus diesem großen Teilbereich der Statistik.

In der Statistik können Daten mit univariaten oder multivariaten Methoden analysiert werden. Das bedeutet, dass entweder eine oder mehrere Variablen vorhanden sind und analysiert werden. Typischerweise sind univariate Analysemethoden besonders anfangs sinnvoll, wenn die explorative Datenanalyse ansteht. Das bedeutet, dass noch wenig Wissen über die Daten und den Zusammenhang zwischen den Daten vorhanden ist.

Die Geschichte der deskriptiven Statistik reicht bis in die Antike zurück.
Die Methoden der deskriptiven Statistik werden schon sehr lange angewendet. | Quelle: Unsplash

Die deskriptive Statistik dient der übersichtlichen Darstellung von empirischen Daten. Dies kann mithilfe von Tabellen, Grafiken und Diagrammen geschehen. Die wichtigsten Kennzahlen aus der deskriptiven Statistik sind die Maße der zentralen Tendenz wie Mittelwert, Median und Modus. Aber auch die Streuungsmaße sind wichtige Elemente der deskriptiven Statistik. Dazu gehören die Varianz, die Kovarianz oder die Standardabweichung. Diese Maße zeigen Euch, wie weit Eure Werte um den Mittelwert herum gestreut sind.

Das kommt Euch jetzt ein bisschen zu Basic vor? Tatsächlich werden diese Maße aber sehr viel verwendet, denn nicht für alle statistischen Untersuchungen werden komplizierte Modelle benötigt. Diese Kennzahlen und ein wenig Datenvisualisierung reicht häufig schon, um Informationen aus Datensätzen zu ziehen und um diese zu interpretieren. Ihr seht also: Die deskriptive Statistik ist schon ein super Werkzeug für starke Ergebnisse.

Wenn Du noch mehr über die deskriptive Statistik lernen möchtest, empfehlen wir Dir unseren Artikel zum Thema.

Die Inferenzstatistik

Vor der Inferenzstatistik schrecken auch viele Menschen zurück, die sich mit der Materie eigentlich auskennen. Einige Methoden und Modelle der Inferenzstatistik, auch induktive Statistik genannt, sind recht kompliziert wie zum Beispiel die Regressionsnalyse mit kategorialen Daten oder Binomialverteilungen. Die Basics sind aber weniger komplex und um die geht es jetzt.

Der induktiven Statistik liegt die Wahrscheinlichkeitsrechnung zugrunde. Wahrscheinlichkeiten kennst Du sicher noch aus der Schule - Stichwort Münzwurf oder das Ziehen von Kugeln aus einer Urne. Und wenn es etwas abstrakter wird und um die Konstruktion eines Konfidenzintervalls für eine Schätzfunktion oder um die statistische Signifikanz für eine abhängige Variable geht, dann erkennen wir schnell, dass diese Konzepte ebenfalls auf der Wahrscheinlichkeitstheorie beruhen.

In der Inferenzstatistik gibt es zwei Lager, die einen echten Glaubenskrieg führen. Die einen denken, die frequentistische Statistik sollte als Grundlage zur Auswertung von Experimenten dienen und die anderen denken, dass dafür die Bayes'sche Statistik verwendet werden sollte. Die Frequentisten interpretieren die Wahrscheinlichkeit für das Eintreten eines Ereignisses als relative Häufigkeit. Die Bayesianer denken hingegen, dass die Wahrscheinlichkeit abstrakt ist und den Glauben an Wissen oder an eine Aussage misst.

Das hört sich alles ein bisschen verrückt an? Dann schauen wir uns zunächst einmal eine normale Wahrscheinlichkeitsverteilung im grundlegendsten statistischen Modell verwendet wird: Die lineare Regressionsanalyse. Wie auch bei anderen Analysen - wie der Varianzanalyse (ANOVA) oder der Zeitreihenanalyse - werden Annahmen über Daten getroffen, um die Gültigkeit der Analyse sicherzustellen. Eine der häufigsten Annahmen ist, dass die Daten einer Normalverteilung folgen. Diese Annahme wird benötigt, damit das Modell fehlerfrei verwendet werden und nachvollzogen werden kann. Außerdem ist dies unerlässlich, um die Daten im Folgenden korrekt interpretieren zu können. Denn von der Alternativhypothese über den Korrelationskoeffizienten bis hin zur Schätzfunktion und dem Konfidenzintervall müsst Ihr sicher sein können, dass Eure Daten normalverteilt sind.

Dank der Inferenzstatistik könnt Ihr gute Prognosen und Vorhersagen treffen.
Ihr wollte gute Prognosen treffen? Dann ist die Inferenzstatistik Euer bestes Tool! | Quelle: Unsplash

Inzwischen könnt Ihr dank moderner Software wie SPSS und Programmiersprachen wir R und Python statistische Modelle automatisch aufstellen und Ergebnisse errechnen. Dafür ist es sehr wichtig, die Annahmen für Eure Daten vorher zu überprüfen.

Wir können auch ein paar andere Annahmen betrachten und werfen dafür einen Blick auf den Satz von Gauß-Markov. Wenn Dein lineares Regressionsmodell die ersten sechs klassischen Annahmen für die Methode der kleinsten Quadrate erfüllt, dann ist der Kleinste-Quadrate-Schätzer ein bester linearer erwartungstreuer Schätzer (kurz BLES). Beste bedeutet dabei, dass die kleinste Kovarianzmatrix vorliegt und der Schätzer minimalverteilt ist. Hier muss die Störgrößen nicht normalverteilt sein.

Der Nachteil ist hier jedoch, dass diese Annahmen selten erfüllt werden:

  • Das Modell ist linear, sowohl bezogen auf den Koeffizienten als auch bezogen auf die Störgröße.
  • Der Erwartungswert oder Mittelwert der Störgröße ist Null
  • Die unabhängigen Variablen korrelieren nicht mit der Störgröße.
  • Es besteht keine Korrelation zwischen verschiedenen Beobachtungen der Störgröße.
  • Es besteht keine Heteroskedastizität in der Störgröße, was auch als konstante Varianz angesehen werden kann.

Ein weiteres gängiges statistisches Modell, mit dem Du in Berührung kommst, wenn Du Dich für Inferenzstatistik interessierst, ist das Allgemeine Lineare Modell. In seiner einfachen Form ist es ein simples lineares Modell. Es kann aber auch in multivariaten Analysemehtoden wie der Faktoranalyse und der Clusteranalyse verwendet werden. Bei der Verwendung des vereinfachten linearen Modells werden für die Analyse sowohl kategoriale als auch numerische Daten Tests wie der T-Test verwendet. Damit wird ein geeignetes Modell für die Daten bestimmt. Der T-Test soll bewerten, ob sich die Mittelwerte von zwei Gruppen statistisch voneinander unterscheiden. Er kann angewendet werden, um herauszufinden, ob ein lineares oder ein anders Modell besser geeignet ist.

Letztendlich hat die Inferenzstatistik ja das Ziel, eine Aussage über die Grundgesamtheit zu treffen. Deshalb kommen Hypothesentests zum Einsatz, die Gruppenunterschiede prüfen. Schaut Euch doch mal den Online Statistik Rechner auf DATAtab an, mit dem Ihr Hypothesentests machen könnt.

Tipps und Tricks für mehr Erfolg in Statistik

Auch wenn Ihr keine Statistik Studenten seid und auch nicht vorhabt, eine Karriere in der Statistik zu machen, stehen viele Menschen in ihrem Leben einmal vor der Herausforderung, statistische Modelle anwenden zu müssen. Das kann passieren, weil ihr Psychologie studiert oder Wirtschaftswissenschaften - beides Bereiche, in denen Ihr Euch zwangsläufig mit Statistik beschäftigen müsst.

Statistische Daten begegnen Euch auch in anderen Bereichen als der Statistik selbst, zum Beispiel in der BWL oder der Psychologie.
Auch in anderen Studienfächern als Statistik kommen statistische Modelle zum Auswerten von empirischen Daten zum Einsatz. | Quelle: Unsplash

Deshalb geben wir Euch einige Tipps und Tricks, sodass Ihr besser durch dieses komplizierte Thema kommt. Ihr könnt Euch entweder online Hilfe holen, zum Beispiel mit YouTube Videos, der Webseite DATAtab oder dem Forum für Programmier-Fans stackoverflow, wo Euch garantiert jede Frage vom hilfsbereiten Forum beantwortet wird.

Außerdem könnt Ihr auch hier auf Superprof nach Tutoren und Nachhilfelehrerinnen und -lehrern suchen, die in Eurer Nähe sind und Euch mit Statistik weiterhelfen können. Denn, ganz wichtig: Nicht aufgeben, jeder kann Statistik verstehen!

Auf der Suche nach einer Lehrkraft für Statistik?

Dir gefällt unser Artikel?

5,00/5 - 1 vote(s)
Loading...

Eva

Halb in Berlin, halb in Paris lebe ich meine Leidenschaften für guten Wein und schöne Fahrräder aus. Ich bin immer für spannende Aktivitäten zu haben und ständig auf der Suche nach interessanten Themen, die ich in meinen Artikeln mit Euch teile!