Statistik ist ein weites Feld: Vom Konfidenzintervall bis hin zum Hypothesentest. Das hört sich kompliziert an? Keine Sorge, unser Guide hilft Dir dabei, das weite Feld der Statistik und der Datenanalyse zu verstehen. Wir erklären Euch die Basics und die Grundlagen der Statistik und entwirren das Chaos im Kopf.

Die besten Lehrkräfte für Statistik verfügbar
Andrea
5
5 (56 Bewertungen)
Andrea
75€
/h
Gift icon
1. Unterrichtseinheit gratis!
Boris
5
5 (18 Bewertungen)
Boris
20€
/h
Gift icon
1. Unterrichtseinheit gratis!
Thomas
5
5 (31 Bewertungen)
Thomas
59€
/h
Gift icon
1. Unterrichtseinheit gratis!
Julien
4,9
4,9 (14 Bewertungen)
Julien
25€
/h
Gift icon
1. Unterrichtseinheit gratis!
Rafael
5
5 (28 Bewertungen)
Rafael
42€
/h
Gift icon
1. Unterrichtseinheit gratis!
Viktor
5
5 (141 Bewertungen)
Viktor
70€
/h
Gift icon
1. Unterrichtseinheit gratis!
Adam
5
5 (35 Bewertungen)
Adam
30€
/h
Gift icon
1. Unterrichtseinheit gratis!
Christoph
5
5 (29 Bewertungen)
Christoph
40€
/h
Gift icon
1. Unterrichtseinheit gratis!
Andrea
5
5 (56 Bewertungen)
Andrea
75€
/h
Gift icon
1. Unterrichtseinheit gratis!
Boris
5
5 (18 Bewertungen)
Boris
20€
/h
Gift icon
1. Unterrichtseinheit gratis!
Thomas
5
5 (31 Bewertungen)
Thomas
59€
/h
Gift icon
1. Unterrichtseinheit gratis!
Julien
4,9
4,9 (14 Bewertungen)
Julien
25€
/h
Gift icon
1. Unterrichtseinheit gratis!
Rafael
5
5 (28 Bewertungen)
Rafael
42€
/h
Gift icon
1. Unterrichtseinheit gratis!
Viktor
5
5 (141 Bewertungen)
Viktor
70€
/h
Gift icon
1. Unterrichtseinheit gratis!
Adam
5
5 (35 Bewertungen)
Adam
30€
/h
Gift icon
1. Unterrichtseinheit gratis!
Christoph
5
5 (29 Bewertungen)
Christoph
40€
/h
Gift icon
1. Unterrichtseinheit gratis!
Und los geht's

Was ist Statistik?

Gleich vorneweg, frag Dich doch mal: Welchen Wert haben Daten? Diese Frage ist heute in aller Munde und nicht nur Unternehmen, sondern auch die Politik stellen sie sich. Denn mit größter Sorgfalt werden heutzutage Daten untersucht.

Das ist jedoch keineswegs ein modernes Phänomen, denn schon in den 90ern wurden Daten mithilfe von Analysetools untersucht. Das Paradebeispiel schlechthin ist die Matrix, die das digitale Zeitalter eingeläutet hat.

Daten und Statistik haben eine lange Vergangenheit.
Daten und Statistik gibt's nicht erst seit gestern. | Quelle: Unsplash

Heute sind Analysetools für moderne Data Analysis verfügbar für jeden, denn sie sind online nur ein paar Klicks entfernt. Und was bringt die Data Analysis uns? Algorithmen für Dating Apps, die Dein Profil mit dem eines anderen Singles verknüpft, Algorithmen für online Handel, wo Dir ähnliche Produkte vorgeschlagen werden, wie Du schon einmal gekauft hast – sie alle haben ihren Ursprung in statistischen Methoden.

Statistik gibt es aber schon seit Jahrhunderten. Unsere Vorfahren nutzen die ihnen damals zur Verfügung stehenden Mittel und Methoden, um quantitative Daten zu erheben und zu untersuchen.

Im Grunde genommen hat sich die Arbeit des Statistikers über die Jahre im Kern nicht verändert. Die Grundprinzipien bestehen nach wie vor darin, Daten zu erheben, zu analysieren und zu interpretieren, um auf Basis dessen Entscheidungen zu fällen.

Früher wurden demografische und wirtschaftliche Daten erhoben, um herauszufinden, wie sich Wirtschaft, Bevölkerung und Landwirtschaft entwickeln. Heute beschäftigen sich Statistiker mit Konzepten der Methodik und der Analyse, wie zum Beispiel die Stichprobengröße, Rohdaten oder Effektstärke.

Die Meilensteine der Statistik können in drei grundlegende Phasen eingeteilt werden. Die erste beinhaltet das Erheben von Daten, zum Beispiel durch Volkszählungen oder durch Beobachtung. Die zweite, die insbesondere nach dem zweiten Weltkrieg stattfand, besteht in der Erfassung der demografischen und wirtschaftlichen Daten in einer staatlichen Datenbank. Und die dritte Phase, die bis heute andauert, besteht in der Revolution der statistischen Inferenz, die durch den technologischen Fortschritt hervorgerufen wurde.

Dank Teilgebieten wie der Biostatistik hat sich der Lebensstandard auf der ganzen Welt verbessert. Der Methoden der Datenanalyse verdanken wir diesen bahnbrechenden Verbesserungen. Heute ist die Statistik eng mit dem Bereich der Data Science verknüpft. In der künstlichen Intelligenz oder dem maschinellen Lernen werden statistische Modelle verwendet, um auch aus nicht-quantitativen Daten Rückschlüsse zu ziehen. Schätzungen vorhersagen oder Zufallszahlen automatisch generieren funktioniert inzwischen dank statistischer und analytischer Software zuverlässig und schnell.

Hast Du schon einmal von Programmiersprachen und statistischen Tools wie R, Stata, SPSS, Python, C und SQL gehört? Das sind nämlich gängige Softwares und Programmiersprachen, die im Bereich der Statistik und Data Science zum Einsatz kommen. SPSS Hilfe findest du hier.

Die Basics der deskriptiven Statistik

Ganz egal, ob Du Statistik in der Uni oder der Hochschule lernst und dort Histogramme für wissenschaftliche Projekte erstellst oder ob Du Datenvisualisierung bei der Arbeit brauchst. Bestimmt hast Du schon mal etwas von der deskriptiven Statistik gehört.

Statistik wird an der Schule, der Uni oder der FH gelehrt.
Vielleicht kennst Du einige der Feinheiten der Statistik noch aus der Schule. | Quelle: Unsplash

Die deskriptive Statistik teilt sich in mehrere Bereiche. Sie befasst sich mit Daten, die nach der Datenerhebung zur Verfügung stehen. Mithilfe statistischer Verfahren versuchen Statistiker hier, die Daten zu verstehen. Dies kommt beim Forschungsdesign einer Studie zum Einsatz und gibt wichtige Einblicke in die qualitativen oder quantitativen Daten, die Ihr betrachtet.

Egal, ob Euer Skalenniveau ordinal, kategorial oder numerisch ist, gibt es zwei Kategorien, unter die die deskriptive Statistik fallen kann: Maße der zentralen Tendenz oder der Variabilität.

Maße der zentralen Tendenz werden verwendet, wenn Ihr verstehen wollt, welcher Wert die Mitte aller Werte am besten repräsentiert. Der Median, der Mittelwert und der Modus gehören zu den Maßen der zentralen Tendenz. Auf den ersten Blick ähneln sich diese Maße. Sie unterscheiden sich jedoch darin, wie die einzelnen Werte in der Stichprobe gewertet werden. Besonders, wenn Deine Stichprobe viele Daten enthält, ist der Unterschied wichtig. Es ist also ganz wichtig, zunächst diese Maße zu ermitteln, bevor Ihr Aussagen über Eure Untersuchung treffen könnt.

Maße der Variabilität umfassen Maße wie die Standardabweichung, die Kovarianz oder die Varianz. Sie werden dazu verwendet, die Streuung der Daten zu untersuchen. Zum Beispiel, um Aussagen darüber zu treffen, wie weit Daten um das Zentrum herum oder den Durchschnitt schwanken bzw. gestreut sind. Wenn Ihr zum Beispiel herausfinden wollt, welcher Anteil Eurer Daten unter einen bestimmten Bereich fällt, solltet Ihr mit Maßen der Variabilität arbeiten. Insbesondere bei der Analyse von Werten aus der Finanzwelt, zum Beispiel Aktienkursen, kommt die Standardabweichung zum Einsatz und hilft Euch dabei, Aussagen über die Volatilität der Daten zu treffen.

Die deskriptive Statistik wird meistens verwendet, wenn die Abhängigkeit von nur einer Variablen untersucht wird. Dies nennt man univariat. Gewinn oder Verkaufszahlen können damit analysiert werden, genauso aber auch, wenn Ihr multiple Variablen vergleichen wollt.

Ein kurzes Beispiel hilft, um das zu verstehen: Ein kleines Unternehmen möchte seine Verkaufszahlen verwenden, um herauszufinden, wie viele Kunden oberhalb oder unterhalb einer Altersgrenze sind. Die deskriptive Statistik macht daher den Hauptteil der statistischen Berechnungen aus, den einzelne Personen, aber auch Unternehmen und Regierungen verwenden.

Obwohl natürlich Prognosen für die Zukunft wichtig sind, verwenden viele Menschen nur die Maße der zentralen Tendenz und der Variabilität, um für sie wichtige Informationen zu bekommen und Entscheidungen zu treffen. Einige der wichtigsten Maße der deskriptiven Statistik sind zum Beispiel:

  • Der Korrelationskoeffizient
  • Datenvisualisierung
  • Verteilungen (Normalverteilung, Binomialverteilung, Laplace, etc.)

Induktive Statistik - das steckt dahinter

Die nächste Statistik-Disziplin, die wir unter die Lupe nehmen, kombiniert Wahrscheinlichkeiten mit Statistik. Das Ziel dabei ist, nicht nur Daten zu verstehen, sondern sie auch für Vorhersagen zu verwenden. Dieser Teil der Statistik heißt Inferenzstatistik bzw. induktive Statistik. Wahrscheinlichkeitstheorie und -verteilung helfen Euch dabei, multivariable Analysis zu verstehen.

Wahrscheinlichkeiten sind ebenfalls ein Teilgebiet der Statistik.
Wahrscheinlichkeiten kennt Ihr aus dem Münzwurf und dem Würfelspiel. | Quelle: Unsplash

Die mathematische Statistik, auch Inferenzstatistik genannt, bildet gemeinsam mit der Wahrscheinlichkeitstheorie die Stochastik. In der mathematischen Statistik werden Methoden der Statistik mit mathematischen Mitteln analysiert und begründet.

Die Modelle, die in der Inferenzstatistik verwendet werden, enthalten Elemente wie zum Beispiel die Lineare Regression oder Varianzanalyse (ANOVA). Egal, ob es sich hier um parametrische oder nicht-parametrische Tests handelt, müssen zwei Kriterien erfüllt sein: Ihr braucht einige Variablen, die Ihr untersuchen möchtet und Ihr müsst für Eure Daten einige Annahmen treffen.

Das erste Kriterium ist einfach und den Prozess verstehen wir alle: Eine oder mehrere abhängige Variablen auswählen, um eine oder mehrere unabhängige Variablen zu bestimmen.

Das zweite Kriterium führt schon zu mehr Kopfschmerzen und grauen Haaren. Denn die meisten Datensätze enthalten nicht alle Annahmen, die eigentlich benötigt werden, um bestimmte Modelle anzuwenden. Es kann zum Beispiel sein, dass Deine Daten keiner Normalverteilung folgen. Das Gauss-Markov Modell ist ein ganz typisches lineares Modell, das in der mathematischen Statistik benutzt wird.

Die mathematische Statitstik unterscheidet sich von der beschreibenden Statistik auch, weil dazu das Testen einer Nullhypothese gegen eine alternative Hypothese gehört. Mit Programmiersprachen wie R oder Softwares wie SPSS kannst Du Vorhersagen treffen, die sich auf das Konfidenzintervall stützen.

Du startest erst gerade, die Welt der Statistik zu verstehen? Dann nennen wir Dir einige der bekanntesten parametrischen Elemente:

  • Verallgemeinerte lineare Modelle
  • Logistische Regression

Unter den bekanntesten nicht-parametrischen Modellen gehören:

  • Clusteranalyse
  • Faktorenanalyse
  • Diskriminanzanalyse

Außer diesen Modellen könnt Ihr mit ANOVA herausfinden, welches Modell am präzisesten ist, indem die Varianzen von zwei oder mehr Modellen miteinander verglichen werden.

Gute Tools für Statistik

Wenn Ihr Euch ein bisschen Hilfe beim Statistik Lernen und Verstehen wünscht, habt Ihr Glück gehabt! Es gibt sie, die wertvollen Tools, die Euch das Statistiker-Leben ein bisschen einfacher machen.

Statistik ist schwer, aber Hilfe gibt's online!
Hilfe in Statistik gibt's auf zahlreichen Webseiten und in Foren. | Quelle: Unsplash

Denn vom Verstehen der statistischen Methoden über die Datenanalyse bis hin zum Konzept der kleinsten Quadranten ist ein weiter Weg zu gehen.

Akademische Hilfsmittel

Du brauchst Hilfe beim Interpretieren der statistischen Signifikanz Deiner abhängigen Variable oder möchtest wissen, welchen Parameter Deiner Stichprobe Du testen musst? Da empfehlen wir Euch Stack Exchange, ein statistisches Forum, das Euch alle Fragen beantwortet.

Wenn Du auf der Suche nach einem Tutor oder Nachhilfelehrer für Statistik Nachhilfe bist, empfehlen wir Dir, mal hier bei Superprof nach einer geeigneten Person in Deiner Nähe zu suchen. Auch Mathelehrer können Dir da übrigens oft weiterhelfen.

Programmieren

Stackoverflow ist ein super online Forum, das bei allem weiterhilft, was von Beginner bis Profi für Dich relevant ist. Hier tummeln sich Experten der unterschiedlichsten Programmiersprachen, zum Beispiel R oder Python. Sie können Dir bei größeren und kleineren Coding Problemen weiterhelfen.

>

Die Plattform, die Lehrkräfte und SchülerInnen miteinander verbindet

1. Unterrichtseinheit gratis

Du findest diesen Artikel toll? Vergib eine Note!

5,00 (1 Note(n))
Loading...

Eva

Halb in Berlin, halb in Paris lebe ich meine Leidenschaften für guten Wein und schöne Fahrräder aus. Ich bin immer für spannende Aktivitäten zu haben und ständig auf der Suche nach interessanten Themen, die ich in meinen Artikeln mit Euch teile!