Wissenschaftler gehen davon aus, dass bis zum Jahr 2025 weltweit bis zu 175 Zettabyte jährlich generiert werden.

Auch wenn du keine Ahnung hast, was Zettabyte sind – es ist verdammt viel. Zum Vergleich: 2018 waren es noch 33 Zettabyte pro Jahr.

Es werden also kontinuierlich mehr Daten generiert. Und zwar nicht nur einfach so, sondern in vielen Fällen mit einer bewussten Absicht. Daten sind ein wertvolles Mittel, um Sachverhalte besser zu verstehen und auf sie angemessen reagieren zu können. Außerdem bilden sie die Grundlage für sämtliche Zukunftsprognosen.

Das verleiht ihnen eine ziemlich große Bedeutung, so dass viele Unternehmen immer mehr auf eine hochwertige Auswertung ihrer Unternehmens- und Kundendaten setzen. Ein Ergebnis davon ist zum Beispiel personalisierte Werbung, wie sie dir häufig begegnet.

Doch auch in anderen Sektoren ist die Datenanalyse nicht mehr wegzudenken oder sogar essentiell, beispielsweise wenn es um die Überprüfung der Wirksamkeit von Medikamenten oder Impfstoffen geht.

In der Schule und vor allem im Studium wirst du sicherlich mindestens einmal über die statistische Datenanalyse stolpern. Das Schöne an ihr ist der hohe Praxis- und Alltagsbezug.

In diesem Artikel findest du deshalb eine Zusammenfassung der wichtigsten Inhalte und Definitionen von Daten und Datenanalyse sowie wertvolle Tipps zur Erstellung und Auswertung eigener Datenerhebungen.

Die besten Lehrkräfte für Statistik verfügbar
Andrea
5
5 (54 Bewertungen)
Andrea
75€
/h
Gift icon
1. Unterrichtseinheit gratis!
Julien
4,9
4,9 (14 Bewertungen)
Julien
25€
/h
Gift icon
1. Unterrichtseinheit gratis!
Thomas
5
5 (27 Bewertungen)
Thomas
43€
/h
Gift icon
1. Unterrichtseinheit gratis!
Rafael
5
5 (28 Bewertungen)
Rafael
38€
/h
Gift icon
1. Unterrichtseinheit gratis!
Viktor
5
5 (133 Bewertungen)
Viktor
70€
/h
Gift icon
1. Unterrichtseinheit gratis!
Boris
5
5 (13 Bewertungen)
Boris
20€
/h
Gift icon
1. Unterrichtseinheit gratis!
Christoph
5
5 (28 Bewertungen)
Christoph
35€
/h
Gift icon
1. Unterrichtseinheit gratis!
Adam
5
5 (34 Bewertungen)
Adam
30€
/h
Gift icon
1. Unterrichtseinheit gratis!
Andrea
5
5 (54 Bewertungen)
Andrea
75€
/h
Gift icon
1. Unterrichtseinheit gratis!
Julien
4,9
4,9 (14 Bewertungen)
Julien
25€
/h
Gift icon
1. Unterrichtseinheit gratis!
Thomas
5
5 (27 Bewertungen)
Thomas
43€
/h
Gift icon
1. Unterrichtseinheit gratis!
Rafael
5
5 (28 Bewertungen)
Rafael
38€
/h
Gift icon
1. Unterrichtseinheit gratis!
Viktor
5
5 (133 Bewertungen)
Viktor
70€
/h
Gift icon
1. Unterrichtseinheit gratis!
Boris
5
5 (13 Bewertungen)
Boris
20€
/h
Gift icon
1. Unterrichtseinheit gratis!
Christoph
5
5 (28 Bewertungen)
Christoph
35€
/h
Gift icon
1. Unterrichtseinheit gratis!
Adam
5
5 (34 Bewertungen)
Adam
30€
/h
Gift icon
1. Unterrichtseinheit gratis!
Und los geht's

Was sind Daten?

Ohne Daten könntest du in der Statistik relativ wenig rechnen und auswerten. Sie sind also die wichtigste und elementare Grundlage für jegliche Datenanalyse. Doch was genau ist mit dem Begriff Daten gemeint?

Man kann Daten als Messwerte definieren, die durch Fragebögen, Interviews oder Experimente erhoben werden. Streng genommen bestehen Daten allerdings erstmal nur aus Ziffern oder Zeichen – erst, wenn man sie im Kontext sieht, drücken Daten eine Information aus.

Daten verfolgen in den meisten Fällen den Zweck, Informationen zu sammeln und damit Wissen zu generieren. Informationen und Wissen helfen uns bei der Entscheidungsfindung oder bei Problemlösungen.

Was sind Daten?
In Kombination mit dem Kontext liefern Daten Informationen | Bildquelle: Unsplash

Das macht sie zunehmend bedeutungsvoller, da immer mehr Organisationen, Unternehmen aber auch Einzelpersonen auf Basis von Daten ihre Entscheidungen treffen. Daten werden beispielsweise für folgende Zwecke gesammelt und verwertet:

  • Risikoanalysen (insbesondere für Banken und Versicherungen)
  • Prüfungen der Wirksamkeit von Arzneimitteln
  • Berichterstattung über die Wirtschaftslage eines Unternehmens
  • Erstellung von Prognosen (Finanzen, Wetter, Klima…)
  • Sportberichterstattung
  • Amtliche Statistiken zur Zusammensetzung der Bevölkerung

Es können zwei grundsätzliche Arten von Daten unterschieden werden: numerische und kategoriale Daten. Numerisch bedeutet, dass die Daten in Ziffern vorliegen. Beispiele dafür sind zum Beispiel Alter, Einkommen oder Gewicht. Kategorische Daten sind hingegen nicht direkt quantifiziert. Dazu zählen zum Beispiel der Wohnort, das Geschlecht oder der Beruf.

Außerdem werden drei verschiedene Skalenniveaus für Daten unterschieden: Nominalskala, Ordinalskala und metrische Skala.

Bei einer Nominalskala können Messwerte lediglich klar voneinander abgegrenzt, bei einer Ordinalskala auch zusätzlich in eine Reihenfolge gebracht und bei einer metrischen Skala darüber hinaus quantitativ verglichen werden.

Wie funktioniert die Datenanalyse?

Wie bereits erwähnt, ist das Ziel der Datenanalyse die Gewinnung von Informationen und neuen Erkenntnissen bezüglich bestimmter Sachverhalte.

Dabei gibt es drei unterschiedliche Formen der statistischen Datenanalyse:

  • Deskriptive Datenanalyse: Maßzahlen zur untersuchten Stichprobe werden ermittelt, interpretiert und dargestellt mit dem Ziel, diese Stichprobe zu beschreiben
  • Inferenzielle Datenanalyse: Die Ergebnisse der Stichprobenanalyse werden mithilfe von statistischen Verfahren wie der Wahrscheinlichkeitsrechnung und Hypothesentests auf eine größere Grundgesamtheit übertragen, um Rückschlüsse über diese und Prognosen treffen zu können
  • Explorative Datenanalyse: Die explorative sowie die konfirmatorische Datenanalyse untersucht Zusammenhänge, Strukturen und Korrelationen

Bevor die statistische Datenanalyse beginnen kann, muss entschieden werden, was für eine Art der Analyse durchgeführt werden soll. Bei der Auswahl der geeigneten Analysemethoden ist auch entscheidend, ob eine quantitative oder eine qualitative Analyse erfolgen soll.

Welche Möglichkeiten zur Datenauswertung gibt es?
Die gewählte Datenanalyse muss auf das Ziel und die Art der Daten zugeschnitten sein | Bildquelle: Unsplash

Während die quantitative Analyse so viele Daten wie möglich sammeln und auswerten möchte, geht es in der qualitativen Analyse eher um den Informationsgehalt und die Qualität der Daten. Dazu werden vor allem Einzelinterviews oder Gruppendiskussionen mit vielen offenen Fragen durchgeführt.

Je nach Ziel, gewünschter Analyseform und der Art der vorliegenden Daten können zur Analyse unterschiedliche Verfahren und Methoden angewendet werden, zum Beispiel:

  • Bestimmung von Mittelwert und Streuungsmaß
  • Regressionsanalyse
  • Korrelationsanalyse
  • Clusteranalyse
  • Faktoranalyse

Eine Datenanalyse kann entweder das Ziel verfolgen, die Vergangenheit zu beschreiben oder zusätzlich die Ursachen für die Situation der Vergangenheit herzuleiten. Darauf aufbauend kann sie auch versuchen, zukünftige Trends abzuleiten oder sogar konkrete Maßnahmenempfehlungen für Unternehmen, Organisationen oder Personen abzugeben.

Der Prozess der Datenanalyse sollte stets sorgsam geplant und durchgeführt werden. Insbesondere für die Erhebung der Daten sollte ausreichend Zeit eingeplant werden. Am Ende steht eine Präsentation über die gewonnenen Ergebnisse, bei der Visualisierungen und Grafiken eingesetzt werden können. Aus diesen lassen sich Interpretationen und Implikationen in Bezug auf die Ausgangsfragestellung ziehen.

Tipps zur Erstellung eines Fragebogens

Um im Rahmen einer Stichprobenbefragung ausreichend und vor allem weiterverwendbare Daten zu erheben, muss ein guter Fragebogen her!

Das ist oft leichter gesagt und getan, denn so ein Umfragebogen muss gut durchdacht und strukturiert aufgebaut sein. Zuerst musst du dir überlegen, ob es dir in erster Linie um eine quantitative Untersuchung oder um eine qualitative Meinungsabfrage geht.

Davon hängt dann die Art deiner gestellten Fragen ab. Folgende Fragetypen sind möglich:

  • Offene Fragen
  • Geschlossene Fragen
  • Multiple-Choice-Fragen
  • Auswahlfragen
  • Dichotome bzw. Trichotome Fragen
  • Bewertungsfragen
  • Filterfragen
  • Verhaltensfragen
  • Überzeugungsfragen
  • Eisbrecherfragen
  • Abschlussfragen

Deine Fragen sollten auf Thema und Ziel deiner Forschung zugeschnitten sein. Am besten unterteilst du die Fragen in einzelne Themenblöcke für mehr Struktur und Übersichtlichkeit.

Außerdem ist es empfehlenswert, zu Beginn des Fragebogens den Hintergrund der Umfrage sowie den Ablauf kurz zu erläutern. Entweder am Anfang oder am Ende solltest du auch einige grundlegende demografische Daten abfragen (Alter, Wohnort, Geschlecht, Familienstand etc. – je nachdem, was für deine Fragestellung relevant ist).

Wie erstellt man einen Fragebogen?
Für einen guten Fragebogen solltest du unterschiedliche Fragetypen verwenden | Bildquelle: Unsplash

Verschiedene Fragetypen sind bei der Auswertung unterschiedlich gut zu verarbeiten. Am einfachsten zu verwerten sind geschlossene Fragen und metrisch skalierte Daten. Antworten auf nicht geschlossene Fragen musst du gegebenenfalls vor der Auswertung noch eigenständig kategorisieren und quantifizieren.

Du solltest für jede deiner Fragen verstehen, wie die erhobenen Daten skaliert werden bzw. um was für Daten es sich handelt. Schließlich ist unter anderem vom Datenskala abhängig, welche statistischen Verfahren überhaupt angewendet werden können.

Achte bei der Durchführung der Umfrage darauf, dass du eine repräsentative Stichprobengröße erreichst. Repräsentativ bedeutet in der Regel mindestens 100 Teilnehmende.

Diese Softwareprogramme helfen dir bei der Datenauswertung

Das Gute am Computerzeitalter: Du musst die statistischen Rechenverfahren zur Auswertung deiner Daten nicht mehr selbst durchführen. Dazu gibt es glücklicherweise einige gute Statistikprogramme.

Die gängigsten Softwareprogramme für statistischen Datenanalysen sind die Folgenden:

  • Excel
  • SPSS
  • STATA
  • R
  • SAS
  • Python

Darüber hinaus gibt es natürlich noch eine Vielzahl weiterer Programme mit jeweils Vor- und Nachteilen.

Welche Softwareprogramme zur Datenauswertung gibt es?
Es gibt glücklicherweise eine große Auswahl an Softwareprogrammen für die Datenauswertung | Bildquelle: Unsplash

Excel ist zwar eine komfortable Option, da du mit der Benutzung wahrscheinlich recht vertraut ist und es auf den meisten Rechnern bereits installiert ist. Allerdings sind die Funktionen für statistische Auswertungen hier begrenzt. Das Programm eignet sich daher eher für einfache Datenanalysen, bei denen du nur einige Standardverfahren anwenden möchtest und die Datenmenge nicht allzu groß und unübersichtlich ist.

Insbesondere an Universitäten sowie in den Sozialwissenschaften verwendet wird SPSS, der Klassiker unter Statistiksoftware. SPSS bietet ein umfassendes Leistungsspektrum und kann für die allermeisten Datenanalysen eingesetzt werden. Es ist zwar nicht direkt selbsterklärend, aber auch nicht unmöglich zu Erlernen. Da es viel in der Hochschullehre verwendet wird, gibt es außerdem jede Menge Literatur und Tutorials zu dem Programm.

Das Besondere an R und Python ist, dass es sich um Open Source Lösungen handelt. Das bedeutet, dass die Quelldaten der Programme offen zur Verfügung stehen und konstant von Usern weiterentwickelt werden können. Das macht sie nicht nur zu kostengünstigen, sondern auch zukunftsfähigen Lösungen.

>

Die Plattform, die Lehrkräfte und SchülerInnen miteinander verbindet

1. Unterrichtseinheit gratis

Du findest diesen Artikel toll? Vergib eine Note!

5,00 (1 Note(n))
Loading...

Miriam

Miriam arbeitet als freie Autorin & Yogalehrerin. Getrieben von großer Neugier liebt sie es, Neues zu entdecken und zu erlernen; sich selbst weiterzuentwickeln und anderen dabei zu helfen.