Im Zeitalter von einer überwältigenden Datenflut, die sich weiterhin in Blitzesschnelle vervielfacht, werden Daten zur wichtigsten Währung einer jeden Organisation und Datenanalyse zu dem Werkzeug, dass über Erfolg oder Misserfolg entscheiden kann.

Daher lohnt es sich nicht nur, sondern ist mittlerweile unumgänglich, sich insbesondere im Wirtschaftsgeschehen mit den Methoden, Zielen und Verfahren der Datenanalyse auseinanderzusetzen.

Einen allgemeinen Überblick, was es mit statistischer Datenanalyse auf sich hat und wozu sie gut ist, erhältst du in diesem Artikel.

Die besten verfügbaren Lehrkräfte für Statistik
1. Unterrichtseinheit gratis!
Andrea
5
5 (49 Bewertungen)
Andrea
75€
/h
1. Unterrichtseinheit gratis!
Thomas
5
5 (26 Bewertungen)
Thomas
48€
/h
1. Unterrichtseinheit gratis!
Viktor
5
5 (132 Bewertungen)
Viktor
80€
/h
1. Unterrichtseinheit gratis!
Julien
4,9
4,9 (13 Bewertungen)
Julien
25€
/h
1. Unterrichtseinheit gratis!
Rafael
5
5 (24 Bewertungen)
Rafael
42€
/h
1. Unterrichtseinheit gratis!
Boris
5
5 (8 Bewertungen)
Boris
20€
/h
1. Unterrichtseinheit gratis!
Markus
5
5 (22 Bewertungen)
Markus
25€
/h
1. Unterrichtseinheit gratis!
Christoph
5
5 (28 Bewertungen)
Christoph
35€
/h
1. Unterrichtseinheit gratis!
Andrea
5
5 (49 Bewertungen)
Andrea
75€
/h
1. Unterrichtseinheit gratis!
Thomas
5
5 (26 Bewertungen)
Thomas
48€
/h
1. Unterrichtseinheit gratis!
Viktor
5
5 (132 Bewertungen)
Viktor
80€
/h
1. Unterrichtseinheit gratis!
Julien
4,9
4,9 (13 Bewertungen)
Julien
25€
/h
1. Unterrichtseinheit gratis!
Rafael
5
5 (24 Bewertungen)
Rafael
42€
/h
1. Unterrichtseinheit gratis!
Boris
5
5 (8 Bewertungen)
Boris
20€
/h
1. Unterrichtseinheit gratis!
Markus
5
5 (22 Bewertungen)
Markus
25€
/h
1. Unterrichtseinheit gratis!
Christoph
5
5 (28 Bewertungen)
Christoph
35€
/h
1. Unterrichtseinheit gratis>

Definition und Ziele der Datenanalyse

In der Datenanalyse geht es darum, aus einer Datenmenge möglichst viele und präzise Informationen und Erkenntnisse zu gewinnen. Dazu werden statistische Analysemethoden angewendet, um aus den vorliegenden Datensätzen relevante Kenngrößen zu ermitteln. Die Ergebnisse der statistischen Datenanalyse werden schriftlich dokumentiert und / oder grafisch aufgearbeitet.

Die Statistik unterscheidet zwischen drei unterschiedlichen Arten der Datenanalyse:

  • Deskriptive Datenanalyse
  • Inferenzielle Datenanalyse
  • Explorative Datenanalyse / konfirmatorische Datenanalyse

Die deskriptive Datenanalyse untersucht in der Statistik die Daten zu einer untersuchten Stichprobe und ermittelt in Bezug auf diese Maßzahlen (zum Beispiel Mittelmaß und Streuungsmaß), Zusammenhänge und Trends. Der Charakter dieser Analyseart ist ausschließlich beschreibend. Es können Tabellen, Grafiken und Übersichten zu den gewonnenen Erkenntnissen erstellt werden.

Die inferenzielle Datenanalyse geht einen Schritt weiter und versucht die Ergebnisse einer Teilerhebung bzw. einer Stichprobe auf eine größere Grundgesamtheit zu übertragen. Dazu bedient die Inferenzstatistik sich an statistischen Modellen und Verfahren wie Hypothesentests, Intervallschätzungen und Punktschätzungen.

Welche Arten der Datenanalyse gibt es?
Um die Ziele der Datenanalyse zu erreichen, gibt es verschiedene Methoden und Analysearten | Bildquellen: Unsplash

Bei der explorativen Datenanalyse sollen bedeutende Zusammenhänge und Strukturen entdeckt und veranschaulicht werden. Die konfirmatorische Datenanalyse überprüft aufgestellte Hypothesen zu Zusammenhängen und Korrelationen und bedient sich dazu beispielsweise der Regressionsanalyse oder der Kausalanalyse.

Unabhängig der angewandten Analyseform kann auch zwischen univariater, bivariater und multivariater Datenanalyse unterschieden werden. Im Mittelpunkt bei dieser Differenzierung steht, ob ein eindimensionales, zweidimensionales oder multidimensionales Merkmal überprüft wird.

Aufgrund der hohen Dichte und Verfügbarkeit von Rohdaten sowie ausgebildeter Analysemethoden und softwaregestützte Datenauswertung können heutzutage in Echtzeit Daten analysiert und zur Entscheidungsfindung zurate gezogen werden.

Das macht die Datenanalyse zunehmend beliebter und existenzieller für Unternehmen und andere Organisationen auf der gesamten Welt. Die Datenanalyse verfolgt das Ziel, eine Grundlage für Problemlösung und Entscheidungsfindungen zu bilden.

In Form von Meinungsforschung begegnet sie uns mittlerweile regelmäßig im alltäglichen Leben. Außerdem spielt sie eine enorme Rolle in klinischen und wissenschaftlichen Studien wie zum Beispiel im Bereich der Pharmazie oder Medizin.

Unternehmen und andere Akteure der Wirtschaft setzen aus den folgenden Gründen auf Datenanalyse und Datenauswertung – zwei Begriffe, die weitestgehend synonym verwendet werden können:

  • Identifikation und Minimierung geschäftlicher Risiken
  • Erkennung von Effizienzpotentialen
  • Aufdeckung und Unterbindung von Wirtschaftskriminalität
  • Externe und interne Prüfungen (z. B. Wirtschaftsprüfung)
  • Überprüfung der Einhaltung von Compliance-Richtlinien, rechtlicher Vorgaben und Regulatorien in internen Kontrollen
  • Grundlage für betriebliche Entscheidungen
  • Erkennung von Konsumtrends
  • Entwicklung eines besseren Verständnisses der Käufer und Konsumenten
  • Vorhersage von Kaufentscheidungen
  • Zielgerichteter Einsatz von Marketingaktivitäten
  • Reporting bzw. Berichterstattung in Unternehmen

Mithilfe von Reports, Dashboards und anderen Präsentationsformen können die ausgewerteten Analyseergebnisse den jeweiligen Zielgruppen anschaulich zur Verfügung gestellt werden und diese dabei unterstützen, die richtigen Entscheidungen für sich oder ihre Organisation zu treffen.

Der richtige Umgang mit Datensätzen

Der passende Umgang mit Daten und die Auswahl der geeigneten Analysemethoden hängt stark davon ab, was für Datensätze vorliegen. Außerdem muss zu Beginn eine grundsätzliche Entscheidung dazu getroffen werden, ob es sich um eine qualitative oder quantitative Analyse handeln soll.

Bei der qualitativen Analyse stehen subjektive Meinungen und Einschätzungen im Vordergrund. Diese werden zum Beispiel im Rahmen von Einzel- oder Gruppeninterviews und diversen offenen Fragestellungen und Diskussionsrunden gewonnen. Diese Daten liegen oft als Einzelfälle und in einer Form vor, die nicht direkt quantifizierbar und statistisch auswertbar ist. Der Vorteil einer qualitativen Untersuchung liegt aber in dem hohen Informationsgehalt, der daraus gezogen und interpretiert werden kann.

Eine quantitative Analyse möchte hingegen so hohe Datenmengen wie möglich sammeln und erheben, um daraus fundierte Aussagen über Zusammensetzung und relevante Messgrößen dieser Stichprobe treffen zu können. Die quantitativen Datensammlungen können statistisch ausgewertet und analysiert werden.

Weiterhin wird zwischen strukturierten und unstrukturierten Daten unterteilt. Zu den strukturierten Daten zählen unter anderem die Folgenden:

  • Postleitzahlen
  • Telefonnummern
  • Währungen
  • Bestellsummen
  • Rechnungssummen

All diese Werte liegen in einer strukturierten Form vor, die problemlos in Zusammenhänge und Abstufungen gebracht und von sämtlichen Statistik-Programmen und Softwares weiterverarbeitet werden können. Anders verhält es sich bei den unstrukturierten Daten, wie beispielsweise:

  • Satellitenbilder
  • E-Mails
  • Social Media Postings
  • Artikel
  • Sensordaten
Was sind unstrukturierte Daten?
Ein Beispiel für unstrukturierte Daten sind Satellitenbilder | Bildquelle: Unsplash

Diese Datensätze bringen insbesondere ältere Datenverarbeitungsmaschinen schnell an ihre Grenzen. Es müssen nicht-relationale Datenbanken wie NoSQL herangezogen werden, um aus den unstrukturierten Daten Aussagen über die Vergangenheit und Prognosen über die zukünftige Entwicklung abgeben zu können.

Eine Organisation muss sich bemühen, eine oder mehrere Datenbanken entsprechend der vorliegenden Datentypen und -sätze aufzubauen. In der Regel werden die meisten Daten intern gesammelt und mit weiteren externen Daten ergänzt.

Der zentrale Ort, an dem die Daten für weiterführende Analysen gesammelt werden, wird auch Data Warehouse genannt. Nachdem dort alle Daten erfasst wurden, müssen sie validiert werden, bevor es mit der Datenauswertung weitergeht.

Im Rahmen der Validierung können Datenqualitätsprobleme erkannt und sichergestellt werden, dass es sich um vollständige und konsistente Datensätze handelt. Unvollständige oder fehlerhafte Datensets werden innerhalb von Datenbereinigungsprozessen beseitigt.

Anschließend kommen diverse Datenvisualisierungstools zum Einsatz, um die Datensätze auf Korrelationen und Trends hin zu untersuchen.

Methoden zur Datenauswertung im Überblick

Bei der konkreten Datenauswertung bzw. Datenanalyse können grundsätzlich vier unterschiedliche Methoden angewendet werden:

  • Deskriptive Datenanalyse
  • Diagnostische Datenanalyse
  • Prädiktive Datenanalyse
  • Präskriptive Datenanalyse

Diese vier Methoden werden in dieser Reihenfolge zunehmend komplexer, liefern aber auch wertvollere Erkenntnisse und Mehrwert für die betroffene Organisation. Dabei werden die Erkenntnisse der jeweils vorangegangenen Analyseform stets miteinbezogen, die vier Methoden bauen also aufeinander auf.

Die Deskriptive Datenanalyse (Descriptive Data Analysis) liefert Informationen über die Vergangenheit: Es wird anhand der vorliegenden Daten analysiert, was zuvor passiert ist. Das kann zum Beispiel der erzielte Umsatz mit einem bestimmten Produkt sein.

Die Diagnostische Datenanalyse (Diagnostic Data Analysis) vergleicht die Datensätze der Vergangenheit mit weiteren Daten, um herauszufinden, warum etwas so passiert ist, wie es passiert ist. Es werden in unserem Beispiel also Antworten auf die Frage gesucht, warum ein gewisses Produkt so viel oder eben so wenig Umsatz erzielt hat. Die Ergebnisse der diagnostischen Analyse geben dem Unternehmen Ansätze für zukünftige Entscheidungen.

Wie gibt die Datenanalyse Aufschluss über die Zukunft?
Im Rahmen der prädiktiven Datenanalysen werden Prognosen über die Zukunft erstellt | Bildquelle: Unsplash

Noch einen Schritt weiter geht die Prädiktive Datenanalyse (Predictive Data Analysis), denn hier wird ein Blick in die Zukunft gewagt. Das Ziel ist es, frühzeitig Trends und Entwicklungen im Konsumentenmarkt zu erkennen, um rechtzeitig darauf reagieren zu können. Dazu werden Tendenzen und Normabweichungen untersucht. In Bezug auf unser Beispiel könnte die Fragestellung lauten, welchen Umsatz das Produkt zukünftig erzielen wird.

Abschließend formuliert die Präskriptive Datenanalyse (Prescriptive Data Analysis) konkrete Maßnahmenempfehlungen, um die identifizierten Trends optimal zu nutzen oder erkannte Risiken zu umgehen. Das Ergebnis dieser Analyse sind also spezifische Handlungsanweisungen für das Unternehmen oder die Organisation. Dazu bedarf es zwingend umfassende Datensätze, die mit externen Daten ergänzt wurden. Außerdem kommen Maschinelles Lernen, Simulationen und Szenarien Modelle zum Einsatz.

Weitere Begriffe und Verfahren spielen im Zusammenhang mit statistischer Datenanalyse in Unternehmen und Organisationen ebenfalls eine immer größer werdende Rolle:

  • Data Mining
  • Künstliche Intelligenz (KI)
  • Text Mining
  • Big Data Analytics

Der Prozess in Datenanalyse in der Unternehmenspraxis

Zusammengefasst umfasst der Datenanalyseprozess in der Praxis die folgenden Schritte:

1. Planung und Fragestellung
Zu Beginn des Prozesses werden unter Einbezug aller Beteiligten die Fragestellungen für die anstehende Analyse formuliert. Im ersten Schritt kann dazu ein allgemeines Brainstorming stattfinden, woraufhin die Ideen immer weiter konkretisiert werden. Am Ende sollte die Analysefrage so präzise wie möglich gestellt werden. Auf dieser basiert wiederum die Planung der Analysemethode: Welche Daten werden benötigt? Wie werden die Daten gesammelt? Welche Analysemethoden bieten sich an? Was für eine Art der Datenpräsentation ist am Ende notwendig?

2. Datengrundlage schaffen und aufbereiten
Nun müssen die benötigten Daten zusammengetragen oder eigenständig erhoben werden. Falls schon große Datenmengen vorhanden sind, müssen diese gegebenenfalls nur noch mit weiteren, ggf. externen Daten ergänzt werden. Aus Rohdaten können in diesem Schritt auch schon wichtige Kennwerte / Key Performance Indikatoren (KPIs) gewonnen werden. Welche Kennwerte nötig sind, hängt von der Fragestellung ab. Alle Daten und Kennwerte müssen für weitere Analyseschritte in ein passendes und einheitliches Format gebracht werden. Außerdem sollten die Datensätze um nicht benötigte, falsche oder unvollständige Datenreihen bereinigt werden.

Wie läuft Datenanalyse ab?
Der erste Schritt der Datenanalyse ist stets die genaue Planung des Vorhabens | Bildquelle: Unsplash

3. Durchführung
Im Anschluss folgt die eigentliche Datenanalyse. Für diese werden unterschiedliche, in Anbetracht der Fragestellung und vorliegenden Daten ausgewählte statistische Analyseverfahren durchgeführt. Diese sind auch abhängig von der gewünschten Methode der Datenanalyse (deskriptiv / induktiv / explorativ). Beispiele für mögliche statistische Verfahren sind: Clusteranalyse, Regressionsanalyse, Faktorenanalyse, Kohortenanalyse oder ABC-Analyse. Für bestmögliche Ergebnisse werden häufig unterschiedliche Verfahren miteinander kombiniert. Für die Durchführung kommen spezielle Analysesoftwares zum Einsatz, die auf solche Arten der Datenauswertung spezialisiert sind und in Sekundenschnelle Ergebnisse liefern.

4. Ergebnisse visualisieren und präsentieren
Für die Datenpräsentation werden die Analyseergebnisse für die Zielgruppe visualisiert und anschaulich aufbereitet. Ziel dieser Phase ist es, dass die Zielgruppe die Ergebnisse leicht verständlich und nachvollziehbar erfassen und verstehen kann. Die wichtigsten Informationen und die entscheidenden Aussagen sollten auf einen Blick erkennbar sein. Eine besonders beliebte Möglichkeit für die Datenpräsentation sind interaktive Dashboards.

5. Interpretation und Implikation
Im abschließenden Schritt des Prozesses werden die richtigen Schlussfolgerungen aus den Analyseergebnissen gezogen. Diese Interpretation stellt die entscheidende Phase für die Organisation dar, da aus ihr möglicherweise Konsequenzen und Handlungsempfehlungen abgeleitet werden. So gibt die Dateninterpretation Aufschluss über Korrelation, Kausalität und statistische Signifikanz. Eine Bestätigungstendenz, also die Neigung, die eigenen Erwartungen erfüllen zu wollen (confirmation bias), muss hier zwingend vermieden werden.

Auf der Suche nach einer Lehrkraft für Statistik?

Dir gefällt unser Artikel?

5,00/5 - 1 vote(s)
Loading...

Miriam

Miriam arbeitet als freie Autorin & Yogalehrerin. Getrieben von großer Neugier liebt sie es, Neues zu entdecken und zu erlernen; sich selbst weiterzuentwickeln und anderen dabei zu helfen.