Deskriptive Statistik und explorative Datenanalyse

Deskriptive Statistik und explorative Datenanalyse

Deskriptive Statistik und explorative Datenanalyse. Die deskriptive Statistik, manchmal auch beschreibende Statistik genannt, ist erst einmal ein Sammelbegriff für alle methodischen Verfahren um Daten zu ordnen und sich einen Überblick über sie zu verschaffen

Eine offiziell anerkannte Definition für deskriptive Statistik ist schwer zu finden. Wikipedia definiert sie einfach über ihr Ziel: „Die deskriptive Statistik hat zum Ziel, empirische Daten durch Tabellen, Kennzahlen (auch: Maßzahlen oder Parameter) und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem bei umfangreichem Datenmaterial sinnvoll, da dieses nicht leicht überblickt werden kann.“ Das Gabler Wirtschaftslexikon beschreibt mit deskriptive Statistik den „Teilbereich der statistischen Methoden, der die Beschreibung von Gesamtheiten, bes. durch Tabellen, Grafiken sowie durch Kennwerte wie Mittelwerte und Streuungsmaße, zum Gegenstand hat. Bei Stichproben bedarf die deskriptive Statistik der Ergänzung durch die Inferenzstatistik, deren Gegenstand die Übertragung von Befunden aus Zufallsstichproben auf zugehörige Grundgesamtheiten ist.“ In Peter Atteslanders Einführungswerk „Methoden der empirischen Sozialforschung“ werden unter deskriptive Statistik die Darstellung von Häufigkeiten, statistische Maßzahlen, Korrelationen und Regressionen sowie theoretische Häufigkeitsverteilungen diskutiert. Also: was ist deskriptive Statistik? In ihrem Kern genau diese Ansammlung von Techniken.

Die explorative Statistik (nach Wikipedia) „untersucht und begutachtet Daten, von denen nur ein geringes Wissen über deren Zusammenhänge vorliegt. Viele EDA-Techniken werden im Data-Mining eingesetzt. Außerdem werden sie häufig in Lehrveranstaltungen über die Statistik als Einführung in das statistische Denken gelehrt.“

Nach dem Gabler Wirtschaftslexikon ist die explorative Datenanalyse eine „zusammenfassende Bezeichnung für deskriptive statistische Verfahren zur Aufdeckung von Datenstrukturen, Abhängigkeitsstrukturen und von Abweichungen der Einzelbefunde von einer vorhandenen Grundstruktur.“

Insofern kann die deskriptive Statistik von der explorativen Datenanalyse abgegrenzt werden, als dass die explorative Datenanalyse Methoden der deskriptiven Statistik vereint, aber nicht alle deskriptiven Verfahren der explorativen Datenanalyse dienen. Die explorative Datenanalyse untersucht also unbekannte Zusammenhänge, um hiervon z.B. Modelle abzuleiten, während die deskriptive Statistik erst einmal nur Merkmalsausprägungen von variablen beschreibt.

Deskriptive Statistik im Studium – in 5 Schritten zu deiner Topnote!

Deskriptive Statistik ist ein fester Bestandteil vieler Studiengänge, Semester für Semester quälen sich tausende von Studierenden durch die entsprechenden Vorlesungen, Seminare und Module. ich verwende das Wort quälen an dieser Stelle bewusst, denn die deskriptive Statistik ist bei vielen Studenten mit einigen, nicht sehr schmeichelhaften Adjektiven belegt. Das habe ich damals als Student am eigenen Leib erfahren und erlebe es heute als Dozent ebenfalls zu genüge[…]