Deskriptive Statistik Grundlagen

Deskriptive Statistik Grundlagen

Deskriptive Statistik Grundlagen. Mit den Grundlagen der deskriptiven Statistik wird sich in der Regel in den ersten paar Sitzungen von Statistikseminaren und Vorlesungen an den Universitäten beschäftigt. Dabei gibt es natürlich keine klaren Regeln, was zu den Grundlagen gehört und was nicht. Für den einen sind bestimmte Themen absolute Basics, dem anderen kommen die gleichen Themen schon vor wie höhere Mathematik. Das, was ich hier als Grundlagen bezeichne, ist daher eine subjektive Auswahl und entspringt meiner persönlichen Erfahrungen als Dozent in der empirischen Sozialforschung.

Es gibt zwei Dinge, die ein jeder Student, der etwas mit deskriptiver Statistik zu tun hat, meiner Meinung nach können muss. Das wäre zum ersten, Skalenniveaus von Variablen bestimmen zu können und zum anderen, die wichtigsten Maßzahlen zu kennen und zu verstehen

Das Skalenniveau, manchmal auch Messniveau genannt ist nach dem Gabler Wirtschaftslexikon ein „Begriff der Statistik für das Intensitätsniveau einer Messung“. Weil das noch sehr abstrakt ist, mache ich es direkt an einem konkreten Beispiel fest. Die Merkmalsausprägungen der variablen „Geschlecht“, „Schichtzugehörigkeit“ und „Alter“ können in ihren Eigenschaften voneinander unterschieden werden, da diese Variablen verschiedene Messniveaus aufweisen. Was heißt das im einzelnen?

Das Geschlecht einer Person kann zwei merkmalsausprägungen haben, die eindeutig voneinander unterschieden werden können, nämlich Männlich und Weiblich. Jedoch kann keine „Rangreihenfolge“ in den merkmalsausprägungen festgestellt werden – das eine ist nicht „mehr“ als das andere. In solchen Fällen redet man von einem nominalen Skalenniveau. Weitere Beispiele hierfür ist zum Beispiel die Religionszugehörigkeit oder die Nationalität.

Bei der Schichtzugehörigkeit ist dies anders. Die Mittelschicht ist „über“ der Unterschicht und die Oberschicht „über“ der Mittelschicht. Hier werden verschiedene Annahmen getroffen, z.B. über den sozioökonomischen Status, der bei angehörigen der Oberschicht höher ist als bei angehörigen der Mittelschicht, die eine Sortierung der Merkmalsausprägungen in einer Hierarchie erlauben. In solchen Fällen reden wir von ordinalen Skalenniveaus. Jedoch können wir diese Unterschiede immer noch nicht quantifizieren. Wir wissen zwar, dass die Oberschicht über der Mittelschicht steht, aber nicht „wie viel“ sie darüber steht. Ein weiteres Beispiel für eine ordinal skalierte Variable wäre der Schulabschluss.

Bei Variablen, bei denen wir die Differenzen zwischen den Merkmalsausprägungen quantifizieren kann, redet man von metrischen skalierten Variablen. Hierzu gehört z.B. das Alter und das Einkommen. 1500€ sind genau 200€ mehr als 1300€! Genau genommen differenziert man metrische Variablen noch in variablen mit Intervall- und Variablen mit Ratioskala. Der wichtigste Unterschied hier ist, dass ratioskalierte variablen einen natürlichen Nullpunkt haben, während dieser bei intervallskalierten Variablen willkürlich festgelegt wurde.

Die zweite wichtige Grundlage, die jeder Student draufhaben sollte, sind die wichtigsten Maßzahlen. Grundsätzlich werden hier Lagemaße, Streuungsmaße und Assoziationsmaße unterschieden. Lagemaße beschreiben die typische Merkmalsausprägung einer Verteilung. Das kann z.B. der häufigste Wert oder ein Durchschnitt sein. Streuungsmaße geben an, wie Homogen eine Verteilung ist oder, mit anderen Worten, wie stark eine Verteilung um den typischen Wert streut. Zusammenhangsmaße, auch Assoziationsmaße genannt, geben an, wie stark zwei oder mehr variablen miteinander zusammenhängen (häufig spricht man von „korrelieren“).

Wichtig ist nun, dass Maßzahlen immer in Abhängigkeit der Skalenniveaus der jeweiligen Variablen verwendet werden! Bei nominalen variablen verwendet man als Lagemaß den modus, als Streuungsmaß den IQV und als Zusammenhangsmaß Chi².

Bei ordinalen Variablen verwendet man als Lagemaß den Median, als Streuungsmaß den Quartilsabstand und als Zusammenhangsmaß meistens die auf dem Paarvergleich basierenden Maßzahlen Tau a, Tau b, Tau c, Somers d oder Gamma.

Bei metrischen Variablen verwenden wir als Lagemaß das arithmetische Mittel, als Streuungsmaß die varianz, Standardabweichung, Schiefe und Kurtosis und als Zusammenhangsmaß Pearsons r, die Regression und R².

Deskriptive Statistik im Studium – in 5 Schritten zu deiner Topnote!

Deskriptive Statistik ist ein fester Bestandteil vieler Studiengänge, Semester für Semester quälen sich tausende von Studierenden durch die entsprechenden Vorlesungen, Seminare und Module. ich verwende das Wort quälen an dieser Stelle bewusst, denn die deskriptive Statistik ist bei vielen Studenten mit einigen, nicht sehr schmeichelhaften Adjektiven belegt. Das habe ich damals als Student am eigenen Leib erfahren und erlebe es heute als Dozent ebenfalls zu genüge[…]