Welches Streuungsmaß kommt für nominal-skalierte Variablen in Betracht?
[Analysis]
Bei nominal-skalierten Variablen liegt keine Metrik vor, daher können klassische Streuungsmaße wie Varianz oder Standardabweichung nicht berechnet werden. Stattdessen kommt als Streuungsmaß einzig ein rein frequenzbasiertes Maß in Betracht.
Zulässiges Streuungsmaß für nominalskalierte Variablen:
– die Variationsquote (engl. Variation Ratio)
[Solution]
Schritt 1 – Definition der Variationsquote
Die Variationsquote misst den Anteil der Beobachtungen, die nicht in der Modalkategorie liegen.
Schritt 2 – Formel in LaTeX mit …
Zu berechnen ist
<<|
VR ;=; 1 ;-; \max_{i} p_{i}
|>>
wobei pi der relative Häufigkeitsanteil der i-ten Kategorie ist, und maxipi den Anteil der Modalkategorie darstellt.
Alternativ in absoluten Häufigkeiten:
<<|
VR ;=; 1 ;-; \frac{n_{\text{Modal}}}{N}
|>>
mit nModal = Häufigkeit der Modalkategorie und N = Gesamtzahl der Beobachtungen.
Schritt 3 – Interpretation
– VR = 0 bedeutet perfekte Konzentration auf eine Kategorie (keine Streuung)
– VR → 1 bedeutet maximale Gleichverteilung über alle Kategorien (hohe Streuung)
[Answer]
Als Streuungsmaß für nominalskalierte Variablen kommt die Variationsquote in Betracht:
<<|
VR ;=; 1 ;-; \max_{i} p_{i}
|>>