See attached files
Analisi
Il problema riguarda l'Esercizio N. 2, che studia la distribuzione del numero di ore trascorse davanti alla TV ($X$) per un campione di anziani, suddiviso per genere. L'analisi si concentra sul sottocampione delle donne.
Tipo di problema: Statistica descrittiva univariata, calcolo di indici di variabilità
Metodo: Calcolo della differenza media di Gini (indice di concentrazione/dispersione) per dati individuali con ripetizione
Dati: Per le donne: $2, 3, 3, 4, 5$ ore ($n = 5$)
Soluzione
Punto a) Differenza media di Gini con ripetizione
La differenza media di Gini con ripetizione è definita come la media aritmetica dei valori assoluti delle differenze tra tutte le coppie possibili di osservazioni (inclusi i confronti di ciascuna unità con sé stessa, che danno differenza nulla).
La formula è:
Δ=n2∑i=1n∑j=1n∣xi−xj∣
Passo 1: Costruzione della tabella delle differenze assolute $|x_i - x_j|$
I dati sono: $x_1 = 2, x_2 = 3, x_3 = 3, x_4 = 4, x_5 = 5$
| $x_i \setminus x_j$ | 2 | 3 | 3 | 4 | 5 | Somma riga |
|---|---|---|---|---|---|---|
| 2 | 0 | 1 | 1 | 2 | 3 | 7 |
| 3 | 1 | 0 | 0 | 1 | 2 | 4 |
| 3 | 1 | 0 | 0 | 1 | 2 | 4 |
| 4 | 2 | 1 | 1 | 0 | 1 | 5 |
| 5 | 3 | 2 | 2 | 1 | 0 | 8 |
Passo 2: Calcolo della somma totale delle differenze
∑i=15∑j=15∣xi−xj∣=7+4+4+5+8=28
Passo 3: Calcolo dell'indice
Δ=5228=2528=1.12
Nota: Se si considerasse la definizione "senza ripetizione" (solo coppie $i \neq j$, denominatore $n(n-1) = 20$), il risultato sarebbe $1.4$. Tuttavia, con la specifica "con ripetizione", il denominatore corretto è $n^2 = 25$.
Punto b) Unità di misura
La differenza media di Gini è una media di differenze assolute dello stesso carattere $X$. Poiché $X$ è misurato in ore, anche la differenza media è espressa in numero di ore (o semplicemente ore).
Punto c) Categoria di indici
La differenza media di Gini appartiene alla categoria degli indici di variabilità (o dispersione) assoluti. Misura quanto le unità statistiche differiscono tra loro rispetto alla modalità del carattere osservato.
Punto d) Campo di variazione
Il campo di variazione (range) è la differenza tra il valore massimo e il valore minimo della distribuzione:
R=xmax−xmin=5−2=3 ore
Punto e) Verosimiglianza dello scarto quadratico medio
Lo scarto quadratico medio (deviazione standard) è definito come la radice quadrata della varianza, che è una media di scarti quadratici. Poiché i quadrati sono sempre non negativi, la varianza è sempre $\geq 0$, e conseguentemente lo scarto quadratico medio è sempre non negativo ($\geq 0$).
Un valore di $-0.5$ ore è impossibile matematicamente. Pertanto, non è verosimile affermare che lo scarto quadratico medio sia pari a $-0.5$ ore; la risposta corretta è no.
Risposta finale
a) La differenza media di Gini con ripetizione per le donne è:
Δ=2528=1.12 ore
b) L'unità di misura è il numero di ore (ore).
c) L'indice appartiene alla categoria degli indici di variabilità/dispersione assoluti.
d) Il campo di variazione è:
R=3 ore
e) No, non è verosimile. Lo scarto quadratico medio non può assumere valori negativi, essendo sempre $\geq 0$.
