Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
X
scala di rilevazione.
Media dei dati aggregati:
Media dei dati disaggregati:
Informazione statistica: ordine di grandezza medio
con cui parla il fenomeno & stessa unità di misura
di X su U
Se è quantitativo continuo (x : x –| x ) e le sue modalità sono intervalli (insieme di numeri), la media è in genere
X i l L
calcolata con l’ipotesi del valore centrale x *.
i
Cos’è il valore centrale? Somma degli estremi, inferiore e superiore, diviso 2.
x *:
i
25,49 = Km che in media vengono percorsi calcolati su
dati raggruppati.
x * • p x centrale per frequenze relative
i i
VALORE MEDIO
•unico valore sintetico (indicatore statistico)
•evidenzia un particolare aspetto (medio) del
comportamento di X su U
• MODA, MEDIANA, MEDIA quale scegliere?
X : moda
0
X : mediana
0,5
Es. Esperimento statunitense: quanti partner sessuali
desideri per i prossimi 30 anni? Notability
valori medi più robusti
X X :
0, 0,5 info complementari
X X :
0, 0,5
Proprietà di :
non è tipica della media aritmetica. Deve essere compreso tra il valore più piccolo e il valore più
Internalità:
grande presi in considerazione .
non è tipica delle media aritmetica ma che la moda e la mediana non hanno
Associatività: 16
tipica della media aritmetica
Equidistribuzione/ mantenimento del TOT:
tipica della media aritmetica
Annullamento degli scarti (ponderati):
sostituendo ai dati veri la media si
Mantenimento:
mantiene il parametro descrittivo.
Proprietà di equi distribuzione/mantenimento :
Solo
Proprietà associativa:
Comune a molte altre medie ( ma nom
xo e x0,5)
La media delle medie parziali
ponderata con la numerosità dei
gruppi riproduce
Popolazione stratificata, sotto
popolazioni, ciascuna con la sua
numerosità.
Sommando le numerosità si riproduce
la della popolazione
numerosità
d’interesse.
CAPITOLO 6:
Approfondimenti sui valori
medi
Tre sono i criteri più noti che possono guidare nella scelta e nella costruzione del valore medio opportuno per
sintetizzare un v.s. quando X è quantitativo.
1. si sceglie il valore medio di sintesi in base alle proprietà statistico-matematiche di cui esso
Proprietà formali:
gode.
2. sappiamo che sintetizzando la v.s. in un unico valore medio si incorre in una perdita di
Ottimizzazione:
informazioni. Quando è possibile esprimere tale perdita con un’opportuna -per intenderci, una
funzione dei dati
formula contenente le – si può scegliere il valore medio che rende minima tale funzione, cioè il più piccolo
possibile. Seguendo questo criterio, si minimizza la perdita di informazioni, ovvero si ottimizza il valore medio.
3. Tra le informazioni che vanno perdute nel passaggio dalla v.s. al valore medio può sussistere un
Invariante:
particolare aspetto di X che è importante mantenere inalterato nella sintesi. Si esprime allora tale aspetto con una
funzione dei dati (una formula) e si sceglie il valore medio che sintetizza la v.s. lasciando invariata tale funzione.
Il valore medio costruito secondo questo criterio è detto media alla Chisini.
Le proprietà della media aritmetica:
Se ciò che interessa il valore medio di sintesi sono le suo proprietà algebrico-matematiche, si deve scegliere la media
in un insieme chiamato classe delle Tale serie di proprietà è di particolare interesse per la sintesi
medie di potenza.
statistica di un fenomeno quantitativo. La media aritmetica appartiene a questa classe, mentre moda, mediana e
percentili no.
La ragione per cui la media aritmetica è il valore medio di sintesi più utilizzato è che gode di molte proprietà utili: 17
1. Il valore della media aritmetica è sempre compreso fra la più piccola e la più grande
Proprietà di internalità:
delle modalità osservate di X. In formula
2. Se X e Y sono due fenomeni diversi ma collegati fra loro dalla formula , dove è un
Proprietà di omogeneità:
qualche numero (costante) diverso da 0, si dice che Y è una di X; la media aritmetica di Y
trasformazione di scala
si ottiene dalla media aritmetica di X con la stessa identica trasformazione, cioè
Quando U è molto numerosa (N è un numero grande) è pratica sensata utilizzare dati anziché dati
aggregati
individuali. Formalmente, si tratta di considerare U di numerosità N, suddivisa in un certo numero, diciamo h, di
sottopopolazioni ciascuna di numerosità con e . Quello che ci interessa è sempre la media aritmetica (generale) di X
sull’intera U. Non disponiamo però dei dati individuali ma solo dei dati aggregati, cioè le medie nelle
sottopopolazioni.
Come si può calcolare la media senza i dati (individuali). Non si deve rinunciare perché la media aritmetica è
associativa.
3. la media (generale) di X su U è sempre raggiungibile dai dati aggregati (sulle
Proprietà associativa:
sottopopolazioni ), basta calcolare la media delle medie delle sottopopolazioni. Si tratta di usare le medie parziali
al posto delle modalità e le numerosità parziali al posto delle frequenze . In formule:
4. Se X e Y sono due fenomeni diversi ma legati dalla formula con a e b numeri reali
Proprietà di linearità:
qualunque e b diverso da 0, si dice che Y è una di X. La media aritmetica di Y si ottiene
trasformazione lineare
dalla media aritmetica di X con la stessa identica trasformazione, cioè . Questa proprietà è detta la
linearità:
media aritmetica è lineare.
Definizione scarti o deviazioni: Le differenze sono dette dalla media aritmetica. Se poi si tiene
scarti o deviazioni
conto del fatto che il valore è presente su U con frequenza , si ha lo scarto ponderato.
Quando lo scarto è positivo si dice che è un valore Quando invece lo scarto è negativo si dice che è
sopra-media.
sotto-media.
5. I valori sopra e sotto-media si compensano, cioè si sommano tutti i k
Proprietà di annullamento degli scarti:
scarti ponderati si ottiene (sempre!) 0. Questa proprietà è detta annullamento degli scarti e vale solo per la media
aritmetica. In formule: .
Il fatto che solo la media aritmetica annulli la somma degli scarti ponderati, compensi i valori sopra- e sotto-media,
conferisce alla media aritmetica il ruolo di della v.s. e in questo senso ne rappresenta una sintesi della
baricentro
tendenza centrale.
6. La somma di tutti i valori di X su tutte le N unità
Proprietà di mantenimento e di equidistribuzione del totale:
osservate prende il nome di di X. In formule: .
totale
Dividendo il totale di X per N si ottiene la media aritmetica di X. Il totale di X è anche dato dalla media moltiplicata
per N che, a sua volta, è la somma delle frequenze . In formule:
Questa formula definisca un’altra proprietà esclusiva della media, che ammette una doppia chiave di lettura.
1. L’analisi si concentra sul primo e ultimo termine della formula. Se ai valori osservati sostituiamo la media
aritmetica che li sintetizza tutti, il totale di X non cambia. Allora la media aritmetica mantiene inalterato il
totale. 18
2. Analisi dei primi due termini della formula. Se il totale di X fosse diviso in parti uguali fra le N unità di U, a
ciascuna unità toccherebbe una quota di totale parti a . Allora la media aritmetica di X
equidistribuisce il totale
sulle N unità di U
CAPITOLO 7: Variabilità
In questo capitolo verranno considerati solo i fenomeni quantitativi (discreti e continui), cioè quelli che generano
variabili statistiche completamente numeriche e che sono sintetizzabili con la media aritmetica.
Nell’immaginario popolare la Statistica è spesso
associata alla famosa poesia di Trilussa:
…te tocca un pollo all' anno:
e, se nun entra ne le spese tue,
t'entra ne la statistica lo stesso
perche' c'e' un antro che ne magna due.
U N X : quantitativo
il comportamento di X su U
Descrivere
Associare a
Sinonimi: dispersione, spread
Def: Tendenza a di X a manifestarsi su U con valori molteplici e differenti. Al crescere della
variare
variabilità serve sempre più statistica.
Variabilità = scopo della Statistica. Complessità che va affrontata statisticamente
Infatti, la media aritmetica fra 0 (polli mangiati dal protagonista della poesia) e 2 (polli mangiati dall’ antro) è proprio
1 (1 pollo a testa).
Nella situazione descritta la media aritmetica svolge molto male il suo lavoro di valore medio di sintesi, poiché da
Trilussa, non essendo uno statistico, si è fermato alla media aritmetica. Con
un’indicazione contraria alla realtà.
strumenti statistici più opportuni, anche una situazione difficile come quella della poesia può essere descritta più
correttamente.
Vedi es. a pag. 83. in concreto, i valori di sintesi con maggiore capacità descrittiva sono:
La mediana
La frequenza cumulata relativa della modalità 0
La moda con frequenza relativa.
Che cosa rende difficile la sintesi di una siffatta variabile statistica e la descrizione del comportamento di X su U?
Qual è l’aspetto caratteristico di questa U che non riesce a cogliere? Si tratta della che
variabilità o dispersione di X,
è l’attitudine di un fenomeno quantitativo a manifestarsi, sulle N unità di U, con modalità fra loro diverse e distanti.
La situazione della poesia è di X manifesta solo due modalità fra loro massimamente distanti,
massima variabilità;
ossia niente e tutto. 19
La variabilità (accanto alla numerosità) è ciò che rende necessario il ricorso alla strumentazione statistica per l’analisi
e la comprensione del comportamento del fenomeno su U. È di fatto ciò che si cerca di descrivere e spiegare
statisticamente. La variabilità di X quantitativo è quindi un aspetto essenziale nella descrizione statistica del suo
comportamento su U, che però necessita il supporto di misura e analisi della variabilità.
La misura (assoluta) della variabilità di X (su U) è un indice sintetico calcolato sulla v.s. con le seguenti caratteristiche.
Proprietà di un indice di variabilità:
Assume valore 0 in cioè nella situazione limite in cui X si manifesta sulle N unità di U con
assenza di variabilit&agra