APPUNTI Statistica di Base S.A.
–
Gattone – anno 2020
La Statistica è uno strumento della ricerca scientifica basata
sull’osservazione di fenomeni. Analizza in termini quantitativi i
fenomeni collettivi ed è un’ insieme di tecniche finalizzate alla
raccolta e all’analisi dei dati.
I dati raccolti possono essere sistemati mediante:
• tabelle (distribuzioni di frequenza)
• grafici.
1. Progettare: pianificare come devono essere raccolti i
dati necessari per le ricerche (indagini campionarie)
2. Descrivere: sintetizzare i dati (statistica descrittiva )
3. Inferire: formulare previsioni basate sui dati raccolti
(statistica inferenziale).
Popolazione, Campione, Parametro, Statistica
La popolazione è l’insieme completo di tutte le unità oggetto
di studio
Esempi di popolazioni: tutti gli iscritti nelle liste elettorali
dell’Italia, tutti gli studenti di un’università, tutti gli abitanti di
Roma, tutte le azioni quotate alla Borsa di New York
Il campione è il sottoinsieme delle unità osservate nella
popolazione
Ad esempio, si può condurre un sondaggio elettorale
intervistando 500 elettori alla fine delle operazioni di voto (exit
polls), si possono intervistare a caso 50 studenti sulla
soddisfazione dei servizi offerti dall’università, ecc.
1 Un parametro è una misura di sintesi numerica che descrive
una caratteristica dell’intera popolazione
Sempre ignoto a meno che si tratti di un censimento
–
• Una statistica è una misura di sintesi numerica che descrive una
caratteristica del campione
Componenti fondamentali della statistica
descrittiva
• UNITÀ STATISTICA: entità elementare oggetto della rilevazione a
cui è possibile riferire in modo univoco l’informazione raccolta
La sua definizione dipende dal fenomeno che si sta analizzando
–
COLLETTIVO STATISTICO o POPOLAZIONE: l'insieme delle
unità statistiche omogenee rispetto a una o più caratteristiche
e/o circostanze;
VARIABILE o CARATTERE: caratteristica che assume diversi
valori tra le diverse unità statistiche
MODALITÀ: modo in cui la variabile si manifesta in una
particolare unità statistica
2
Frequenze assolute, relative e percentuali e le
loro cumulate
Indichiamo con la frequenza assoluta corrispondente alla
nj
modalità j-esima del carattere.
con la frequenza relativa corrispondente alla modalità j-
f n n
j j
esima del carattere, ossia il rapporto tra la frequenza assoluta e il
totale delle unità del collettivo.
con la frequenza percentuale alla modalità j-
p n n 100
j j
esima del carattere.
Per i caratteri ordinabili si possono calcolare le cumulate come
segue:
3
La sintesi delle distribuzioni
statistiche
Indici di posizione
-
La moda
L moda è la modalità prevalente del carattere, ossia quella a cui, in
una distribuzione di frequenze, corrisponde la frequenza maggiore.
Considerazioni:
La moda fornisce informazioni solo su un valore del carattere
4 La moda dipende solo dalle frequenze (quindi non è
influenzata da valori anomali)
La moda si può calcolare su tutti i tipi di caratteri
La mediana
La Mediana di un collettivo di unità ordinate è la modalità presentata dall’unità
centrale, che divide il collettivo in due parti di uguale numerosità: una parte
formata dalle unità che presentano una modalità precedente o uguale a
quella dell’unità centrale e una parte formata dalle unità che presentano una
modalità successiva o uguale a quella dell’unità centrale.
5
Perché calcolare la Mediana?
•Per caratteri qualitativi ordinati non possiamo calcolare la media
aritmetica.
La mediana sfrutta solo l'informazione relativa all'ordinamento delle
modalità della distribuzione: possiamo calcolarla anche (non solo
sui quantitativi) per caratteri qualitativi ordinati.
6
•Le due distribuzioni 1, 2, 3 e 1, 2, 100 hanno la stessa mediana: la
robusta
mediana è più della media aritmetica, risente meno della
presenza di valori anomali
•Per i caratteri quantitativi la mediana assieme alla media fornisce
surplus
un’importante di informazioni
•Più in generale: MEDIA, MODA e MEDIANA sono misure di sintesi
non alternative
complementari e ; descrivono aspetti differenti
dei dati; attenzione a chi trae conclusioni sulla base di una sola
statistica!
Percentili
• In generale se A è il p-esimo percentile allora –almeno il p% dei
valori è pari o inferiore ad A
–almeno il (100-p)% dei valori sono pari o superiori ad A
7 I percentili di uso più frequente sono i QUARTILI:
•
– il 25-esimo percentile, detto primo quartile (Q1)
–Il 50-esimo percentile, detto secondo quartile (Q2): la mediana
–il 75-esimo percentile, detto terzo quartile (Q3)
Indici di variabilità
l’attitudine di un carattere ad assumere
La variabilità esprime
diverse modalità.
8
Un indice di variabilità deve soddisfare almeno due requisiti:
deve assumere il valore minimo se e solo se tutte le unità
statistiche presentano la stessa modalità del carattere
“diversità”
deve aumentare all’aumentare della tra le modalità
assunte dalle unità statistiche.
Vedremo che l’indice di variabilità più usato in Statistica è la
Deviazione standard (sigma).
Per fare i calcoli però è più utile lavorare con il suo quadrato: la
2
Varianza (sigma quadro)
“La varianza è la media degli scarti al quadrato.”
La varianza è espressa nell’unità di misura del carattere elevata al
quadrato
Per questo motivo, per una migliore interpretazione, si fa
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
- Risolvere un problema di matematica
- Riassumere un testo
- Tradurre una frase
- E molto altro ancora...
Per termini, condizioni e privacy, visita la relativa pagina.