Statistica Applicata
Contents
I Statistica descrittiva 4
2. Analisi univariate 4
Variabili statistiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Matrice dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Supporto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Distribuzioni di frequenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Frequenze assolute . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Frequenze relative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Frequenze cumulate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Classi di modalità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Rappresentazioni grafiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Indici sintetici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Indice di posizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Media aritmetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Quantili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Indice di variabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Campo di variazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Scarto interquartilico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Scarto quadratico medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Coefficiente di variazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Indice di simmetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Indice di curtosi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3. Analisi multivariate 11
Analisi di dipendenza: la connessione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Indipendenza statistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Indice di connessione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Dipendenza in media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Indipendenza in media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Analisi di correlazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Coefficiente di correlazione lineare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Analisi di regressione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Regressione lineare semplice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Metodo dei minimi quadrati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Stime dei minimi quadrati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Valori stimati dal modello e residui stimati . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Coefficiente di determinazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
II Calcolo delle probabilità 15
1
4. Probabilità elementare 15
Disposizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Permutazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Combinazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Probabilità classica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
La definizione di probailità: gli assiomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Gli assiomi di Kolmogorov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Conseguenze degli assiomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Probabilità condizionata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Eventi indipendenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Teorema di Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
5. Variabili casuali 17
Funzione di ripartizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Funzione di probabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Funzione di densità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Indici sintetici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Indici di posizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Valore atteso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Quantili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Indici di variabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Coefficiente di variazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Scarto medio assoluto dalla mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Scarto interquartilico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Campo di variazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Indici di simmetria e curtosi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Indici di simmetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Indice di curtosi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Variabili casuali multivariate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Variabili casuali bivariate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Condizionamento e indipendenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Coefficiente di correlazione lineare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Costante di normalizzazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
6. Modelli probabilistici 23
Modelli discreti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Modello uniforme discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Modello binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Modello poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Modello geometrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Modelli continui . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Modello uniforme continuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Modello esponenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Modello normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Modello chi-quadrato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
t
Modello di Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
F
Modello di Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
III Inferenza statistica 26
2
7. Statistiche campionarie 26
Intro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Campionamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Modelli statistici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Modelli statistici parametrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Verifica del modello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Procedure inferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Statistiche campionarie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Somma e media campionaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Varianza campionaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
8. Stima puntuale e stima intervallare 30
Intro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Stime e stimatori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Metodi di stima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Proprietà degli stimatori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Standard error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Proprietà di non distorsione e consistenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Stima intervallare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Intervallo di confidenza per la media di una popolazione normale . . . . . . . . . . . . . . . . 32
Intervallo di confidenza per la media di una popolazione qualsiasi . . . . . . . . . . . . . . . . 33
Intervallo di confidenza per la varianza di una popolazione normale . . . . . . . . . . . . . . . 33
9. Verifica delle ipotesi 33
Intro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Test statistici per la verifica delle ipotesi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Statistica test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Livello di significatività e regione di rifiuto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
P-value . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Test sulla media e sulla varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Verifica di ipotesi per la media di una popolazione normale . . . . . . . . . . . . . . . . . . . 36
Verifica di ipotesi per la media di una popolazione qualsiasi . . . . . . . . . . . . . . . . . . . 37
Verifica di ipotesi per la varianza di una popolazione normale . . . . . . . . . . . . . . . . . . 37
Test per il confronto tra medie di popolazioni normali . . . . . . . . . . . . . . . . . . . . . . 38
Test per il confronto tra varianze di popolazioni normali . . . . . . . . . . . . . . . . . . . . . 38
Test su proporzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Test per il confronto tra proporzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Test chi-quadrato di indipendenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Test chi-quadrato di adattamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
10. Modello di regressione lineare 41
Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Analisi di correlazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Test di correlazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Analisi di regressione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Inferenza e verifica di ipotesi nel modello di regressione lineare . . . . . . . . . . . . . . . . . 42
Valutazioni sul modello di regressione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Diagnostiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3
Figure 1:
Part I
Statistica descrittiva
2. Analisi univariate
Variabili statistiche
Le variabili statistiche sono caratteristiche delle unità statistiche che possono assumere una pluralità di valori.
Si distinguono in:
• categoriali o qualitative, a loro volta distinte in:
sconnesse
– ordinali
–
• numeriche o quantitative, a loro volta distinte in:
discrete, se si parla di valori al più numerabili
– continue, se i valori appartengono a un insieme continuo.
–
Matrice dei dati
La matrice dei dati presenta i dati grezzi, fornendo informazioni sulla popolazione di interesse. È composta
da:
• righe, che corrispondono alle informazioni sulle singole unità statistiche
4
• colonne, che corrispondono a singole caratteristiche di interesse dell’intera popolazione (ogni colonna è
una variabile statistica).
Rango i-esima, y i, i . . . , n.
Il valore che occupa la posizione , si dice di avere = 1,
rango
i
y y i-esima
N.B. è il valore ordinato, mentre è la osservazione effettuata, non ordinata.
i
(i)
y min(y , . . . , y y max(y , . . . , y
= ) e = ).
n n
1 1
(1) (n)
Supporto Y S Y
Il di una variabile statistica , indicato con , è l’insieme delle modalità di effettivamente
supporto Y ≤
S y , ..., y , ..., y J n.
osservate nella popolazione (campione); = con
Y j J
1
Quindi fanno parte del supporto l’insieme dei dati osservati presi una volta sola (possibili valori che può
Y
assumere una variabile ).
Distribuzioni di frequenza
Le distribuzioni di frequenza permettono di passare dai dati grezzi all’elaborazione di informazioni, trasfor-
mando la matrice dei dati in una tabella di frequenza.
Frequenze assolute
f y
Si indica con e rappresenta il numero di volte che risulta osservata.
j j
Frequenze relative
p
Si indica con ed è la proporzione tra la frequenza assoluta e la somma delle frequenze assolute, ovvero
j f f
j j
p = =
j J n
P f j
j=1
Le frequenze relative sono comprese tra 0 e 1 (se comprese tra 0 e 100 sono percentuali).
Frequenze cumulate
La frequenza cumulata consiste nella somma delle precedenti frequenze (assolute o relative).
Frequenza assoluta cumulata J
X
F f
=
j j
j=1
Frequenza relativa cumulata J
X
P p
=
j j
j=1
5
Classi di modalità
Le classi di modalità sono classi disgiunte che comprendono tutte le modalità osservate. Ad ogni classe
viene associata una frequenza assoluta. La classi non hanno necessariamente ampiezza costante. Ogni classe
a
f y y , y
corrisponde a un intervallo: è la frequenza associata alla classe , ovvero l’intervallo (y ].
j j−1 j j−1 j
Rappresentazioni grafiche
La rappresentazione grafica più adeguata per determinati dati dipende dalla natura di questi. Per dati
categoriali si possono utilizzare:
• diagrammi circolari (a torta), per serie statistiche sconnesse;
diagrammi a rettangoli (a barre), con altezza proporzionale alla frequenza delle modalità. Le basi sono
• di uguale dimensione e separate;
diagrammi a rettangoli multipli, utili nel caso in cui la frequenza è suddivisa secondo un criterio di
• classificazione;
Per dati numerici si possono utilizzare:
• diagrammi a bastoncini, con altezza proporzionale alla frequenza delle modalità;
p
f j
j h
h oppure =
• istogrammi con altezza = −y −y
y y
j j−1 j j−1
• poligoni di frequenza, cioè uno smussamento dell’istogramma; Per costruirlo bisogna individuare i punti
centrali di ogni classe e unirli;
• stima della densità, che somma tutti i dati che cadono nell’intervallo del singolo rettangolo e li divide
·
n b, b
per dove è l’ampiezza del rettangolo; l’altezza del grafico dipende dall’ampiezza b: se troppo
grande appiattisce il grafico; se troppo piccolo rischia di avvicinarsi all’andamento a bastoncini;
n −
y y
1 i
X ∈
f K( y
(y) = ), R
n nb b
i=1
• funzione di ripartizione empirica, il cui grafico è simile a una scala
≤
numero di osservazioni y ∈
F , y
(y) = R
n numero totale di osservazioni
• diagrammi di dispersione (scatterplot), che raffigura in punti sul piano cartesiano i dati numerici;
• boxplot, o diagramma a scatola e baffi, si basa sui quantili: rappres
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.