RIEPILOGO GENERALE FORMULE STATISTICA
Descrizione della grandezza Formula
Quantitative ( Continue , Discrete )
-Variabili Qualitative ( Ordinate , Sconnesse )
n
- = n°. di dati = Totale delle unità statistiche che compongono il collettivo
x ,x ,...... x
- sono le modalità distinte che assume il carattere x del collettivo
1 2 k
k =
- n°. di classi che raggruppano determinate quantità di individui ( frequenze)
n n ..n
- indica le frequenze assolute di ciascuna delle classi
1 , 2 . k
-La frequenza è il numero di volte che la modalità di un carttere assume lo stesso valore. k
k n → N = ∑ n = n
Frequenze assolute { con il numero di tipologie ,classi , di frequenze distinte } j j
j=1
k
N = ∑ n = n
Frequenze assolute cumulate j
j=1 k
n
f = → ∑ f =1
j
Frequenze relative j j
n j=1
k
F = ∑ f =1
Frequenze relative cumulate j
j=1
p = f ∙ 100 → ∑ p =100
Frequenze percentuali j j j
1 k
Frequenze percentuali cumulate P = ∑ p =100
j
j=1 /
= n [ c - c ]
Istogrammi per caratteri quantitativi continui Densità di frequenza in ordinata j j+1 j
c - c ]
-Base del rettangolo = Ampiezza della classe in ascissa =[ j+1 j
/
n c - c ] c - c ]
-Altezza del rettangolo = Densità di frequenza in ordinata = [ Ampiezza della classe in ascissa =[
j j+1 j j+1 j
[ INDICE STATISTICO DI POSIZIONE ]
Media aritmetica di una distribuzione unitaria 1
μ = ∙ ∑ x i
n
n =
[ il numero totale di elementi della popolazione ] i=1
x =
[ la modalità del carattere di ciascun elemento della popolazione ]
i
[ INDICE STATISTICO DI POSIZIONE ]
Media campionaria 1
x= ∙ ∑ x i
n
n =
[ il numero totale di elementi del campione della popolazione ] i=1
x =
[ la modalità del carattere di ciascun elemento del campione della popolazione ]
i
[ INDICE STATISTICO DI POSIZIONE ]
Media della distribuzione della media campionaria k
x = μ = ∑ x ∙ f ( x )
[ la media di ciascuno dei campioni estratti dalla popolazione ]
i x i i
j=1
f(x )
[ = la frequenza delle medie dei campioni estratte dalla popolazione ]
i
Numero delle classi ( Metodo empirico per stabilire il Numero di classi )
n = N = n
[ il numero totale di elementi della popolazione ] c
2
Valore centrale di una classe
c = c = ( c + c ) / 2
[ valore minimo della classe ]
j min j j min jmax
c =
[ valore massimo della classe ]
jmax
[ INDICE STATISTICO DI POSIZIONE ] k
k
k 1
μ = ∑ n ∙ c / ∑ n = ∙ ∑ n ∙ c
Media aritmetica di una distribuzione di frequenza con classi di valori j j j j j
n j=1
j=1
j=1
n =
[ il numero totale di elementi della popolazione ]
n
[ = è la frequenza assoluta del numero di elementi che hanno la stessa modalità o classe di modalità
j
del carattere ]
c
[ = valore centrale della classe , con carattere x ]
j j
[ INDICE STATISTICO DI POSIZIONE ] n
Media aritmetica ponderata /
∙ p p
∑ x ∑
x = j j
j
a
x =
[ la modalità del carattere di ciascun elemento della popolazione ]
i i=1
p
[ = è il peso di ciascun carttere ] , con pesi [ p ] non negativi.
i
Proprietà rilevanti della media Aritmetica n
-La somma degli scarti dalla media aritmetica è =0 ∑ ( xi - μ ) =0
c = μ i=1
-La somma del quadrato degli scarti da una costante c è minima quando n
-La media aritmetica è compresa tra il più piccolo e il più grande dei dati osservati 2
∑ ( xi - c ) =min c= μ
→
-Il valore medio moltiplicato per il numero di unità è = alla somma dei valori osservati i=1
-La media aritmetica risente fortemente dei valori estremi
[ INDICE STATISTICO DI POSIZIONE ]
Media geometrica su una distribuzione unitaria x .......⋅x
⋅x
x = n
g 1 2 n
x =
[ la modalità del carattere di ciascun elemento della popolazione ]
i 3
[ INDICE STATISTICO DI POSIZIONE ]
Media geometrica su una distribuzione di frequenze n √ 1n1 2n2 knk
x = x ∙x ........∙x
g
n
[ = è la frequenza assoluta del numero di elementi che hanno la stessa modalità o classe di modalità
j
del carattere ]
[ INDICE STATISTICO DI POSIZIONE ]
Media geometrica su una distribuzione di frequenze relative 1f1 2f2 kfk
x = x ∙x ........∙x
g
f =
[ alla frequenza relativa degli elementi che hanno la stessa modalità o classe di modalità del
k
carattere ] Dopo aver ordinato in senso non decrescente i cartteri
[ INDICE STATISTICO DI POSIZIONE ]
Mediana , di una distribuzione unitaria , è un indice di posizione che occupa la posizione centrale di si trova il : Rango Me = ( n+1 ) /2 →
n
un insieme di unità statistiche ordinate : se è dispari il rango si calcola come : = x
La mediana è il carattere corrispondente M (n+1)/2
e
Dopo aver ordinato in senso non decrescente i cartteri
[ INDICE STATISTICO DI POSIZIONE ] si trova il : Rango Me =[ n/2 +( n 2+1 )] /2 →
Mediana , di una distribuzione unitaria , è un indice di posizione che occupa la posizione centrale di
n
un insieme di unità statistiche ordinate : se è pari il rango si calcola come : La mediana è il carattere corrispondente a :
x x
M = [ + ] / 2
n/2 (n/2+1)
e
[ INDICE STATISTICO DI POSIZIONE ] Dopo aver cumulato le frequenze si trova il rango della
mediana che è : Rango Me = ( N+1 ) /2.
Mediana di una distribuzione di frequenza assoluta , è un indice di posizione: che occupa la posizione
centrale della distribuzione di frequenza. Calcolate le x
La mediana M = è contenuta nella frequenza assoluta
(N+1)/2
e
frequenze cumulate ,se le unità statistiche sono dispari il rango si calcola come : cumulata corrispondente
4 Dopo aver cumulato le frequenze si trova il rango della
[ INDICE STATISTICO DI POSIZIONE ] ( N+1 ) /2
mediana corrispondente a: Rango Me = .
(N+1)
Mediana di una distribuzione di frequenza assoluta , è un indice di posizione: che occupa la posizione ( N /2+1 ) /2
Rango Me =
( N /2+1 )
centrale della distribuzione di frequenza. Calcolate le La mediana è la somma delle mediane contenute nella
frequenze cumulate ,se le unità statistiche sono pari il rango si calcola come : frequenza corrispondente divisa per 2
( n+1 ) /2
Rango Me = è individuato sulla frequenza relativa
[ INDICE STATISTICO DI POSIZIONE ] F ≥ 0,5 .
cumulata tale che per definizione
j
Mediana di una distribuzione di frequenza relativa ( per caratteri qualitativi ordinati ), è un indice Per definizione la mediana è il carattere corrispondente alla
di posizione: calcolate le frequenze relative cumulate ,la mediana è individuata dalla colonna della F ≥ 0,5
frequenza relativa cumulata .
frequenza relativa che contiene la frequenza relativa cumulata F > 0,5 j
J
[ INDICE STATISTICO DI POSIZIONE ] Rango Me = ( n+1 ) /2 è individuato sulla frequenza relativa
tale che F ≥ 0,5
cumulata per definizione.
Mediana di una distribuzione di frequenza con classi di valori , è un indice di posizione: ordinate le j
classi e calcolate le frequenze relative cumulate ,se le unità statistiche sono dispari il rango si calcola Il valore della mediana è contenuta nella classe corrispondente
al valore più vicino a F = 0,5 ma maggiore di 0,5 .
come : [ Il significato dei termini è il seguente ] : j
La mediana si calcola con la seguente relazione :
I = Estremo inferiore della classe
m Me I + [ ( 0,5 – F ) / ( F -F )] ∙ Δ
- =
Δ = Intervallo della classe m m-1 m m-1 m
m
F = Valore della frequenza che precede la frequenza che individua la Mediana
m-1
F = Valore della frequenza che individua la Mediana
m 5
[ INDICE STATISTICO DI POSIZIONE ] Rango Me = ( n+1 ) /2 è individuato sulla frequenza relativa
tale che F ≥ 0,5
cumulata per definizione.
Mediana di una distribuzione di frequenza con classi di valori , è un indice di posizione: ordinate le j
classi e calcolate le frequenze relative cumulate ,se le unità statistiche sono pari il rango si calcola come Il valore della mediana è contenuta nella classe corrispondente
al valore più vicino a F = 0,5 ma maggiore di 0,5 .
: [ Il significato dei termini è il seguente ] : j
La mediana si calcola con la seguente relazione :
I = Estremo inferiore della classe
m Me I + [ ( 0,5 – F ) / ( F -F )] ∙ Δ
- =
Δ = Intervallo della classe m m-1 m m-1 m
m Nota : Il rango ( n/2 +1 )/2 per una classe coincide di solito con il
F = Valore della frequenza che precede la frequenza che individua la Mediana
m-1 rango ( n+1 ) /2 per cui alla fine non cambia nulla nel calcolo. Se
F = Valore della frequenza che individua la Mediana
m dovesse cambiare la classe bisogna fare la media
Dopo aver ordinato in senso non decrescente gli n caratteri si
[ INDICE STATISTICO DI POSIZIONE ] k = ∙ n
calcola il prodotto 0,25
Il primo quartile Q ,di una distribuzione unitari ,è un indice di posizione:ed è un valore tale che il k
1 Se non è un numero intero si arrotonda all'intero successivo
25 % dei dati ordinati è minore o uguale a Q . .
1
Il primo quartile Q è detto anche 25-esimo percentile.
1 Questo intero identifica la posizione e il valore dei dati
ordinati , e quindi il valore del primo Quartile .
La formula accanto vale sia se il numero dei cartteri è pari che dispari k
Se è un numero intero , la posizione del quartile è
individuata dalla posizione del k-esimo e del ( k+1)-esimo
valore .
Il valore del primo quartile è la semisomma del valore
corrispondente alla k-esima e (k+1)-esima posizione
naturalmente diviso 2 .
6 Dopo aver ordinato in senso non decrescente gli n caratteri si
[ INDICE STATISTICO DI POSIZIONE ] k = 0,50∙ n
calcola il prodotto
Il secondo quartile Q ,di una distribuzione unitari ,è un indice di posizione:ed è un valore tale che k
2 Se non è un numero intero si arrotonda all'intero successivo
il 50 % dei dati ordinati è minore o uguale a Q . .
2
Il secondo quartile Q è detto anche 50-esimo percentile o mediana .
2 Questo intero identifica la posizione e il valore dei dati
ordinati , e quindi il valore del secondo Quartile .
La formula accanto vale sia se il numero dei cartteri è pari che dispari k
Se è un numero intero , la posizione del quartile è
individuata dalla posizione del k-esimo e del ( k+1)-esimo
valore .
Il valore del secondo quartile è la semisomma del valore
corrispondente alla k-esima e (k+1)-esima posizione
naturalmente diviso 2 .
Dopo aver ordinato in senso non decrescente gli n caratteri si
[ INDICE STATISTICO DI POSIZIONE ] k = 0,75∙ n
calcola il prodotto
Il terzo quartile Q ,di una distribuzione unitari ,è un indice di posizione:ed è un valore tale che il k
3 Se non è un numero intero si arrotonda all'intero successivo
75 % dei dati ordinati è minore o uguale a Q . .
3
Il terzo quartile Q è detto anche 75-esimo percentile.
3 Questo intero identifica la posizione e il valore dei dati
ordinati , e quindi il valore del terzo Quartile .
La formula accanto vale sia se il numero dei cartteri è pari che dispari k
Se è un numero intero , la posizione del quartile è
individuata dalla posizione del k-esimo e del ( k+1)-esimo
valore .
Il valore del terzo quartile è la semisomma del valore
corrispondente alla k-esima e (k+1)-esima posizione
naturalmente diviso 2 .
7 Per il calcolo del primo quartile si ordinano le classi.
[ INDICE STATISTICO DI POSIZIONE ] Si calcolano poi le frequenze assolute cumulate e
Calcolo del primo Quartile Q ,per una distribuzione in classi , ordinate le classi , il primo Quartile è
1 successivamente la frequenze relative cumulate .
un valore ,dellerequenze cumulate , tale che il 25 % dei dati ordinati è < a Q 1 Il valore del primo Quartile Q è quello che ha una frequenza
I = Estremo inferiore della classe 1
Q1 F
cumulata relativa che più si avvicina al valore = 0,25
j
Δ = Intervallo della classe
Q1 Il valore del quartile si calcola con la seguente relazione :
F = Valore della frequenza che precede la frequenza che individua la Mediana
-1
Q1 I + F F - F Δ
Q = [ ( 0,25 - ) / ( ) ] ∙
F = Valore della frequenza che individua la Mediana Q1 Q1-1 Q1 Q1-1 Q1
1
Q1 Per il calcolo del terzo quartile si ordinano le classi.
[ INDICE STATISTICO DI POSIZIONE ] Si calcolano poi le frequenze assolute cumulate e
Calcolo del terzo Quartile Q ,per una distribuzione in classi , ordinate le classi , il terzo Quartile è
3 successivamente la frequenze relative cumulate .
un valore ,delle frequenze cumulate , tale che il 75 % dei dati ordinati è < a Q 3 Il valore del terzo Quartile Q è quello che ha una frequenza
I = Estremo inferiore della classe 3
Q3 F
cumulata relativa che più si avvicina al valore = 0,75
j
Δ = Intervallo della classe
Q3 Il valore del quartile si calcola con la seguente relazione :
F = Valore della frequenza che precede la frequenza che individua la Mediana
-1
Q3 Q I F F - F Δ
= + [ ( 0,75 - ) / ( ) ] ∙
F = Valore della frequenza che individua la Mediana 3 Q3 Q3-1 Q3 Q3-1 Q3
Q3 La moda è la modalità del carattere che si ripete piu volte
[ INDICE STATISTICO DI POSIZIONE ]
La moda di una distribuzione unitaria
[ INDICE STATISTICO DI POSIZIONE ] La moda è la modalità che ha la frequenza più alta
La moda di una distribuzione di frequenza di un carattere qualitativo ordinato 8 a
Per prima cosa si calcola l'ampiezza della classe Poi si
[ INDICE STATISTICO DI POSIZIONE ] j .
calcola la densità di frequenza come rapporto tra intensità
La moda di una distribuzione di frequenza con classi di valori h n / a
assoluta / ampiezza della classe ovvero =
j j j .
La moda corrisponde alla densità di frequenza più alta .
| |
Quantitativo Qualitativo ordinato Qualitativo sconnesso
[ INDICE STATISTICO DI POSIZIONE ] Si
Media Si Si
Mediana Si Si Si
Moda
[ INDICI DI VARIABILITÀ ]
Dato un insieme di unità statistiche è ordinate in modo non decrescente definiamo come : x -x
-Range o Range =
campo di variazione : max min
-Differenza interquartile è definita come : dQ = Q -Q
n n-1
[ INDICI DI VARIABILITÀ ] n
1
∙
μ ∑ x
Dato un insieme n di unità statistiche è definita la media come : = n i
i=1
Definiamo lo scarto dalla media come : s = x - μ
i
[ INDICI DI VARIABILITÀ ] 1
2
La varianza σ di una distribuzione unitaria di un popolazione è definita come la somma del quadrato n
2 2 2
σ ∑ ( x -μ) σ > 0
= ∙ →
degli scarti divisa per il numero totale degli elementi della popolazione . n i
2
σ
Se la varianza è piccola, c'è un'alta probabilità di ottenere valori della variabile aleatoria vicini al valor i=1
2
σ
medio; se invece è grande, c'è una maggior probabilità di ottenere valori lontani dal valor medio.
La varianza è un indice si dice di dispersione dalla media come misura anche la dispersione di una
distribuzione di probabilità 9
[ INDICI DI VARIABILITÀ ] x ∙n
Per primo si calcola il totale delle unità statistiche j j
k
σ 2
La varianza di una distribuzione di frequenza ( nel caso in cui le unità statistiche siano raggruppate 1
μ= ∙ ∑ x ∙n
Poi ci calcoliamo la media come j j
per frequenze assolute ) . n
k j=1
ed infine la varianza
x
Le unità statistiche sono indicate j k
1
2 2
σ = ∙ ∑ ( x - μ ) ∙ n
n j j
Le frequenze assolute sono indicate con n
j j=1
INDICI DI VARIABILITÀ ] c
Per primo calcoliamo il valore centrale di ogni classe j
σ 2
La varianza di una distribuzione in classi ( nel caso in cui le unità statistiche siano raggruppate in n ∙c
Per secondo ci si calcola il totale delle unità statistiche
classi ) . j j
k
1
x
Le classi sono indicate con μ= ∙ ∑ c ∙n
Poi ci calcoliamo la media come
j j j
n
k
c
Il valore centrale della classe è indicato con j=1
j ed infine la varianza
n
Le frequenze assolute sono indicate con j k
1
2 2
σ = ∙ ∑ ( c - μ ) ∙ n
j j
n
[ INDICI DI VARIABILITÀ ] n
∑ μ 2
Dev ( x) = ( x - )
La devianza è il numeratore della varianza i
i=1
[ INDICI DI VARIABILITÀ ] n
La deviazione standard (o scarto quadratico medio) è la radice quadrata della varianza √ ∑
σ = (1/n) μ 2
( x - )
1
i=1
10
[ INDICI DI VARIABILITÀ ]
Il coefficiente di variazione CV è il rapporto tra la deviazione standard e la media moltiplicato per 100 μ
CV = ( σ / ) ∙100 → x > 0
La varianza di un carattere Y ottenuto dalla trasformazione
Y = α x + β α σ
2 2
Var ( Y ) = ∙
2
x μ σ
di un carattere con media e varianza è:
[ BOX PLOT ]
In statistica il box-plot, detto anche box and whiskers plot (diagramma a scatola e baffi) o semplicemente
boxplot, è una rappresentazione grafica utilizzata per descrivere la distribuzione di un campione tramite
semplici indici di dispersione e di posizione.
Viene rappresentato (orientato orizzontalmente o verticalmente) tramite un rettangolo diviso in due parti,
da cui esc
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.