Estratto del documento

RIEPILOGO GENERALE FORMULE STATISTICA

Descrizione della grandezza Formula

Quantitative ( Continue , Discrete )

-Variabili Qualitative ( Ordinate , Sconnesse )

n

- = n°. di dati = Totale delle unità statistiche che compongono il collettivo

x ,x ,...... x

- sono le modalità distinte che assume il carattere x del collettivo

1 2 k

k =

- n°. di classi che raggruppano determinate quantità di individui ( frequenze)

n n ..n

- indica le frequenze assolute di ciascuna delle classi

1 , 2 . k

-La frequenza è il numero di volte che la modalità di un carttere assume lo stesso valore. k

k n → N = ∑ n = n

Frequenze assolute { con il numero di tipologie ,classi , di frequenze distinte } j j

j=1

k

N = ∑ n = n

Frequenze assolute cumulate j

j=1 k

n

f = → ∑ f =1

j

Frequenze relative j j

n j=1

k

F = ∑ f =1

Frequenze relative cumulate j

j=1

p = f ∙ 100 → ∑ p =100

Frequenze percentuali j j j

1 k

Frequenze percentuali cumulate P = ∑ p =100

j

j=1 /

= n [ c - c ]

Istogrammi per caratteri quantitativi continui Densità di frequenza in ordinata j j+1 j

c - c ]

-Base del rettangolo = Ampiezza della classe in ascissa =[ j+1 j

/

n c - c ] c - c ]

-Altezza del rettangolo = Densità di frequenza in ordinata = [ Ampiezza della classe in ascissa =[

j j+1 j j+1 j

[ INDICE STATISTICO DI POSIZIONE ]

Media aritmetica di una distribuzione unitaria 1

μ = ∙ ∑ x i

n

n =

[ il numero totale di elementi della popolazione ] i=1

x =

[ la modalità del carattere di ciascun elemento della popolazione ]

i

[ INDICE STATISTICO DI POSIZIONE ]

Media campionaria 1

x= ∙ ∑ x i

n

n =

[ il numero totale di elementi del campione della popolazione ] i=1

x =

[ la modalità del carattere di ciascun elemento del campione della popolazione ]

i

[ INDICE STATISTICO DI POSIZIONE ]

Media della distribuzione della media campionaria k

x = μ = ∑ x ∙ f ( x )

[ la media di ciascuno dei campioni estratti dalla popolazione ]

i x i i

j=1

f(x )

[ = la frequenza delle medie dei campioni estratte dalla popolazione ]

i

Numero delle classi ( Metodo empirico per stabilire il Numero di classi )

n = N =  n

[ il numero totale di elementi della popolazione ] c

2

Valore centrale di una classe

c = c = ( c + c ) / 2

[ valore minimo della classe ]

j min j j min jmax

c =

[ valore massimo della classe ]

jmax

[ INDICE STATISTICO DI POSIZIONE ] k

k

k 1

μ = ∑ n ∙ c / ∑ n = ∙ ∑ n ∙ c

Media aritmetica di una distribuzione di frequenza con classi di valori j j j j j

n j=1

j=1

j=1

n =

[ il numero totale di elementi della popolazione ]

n

[ = è la frequenza assoluta del numero di elementi che hanno la stessa modalità o classe di modalità

j

del carattere ]

c

[ = valore centrale della classe , con carattere x ]

j j

[ INDICE STATISTICO DI POSIZIONE ] n

Media aritmetica ponderata /

∙ p p

∑ x ∑

x = j j

j

a

x =

[ la modalità del carattere di ciascun elemento della popolazione ]

i i=1

p

[ = è il peso di ciascun carttere ] , con pesi [ p ] non negativi.

i

Proprietà rilevanti della media Aritmetica n

-La somma degli scarti dalla media aritmetica è =0 ∑ ( xi - μ ) =0

c = μ i=1

-La somma del quadrato degli scarti da una costante c è minima quando n

-La media aritmetica è compresa tra il più piccolo e il più grande dei dati osservati 2

∑ ( xi - c ) =min c= μ

-Il valore medio moltiplicato per il numero di unità è = alla somma dei valori osservati i=1

-La media aritmetica risente fortemente dei valori estremi

[ INDICE STATISTICO DI POSIZIONE ]

Media geometrica su una distribuzione unitaria  x .......⋅x

⋅x

x = n

g 1 2 n

x =

[ la modalità del carattere di ciascun elemento della popolazione ]

i 3

[ INDICE STATISTICO DI POSIZIONE ]

Media geometrica su una distribuzione di frequenze n √ 1n1 2n2 knk

x = x ∙x ........∙x

g

n

[ = è la frequenza assoluta del numero di elementi che hanno la stessa modalità o classe di modalità

j

del carattere ]

[ INDICE STATISTICO DI POSIZIONE ]

Media geometrica su una distribuzione di frequenze relative 1f1 2f2 kfk

x = x ∙x ........∙x

g

f =

[ alla frequenza relativa degli elementi che hanno la stessa modalità o classe di modalità del

k

carattere ] Dopo aver ordinato in senso non decrescente i cartteri

[ INDICE STATISTICO DI POSIZIONE ]

Mediana , di una distribuzione unitaria , è un indice di posizione che occupa la posizione centrale di si trova il : Rango Me = ( n+1 ) /2 →

n

un insieme di unità statistiche ordinate : se è dispari il rango si calcola come : = x

La mediana è il carattere corrispondente M (n+1)/2

e

Dopo aver ordinato in senso non decrescente i cartteri

[ INDICE STATISTICO DI POSIZIONE ] si trova il : Rango Me =[ n/2 +( n 2+1 )] /2 →

Mediana , di una distribuzione unitaria , è un indice di posizione che occupa la posizione centrale di

n

un insieme di unità statistiche ordinate : se è pari il rango si calcola come : La mediana è il carattere corrispondente a :

x x

M = [ + ] / 2

n/2 (n/2+1)

e

[ INDICE STATISTICO DI POSIZIONE ] Dopo aver cumulato le frequenze si trova il rango della

mediana che è : Rango Me = ( N+1 ) /2.

Mediana di una distribuzione di frequenza assoluta , è un indice di posizione: che occupa la posizione

centrale della distribuzione di frequenza. Calcolate le x

La mediana M = è contenuta nella frequenza assoluta

(N+1)/2

e

frequenze cumulate ,se le unità statistiche sono dispari il rango si calcola come : cumulata corrispondente

4 Dopo aver cumulato le frequenze si trova il rango della

[ INDICE STATISTICO DI POSIZIONE ] ( N+1 ) /2

mediana corrispondente a: Rango Me = .

(N+1)

Mediana di una distribuzione di frequenza assoluta , è un indice di posizione: che occupa la posizione ( N /2+1 ) /2

Rango Me =

( N /2+1 )

centrale della distribuzione di frequenza. Calcolate le La mediana è la somma delle mediane contenute nella

frequenze cumulate ,se le unità statistiche sono pari il rango si calcola come : frequenza corrispondente divisa per 2

( n+1 ) /2

Rango Me = è individuato sulla frequenza relativa

[ INDICE STATISTICO DI POSIZIONE ] F ≥ 0,5 .

cumulata tale che per definizione

j

Mediana di una distribuzione di frequenza relativa ( per caratteri qualitativi ordinati ), è un indice Per definizione la mediana è il carattere corrispondente alla

di posizione: calcolate le frequenze relative cumulate ,la mediana è individuata dalla colonna della F ≥ 0,5

frequenza relativa cumulata .

frequenza relativa che contiene la frequenza relativa cumulata F > 0,5 j

J

[ INDICE STATISTICO DI POSIZIONE ] Rango Me = ( n+1 ) /2 è individuato sulla frequenza relativa

tale che F ≥ 0,5

cumulata per definizione.

Mediana di una distribuzione di frequenza con classi di valori , è un indice di posizione: ordinate le j

classi e calcolate le frequenze relative cumulate ,se le unità statistiche sono dispari il rango si calcola Il valore della mediana è contenuta nella classe corrispondente

al valore più vicino a F = 0,5 ma maggiore di 0,5 .

come : [ Il significato dei termini è il seguente ] : j

La mediana si calcola con la seguente relazione :

I = Estremo inferiore della classe

m Me I + [ ( 0,5 – F ) / ( F -F )] ∙ Δ

- =

Δ = Intervallo della classe m m-1 m m-1 m

m

F = Valore della frequenza che precede la frequenza che individua la Mediana

m-1

F = Valore della frequenza che individua la Mediana

m 5

[ INDICE STATISTICO DI POSIZIONE ] Rango Me = ( n+1 ) /2 è individuato sulla frequenza relativa

tale che F ≥ 0,5

cumulata per definizione.

Mediana di una distribuzione di frequenza con classi di valori , è un indice di posizione: ordinate le j

classi e calcolate le frequenze relative cumulate ,se le unità statistiche sono pari il rango si calcola come Il valore della mediana è contenuta nella classe corrispondente

al valore più vicino a F = 0,5 ma maggiore di 0,5 .

: [ Il significato dei termini è il seguente ] : j

La mediana si calcola con la seguente relazione :

I = Estremo inferiore della classe

m Me I + [ ( 0,5 – F ) / ( F -F )] ∙ Δ

- =

Δ = Intervallo della classe m m-1 m m-1 m

m Nota : Il rango ( n/2 +1 )/2 per una classe coincide di solito con il

F = Valore della frequenza che precede la frequenza che individua la Mediana

m-1 rango ( n+1 ) /2 per cui alla fine non cambia nulla nel calcolo. Se

F = Valore della frequenza che individua la Mediana

m dovesse cambiare la classe bisogna fare la media

Dopo aver ordinato in senso non decrescente gli n caratteri si

[ INDICE STATISTICO DI POSIZIONE ] k = ∙ n

calcola il prodotto 0,25

Il primo quartile Q ,di una distribuzione unitari ,è un indice di posizione:ed è un valore tale che il k

1 Se non è un numero intero si arrotonda all'intero successivo

25 % dei dati ordinati è minore o uguale a Q . .

1

Il primo quartile Q è detto anche 25-esimo percentile.

1 Questo intero identifica la posizione e il valore dei dati

ordinati , e quindi il valore del primo Quartile .

La formula accanto vale sia se il numero dei cartteri è pari che dispari k

Se è un numero intero , la posizione del quartile è

individuata dalla posizione del k-esimo e del ( k+1)-esimo

valore .

Il valore del primo quartile è la semisomma del valore

corrispondente alla k-esima e (k+1)-esima posizione

naturalmente diviso 2 .

6 Dopo aver ordinato in senso non decrescente gli n caratteri si

[ INDICE STATISTICO DI POSIZIONE ] k = 0,50∙ n

calcola il prodotto

Il secondo quartile Q ,di una distribuzione unitari ,è un indice di posizione:ed è un valore tale che k

2 Se non è un numero intero si arrotonda all'intero successivo

il 50 % dei dati ordinati è minore o uguale a Q . .

2

Il secondo quartile Q è detto anche 50-esimo percentile o mediana .

2 Questo intero identifica la posizione e il valore dei dati

ordinati , e quindi il valore del secondo Quartile .

La formula accanto vale sia se il numero dei cartteri è pari che dispari k

Se è un numero intero , la posizione del quartile è

individuata dalla posizione del k-esimo e del ( k+1)-esimo

valore .

Il valore del secondo quartile è la semisomma del valore

corrispondente alla k-esima e (k+1)-esima posizione

naturalmente diviso 2 .

Dopo aver ordinato in senso non decrescente gli n caratteri si

[ INDICE STATISTICO DI POSIZIONE ] k = 0,75∙ n

calcola il prodotto

Il terzo quartile Q ,di una distribuzione unitari ,è un indice di posizione:ed è un valore tale che il k

3 Se non è un numero intero si arrotonda all'intero successivo

75 % dei dati ordinati è minore o uguale a Q . .

3

Il terzo quartile Q è detto anche 75-esimo percentile.

3 Questo intero identifica la posizione e il valore dei dati

ordinati , e quindi il valore del terzo Quartile .

La formula accanto vale sia se il numero dei cartteri è pari che dispari k

Se è un numero intero , la posizione del quartile è

individuata dalla posizione del k-esimo e del ( k+1)-esimo

valore .

Il valore del terzo quartile è la semisomma del valore

corrispondente alla k-esima e (k+1)-esima posizione

naturalmente diviso 2 .

7 Per il calcolo del primo quartile si ordinano le classi.

[ INDICE STATISTICO DI POSIZIONE ] Si calcolano poi le frequenze assolute cumulate e

Calcolo del primo Quartile Q ,per una distribuzione in classi , ordinate le classi , il primo Quartile è

1 successivamente la frequenze relative cumulate .

un valore ,dellerequenze cumulate , tale che il 25 % dei dati ordinati è < a Q 1 Il valore del primo Quartile Q è quello che ha una frequenza

I = Estremo inferiore della classe 1

Q1 F

cumulata relativa che più si avvicina al valore = 0,25

j

Δ = Intervallo della classe

Q1 Il valore del quartile si calcola con la seguente relazione :

F = Valore della frequenza che precede la frequenza che individua la Mediana

-1

Q1 I + F F - F Δ

Q = [ ( 0,25 - ) / ( ) ] ∙

F = Valore della frequenza che individua la Mediana Q1 Q1-1 Q1 Q1-1 Q1

1

Q1 Per il calcolo del terzo quartile si ordinano le classi.

[ INDICE STATISTICO DI POSIZIONE ] Si calcolano poi le frequenze assolute cumulate e

Calcolo del terzo Quartile Q ,per una distribuzione in classi , ordinate le classi , il terzo Quartile è

3 successivamente la frequenze relative cumulate .

un valore ,delle frequenze cumulate , tale che il 75 % dei dati ordinati è < a Q 3 Il valore del terzo Quartile Q è quello che ha una frequenza

I = Estremo inferiore della classe 3

Q3 F

cumulata relativa che più si avvicina al valore = 0,75

j

Δ = Intervallo della classe

Q3 Il valore del quartile si calcola con la seguente relazione :

F = Valore della frequenza che precede la frequenza che individua la Mediana

-1

Q3 Q I F F - F Δ

= + [ ( 0,75 - ) / ( ) ] ∙

F = Valore della frequenza che individua la Mediana 3 Q3 Q3-1 Q3 Q3-1 Q3

Q3 La moda è la modalità del carattere che si ripete piu volte

[ INDICE STATISTICO DI POSIZIONE ]

La moda di una distribuzione unitaria

[ INDICE STATISTICO DI POSIZIONE ] La moda è la modalità che ha la frequenza più alta

La moda di una distribuzione di frequenza di un carattere qualitativo ordinato 8 a

Per prima cosa si calcola l'ampiezza della classe Poi si

[ INDICE STATISTICO DI POSIZIONE ] j .

calcola la densità di frequenza come rapporto tra intensità

La moda di una distribuzione di frequenza con classi di valori h n / a

assoluta / ampiezza della classe ovvero =

j j j .

La moda corrisponde alla densità di frequenza più alta .

| |

Quantitativo Qualitativo ordinato Qualitativo sconnesso

[ INDICE STATISTICO DI POSIZIONE ] Si

Media Si Si

Mediana Si Si Si

Moda

[ INDICI DI VARIABILITÀ ]

Dato un insieme di unità statistiche è ordinate in modo non decrescente definiamo come : x -x

-Range o Range =

campo di variazione : max min

-Differenza interquartile è definita come : dQ = Q -Q

n n-1

[ INDICI DI VARIABILITÀ ] n

1

μ ∑ x

Dato un insieme n di unità statistiche è definita la media come : = n i

i=1

Definiamo lo scarto dalla media come : s = x - μ

i

[ INDICI DI VARIABILITÀ ] 1

2

La varianza σ di una distribuzione unitaria di un popolazione è definita come la somma del quadrato n

2 2 2

σ ∑ ( x -μ) σ > 0

= ∙ →

degli scarti divisa per il numero totale degli elementi della popolazione . n i

2

σ

Se la varianza è piccola, c'è un'alta probabilità di ottenere valori della variabile aleatoria vicini al valor i=1

2

σ

medio; se invece è grande, c'è una maggior probabilità di ottenere valori lontani dal valor medio.

La varianza è un indice si dice di dispersione dalla media come misura anche la dispersione di una

distribuzione di probabilità 9

[ INDICI DI VARIABILITÀ ] x ∙n

Per primo si calcola il totale delle unità statistiche j j

k

σ 2

La varianza di una distribuzione di frequenza ( nel caso in cui le unità statistiche siano raggruppate 1

μ= ∙ ∑ x ∙n

Poi ci calcoliamo la media come j j

per frequenze assolute ) . n

k j=1

ed infine la varianza

x

Le unità statistiche sono indicate j k

1

2 2

σ = ∙ ∑ ( x - μ ) ∙ n

n j j

Le frequenze assolute sono indicate con n

j j=1

INDICI DI VARIABILITÀ ] c

Per primo calcoliamo il valore centrale di ogni classe j

σ 2

La varianza di una distribuzione in classi ( nel caso in cui le unità statistiche siano raggruppate in n ∙c

Per secondo ci si calcola il totale delle unità statistiche

classi ) . j j

k

1

x

Le classi sono indicate con μ= ∙ ∑ c ∙n

Poi ci calcoliamo la media come

j j j

n

k

c

Il valore centrale della classe è indicato con j=1

j ed infine la varianza

n

Le frequenze assolute sono indicate con j k

1

2 2

σ = ∙ ∑ ( c - μ ) ∙ n

j j

n

[ INDICI DI VARIABILITÀ ] n

∑ μ 2

Dev ( x) = ( x - )

La devianza è il numeratore della varianza i

i=1

[ INDICI DI VARIABILITÀ ] n

La deviazione standard (o scarto quadratico medio) è la radice quadrata della varianza √ ∑

σ = (1/n) μ 2

( x - )

1

i=1

10

[ INDICI DI VARIABILITÀ ]

Il coefficiente di variazione CV è il rapporto tra la deviazione standard e la media moltiplicato per 100 μ

CV = ( σ / ) ∙100 → x > 0

La varianza di un carattere Y ottenuto dalla trasformazione

Y = α x + β α σ

2 2

Var ( Y ) = ∙

2

x μ σ

di un carattere con media e varianza è:

[ BOX PLOT ]

In statistica il box-plot, detto anche box and whiskers plot (diagramma a scatola e baffi) o semplicemente

boxplot, è una rappresentazione grafica utilizzata per descrivere la distribuzione di un campione tramite

semplici indici di dispersione e di posizione.

Viene rappresentato (orientato orizzontalmente o verticalmente) tramite un rettangolo diviso in due parti,

da cui esc

Anteprima
Vedrai una selezione di 10 pagine su 88
Statistica - formule Pag. 1 Statistica - formule Pag. 2
Anteprima di 10 pagg. su 88.
Scarica il documento per vederlo tutto.
Statistica - formule Pag. 6
Anteprima di 10 pagg. su 88.
Scarica il documento per vederlo tutto.
Statistica - formule Pag. 11
Anteprima di 10 pagg. su 88.
Scarica il documento per vederlo tutto.
Statistica - formule Pag. 16
Anteprima di 10 pagg. su 88.
Scarica il documento per vederlo tutto.
Statistica - formule Pag. 21
Anteprima di 10 pagg. su 88.
Scarica il documento per vederlo tutto.
Statistica - formule Pag. 26
Anteprima di 10 pagg. su 88.
Scarica il documento per vederlo tutto.
Statistica - formule Pag. 31
Anteprima di 10 pagg. su 88.
Scarica il documento per vederlo tutto.
Statistica - formule Pag. 36
Anteprima di 10 pagg. su 88.
Scarica il documento per vederlo tutto.
Statistica - formule Pag. 41
1 su 88
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher cilli92 di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi della Tuscia o del prof Laureti Tiziana.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community