vuoi
o PayPal
tutte le volte che vuoi
Medie Statistiche
Media Aritmetica Ponderata: ∑ ⋅wxj / ∑ wj
Media Quadratica: √ (1/N) ∑ xi2
Media Quadratica Ponderata: √ (∑ wj ⋅ xj2) / (∑ wj)
Media Geometrica: √ (∏ xi)
Media Geometrica Ponderata: √ (∏ wj ⋅ xj) / (∑ wj)
Sintesi medie analitiche: μr = (1/k) ∑ r ⋅ wxri / ∑ wir
Medie di Posizione: per caratteri quantitativi e...
Per caratteri qualitativi nominali (o sconnessi):
- modalità che si osserva con maggiore frequenza
- se la frequenza maggiore è posseduta da due o più modalità del carattere, allora la moda non esiste
Per caratteri quantitativi discreti o qualitativi ordinati:
- non può trovarsi all'inizio o al termine della distribuzione
- è data da ogni valore/modalità interno all'intervallo, tale che n > n-1 + 1
Per caratteri quantitativi continui o discreti divisi in classi:
Classi di uguale ampiezza: è il valore centrale della classe che soddisfa n > n-1 + 1
Classi di diversa ampiezza: è il valore centrale della classe che soddisfa h > h-1 + 1
Classe modale: classe che soddisfa le condizioni sopra esposte
Mediana:
- rappresenta il valore centrale della distribuzione quando i dati sono ordinati
- per caratteri quantitativi o qualitativi ordinali
statistica resistenze: non influenzata dai valori estremi della distribuzione
Come determinare la mediana (Me):
- ordinare i valori in modo non decrescente = xM
- se N è dispari: (N + 1)/2 = x(M)
- se N è pari: (N/2) + 1 = M e (N/2) = M
Mediana per distribuzioni di frequenza di caratteri quantitativi suddivisi in classi:
0.5 - F(m-1) ⋅ (xM) + (M Δ)
Percentili: quei valori che dividono la distribuzione in cento parti di uguale numerosità.
Quantili: è quel valore del carattere x che suddivide la distribuzione in due parti, lasciando a sinistra una frazione q delle osservazioni e a destra il restante 1 - q, con q 0,1. Per la risoluzione si utilizzano le stesse tecniche viste per la mediana (dove m diventa q).
Variabilità: è l'attitudine delle variabili ad assumere differenti modalità. Solo per variabili quantitative (in questo corso).
Deviazione Standard: l'indice di
variabilità da associare alla media aritmetica√ N1 ∑ 2
Per distribuzioni semplici: ( )= −μσ xiN i=1 √ N1 ∑ 2
Per distribuzioni di frequenza: ( ) ⋅= −μσ x ni iN i=1√ N∑ 2
Per frequenze relative: ( ) ⋅= −μσ x fi ii=1
Varianza- è la media degli scarti al quadrato della media aritmetica
N N N1 1∑ ∑ ∑2 2 2 2 2 2( ) ( ) ( )⋅n ⋅f= −μ = −μ = −μσ x σ x σ xi i i i iN N=1i i=1 i=1
Devianza- numeratore della varianza
N∑ 2( )DEV = ⋅n−μx i ii=1
(altre formule)√ DEV√ 2= =σ σ NN1 ∑2 2 2= −μσ x iN =1i
Coefficiente di variazione- utile per confrontare due o più distribuzioni- misura relativa: grandezza adimensionale
σ=CV- | |μ
Teorema di Chebyshev- utile per conoscere quanti elementi della distribuzione stanno entrok(k > 1) errori standard dalla media, cioè quanti
Gli elementi sono μ−kσ ≤ x ≤ μ+kσ contenuti nell'intervallo [i- perde la sua utilità se già conosco la distribuzione del carattere X.
Enunciato: data una distribuzione di valori dei quali si conoscono solo la media μ e la deviazione standard σ e dato un valore reale positivo k, possiamo affermare che:
- (| | ) −μ ≤ f(x) ≥ kσ ≤ i 2k
Dove con f si intende la frequenza relativa dei valori del carattere X che soddisfano la disuguaglianza all'interno delle parentesi.
Distribuzioni doppie - sono tabelle di frequenze a doppia entrata che riportano le frequenze congiunte (fij), ovvero le frequenze assolute delle unità che presentano contemporaneamente la modalità della variabile riga (X) e la modalità della variabile colonna (Y).
fn = distribuzione marginale di X
fn = distribuzione marginale di Y
fj| = distribuzione condizionata di X|Y = fij/fn
fj| = distribuzione condizionata di Y|X = fij/fn
Associazione e indipendenza tra due variabili
Analisi dell'associazione: studio della relazione tra due variabili
Indipendenza statistica: assenza di qualsiasi legame tra le due variabili
Dipendenza statistica: la conoscenza della modalità di una delle due variabili migliora la "previsione" della modalità dell'altra
Indipendenza statistica
- Le distribuzioni relative (o %) condizionate (di riga o di colonna) sono uguali tra loro (e uguali alla distribuzione relativa o % marginale).
- Se X è indipendente da Y allora Y è indipendente da X.
- n- : frequenza congiunta teoricaⅈj · nn? i . . j- =n ⅈj N
Associazione perfetta
Si divide in:
- Dipendenza perfetta
- Relazione unidirezionale (Y dipende da X ma non il viceversa)
- Interdipendenza perfetta
- Relazione bidirezionale (Y dipende da X e viceversa)
- Per ogni riga e per ogni colonna della tabella si deve avere una sola casella con frequenza non nulla
Quando due variabili non sono indipendenti, si può osservare un'associazione tra di loro.
Sono indipendenti, si può essere interessati a misurare il grado di associazione. Associazione tra due caratteri qualitativi - confronto le frequenze assolute osservate e le corrispondenti frequenze teoriche in caso di indipendenza.
¿=n −nc- Contingenze = ⅈij ij jH K∑ ∑- =0ciji=1 j=1
Indice Chi-Quadrato di Pearson
2¿( )−nH K n∑ ∑ ⅈij j2- =X ¿n=1i=1 j ⅈj ¿=nn- Vale 0 in caso di indipendenza ( per ogni casella dellaⅈij jtabella) c- Cresce all’aumentare di ij- Ammette solo un massimo relativo in funzione del collettivo (N) edel numero di righe (H) e colonne (K) delle due variabili:[ ]2 ( ) ( )⋅min=N −1X H−1 , Kmax
Indice contingenza quadratica media
2X2- ϕ = N [ ]2 ( ) ( )- ϕ =min −1H−1 , Kmax- non dipende da NH < K1. Se X dipende perfettamente da Y→2. Se H > K Y dipende perfettamente da X→3. Se H = K perfetta interdipendenza tra X e Y→
Indice V di Cramer
√ 2ϕ- =V 2ϕ max- non dipende da N1. Assume valori in un intervallo limitato: 0 V≤ ≤12. V = 0 indipendenza tra le due variabili→3. V = 1 associazione perfetta tra le due variabili→Associazione tra un carattere qualitativo e un carattere quantitativoSia X il carattere qualitativo e Y il carattere quantitativo:- Dipendenza in media: la conoscenza della modalità di X influiscesulla media della Y, con un livello di dipendenza più o meno forte- Indipendenza in media: tutte le medie condizionate di Y da Xsono uguali tra loro e uguali anche alla media di Y (noncondizionata)Medie condizionate:K1 ∑ ⅈ=1,= ,μ y n … , H∨X =Y x j ijni j=1i .Varianze condizionate:K1 ∑2 2( ) ⋅n ⅈ=1,= −μ ,σ y … , H∨ ∨ =xY X= x j Y X ijni ij=1i.- Dipendenza perfetta le varianze condizionate sono tutte pari a→0.- Indipendenza in media le medie condizionate di Y da X sono→uguali tra loro e uguali anche alla mediagenerale di Y. Inoltre anche le varianze condizionate risultano tutte uguali tra di loro e uguali alla varianza di Y. 2Scomposizione della varianza (varianza totale σY2 = σ+2 + σ-2) Media(σ(Y|X)) = σ+2 / n(Y|X) Media(Y|X) = Σi=1N (Yi|X=xi) indica la varianza delle medie condizionate di Y|X (varianza spiegata) 2Scomposizione della varianza (varianza totale σY2 = Media(σ(Y|X)) + Media(σ(Y|X))) indica la media delle varianze condizionate di Y|X (varianza residua) Rapporto di Correlazione - misura la parte di variabilità del carattere Y dovuta alla dipendenza (in media) di Y dal carattere X σY|X2 = ηY|X2 / ηX2 0 ≤ ρ ≤ 1 ηY|X2 = 1 → ρ = 1 ηY|X2 = 0 → ρ = 0 Associazione tra due caratteri quantitativi 1) Caso di dipendenza lineare