Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Statistica Descrittiva
Variabili Statistiche:
- Quantitative (Discrete o Continue)
- Qualitative (Ordinali o Nominali)
Questionario - Intervista strutturata
- Età: Quantitativa Discreta (anni interi continua)
- Genere: Qualitativa Discreta
- Ore di cui hai a disposizione: Quantitativa Continua
- Ore che dedichi allo studio: Quantitativa Continua
- Luogo dove studi: Qualitativa Nominale
- Mezzo con cui viaggi: Qualitativa Discreta
Sintesi delle variabili osservate mediante
- Tabelle (Distribuzioni di Frequenza)
- Semplice
- Doppia
- Rappresentazioni Grafiche
Frequenza
- Assoluta: Conteggio del numero di volte con cui una certa modalità si presenta
Frequenza Relativa:
- fi = mi / N
Frequenza Cumulata
Frequenza Relativa o Assoluta in quella modalità più quelle precedenti, quindi corrisponde alla somma delle frequenze di quella modalità e delle modalità che precedono quella.
Ampiezza Classi
Differenza fra l'estremo superiore di classe e l'estremo inferiore di classe
Operatore Sommatore
Σ = un modo di rappresentare la somma di tanti addendi
- N = Σ mi ; mi = m1 + m2 + ... + mk
Rappresentazioni Grafiche
- Variabili Qualitative
- Diagramma a Barre
- Diagramma a Torta
- Variabili Quantitative
- Istogramma
- Diagramma a Punti
Densità di Frequenza
di = mi / a
Variabili quantitativi discreti - Diagramma a punti
È possibile verificare anche in questo tipo di grafico forme di simmetria o asimmetria
Misure di sintesi
Misure di tendenza centrale
- Media (aritmetica) = X media campionaria / μ media di popolazione
- Mediana (n + 1 / n è la posizione della mediana)
- Moda
Media > Mediana = Asimmetria positiva
Media < Mediana = Asimmetria negativa
Media = Mediana = Simmetria
Range o campo di variazione
R = Xmax - Xmin
Varianza
σ2 varianza di popolazione / s2 varianza campionaria
- σ2= 1/N ∑(xi - μ)2
- s2= ∑(xi - x̄)2 / (m-1)
Deviazione standard
σ = √σ2 / s = √s2
Standardizzazione
Z = (Xi - μ) / σ
La differenza tra il valore effettivo (yi) e il valore teorico che si trova sulla retta di regressione (yi) si chiama errore o residuo.
(ȳ = ȳ)
(ȳ)
y
(y - ȳ)
- Devianza Totale
- Devianza Residua (o dell'Errore)
- Devianza di Regressione (o Spiegata)
In caso di assenza di correlazione lineare (pendenza nulla) la devianza di regressione (o spiegata) è nulla R = zero,
perciò la devianza totale è uguale alla devianza residua.
In caso di correlazione lineare perfetta (R = ± 1) non c'è devianza residua, infatti è uguale a zero,
perciò la devianza totale è uguale alla devianza di regressione.
Indice di determinazione lineare
R2 = Devianza di Regressione/Devianza Totale
Assume valore 1 in caso di correlazione lineare perfetta.
Assume valore zero in caso di assenza di correlazione lineare.
0 ≤ R2 ≤ 1
R2 = r2
Coefficiente di correlazione lineare
INDIPENDENZA IN MEDIA
DUE VARIABILI X E Y SONO INDIPENDENTI IN MEDIA (Y IN PARTICOLARE UNA VARIABILE Y QUANTITATIVA E INDIPENDENTE IN MEDIA DA X) SE TUTTE LE MEDIE (Y)-(CONDTIONATE(X AL Y) SONO UGUALI FRA LORO
SE HO INDIPENDENZA IN MEDIA NON NECESSARIAMENTE AVRO INDIPENDENZA STATISTICA
MA SE HO INDIPENDENZA STATISTICA HO INDIPENDENZA IN MEDIA
EVENTI DISGIUNTI E EVENTI INDIPENDENTI
SE DUE EVENTI SONO DISGIUNTI SONO FORTEMENTE DIPENDENTI QUINDI LA PROBABILITÀ CHE SI VERIFICHINO CONGIUNTAMENTE È ZERO
- P(E ∩ F) = 0
- P(E|F) = 0
- P(F|E) = 0
SE DUE EVENTI SONO INDIPENDENTI, LA PROBABILITÀ DI P(E ∩ F)
- P(E ∩ F) = P(E) · P(F)
- P(E|F) = P(E)
- P(F|E) = P(F)
Distribuzione campionaria della frequenza relativa (o proporzione)
La proporzione di unità statistiche che nella popolazione presentano una certa caratteristica (parametro π)
Statistica campionaria: Proporzione di unità con certe caratteristiche nel campione (P)
- π media: valore del campione selezionato
Formula
- Proporzione di occupati: π = 2/3 (0,67)
- Proporzione di non occupati: (1 - π) = 1/3 (0,33)
m = 3
010001011101227381227Distribuzione campionaria della proporzioneMP=2/3=(1,67)P P(P)
- Si può utilizzare l'approssimazione normale quando il prodotto fra la dimensione del campione e la proporzione ed il suo complemento sia maggiore o uguale a 10
mπ(1-π) >= 10
Osservazione al contrario
Fissato il margine di errore E e il livello di confidenza per capire quanto dovrebbe essere il campione (m) per garantire l'uguaglianza
E = Zα/2. √ [(P (1-P)) / m]
E = 0.03
(1 - α) = 0.95 → zα/2 = 1.96
Quindi
m = [(Zα/2)² . P (1-P)] / E²
P = non sarebbe nota quindi cosa faremmo? Ci mettiamo nella situazione "peggiore" possibile e si pone P = 0.5
m = [(1.96)² . 0.25] / 0.03² = 1067.1112 si approssima a 1068
Lo possiamo fare anche per l'intervallo di confidenza della media
m = [(Zα/2)² . σ²] / E²
con deviazione standard nota
(Bisogna sostituire qualcosa a ; ma non esiste una regola generale come con la proporzione)
Esempio di test bilaterale
Spese medie mensili per telefonia mobile
M = 50,64
σ = 12
n = 12
z = 1,96
t = 2,69
x = 65,014
α = 0,05
H0 = 50,64
Z = 60,014 - 50,6418,49 /√122,69Rifiuto l'ipotesi nulla
Approccio del P-value:
Area a destra di 2,69 = 0,0036
Area a sinistra -2,69 = 0,0036
Percentuale molto bassa = quindi rifiutol'ipotesi nulla
Collegamento con costruzione di un intervallo diconfidenza per M:
n-1=12-1=11
z = 1,96
t11(0.025)=2,201
x = 65,014
α = 0,05 (1-α = 0,95)
65,014 - 1,96 18,49√1259,5523 Limite inferiore65,014 + 2,201 18,49√1270,4757 Limite superioreNon potremmo utilizzare l'intervallo di confidenza per “effettuareuna verifica di ipotesi.Posso confrontare un'ipotesi nulla con i valori plausibili:H0 : μ = 50,64
(59,5523 70,4757)L'ipotesi nulla non E' compresa nell'intervallo quindi rifiutol'ipotesi nulla
Ovviamente questo collegamento tra intervallo di confidenzae verifica di ipotesi non vale per test unilaterali