Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
FORMULE STATISTICHE
Freq. assoluta:
Freq. relativa:
Freq. cumulata o retrocumulata:
media aritmetica: 𝖵 = i=1k (xj x µi )
oppure xj = i=1n (xj x pj)
se sono raggruppati in classi
𝖵 = i=1k (xj x µi)
quartili Qx X (n+1)
Mediana ( n+1 ) = ¶ n 2 = ¶
range xmax - xmin
varianza: 𝖤2 = j=1n 𝑫 = j=1 (xi - µj) h
scarto quadratico S = hn+1 i=1(xj - xi)
cio devazione STD 𝜎 = 2 √(S2)
Var coeff:
C(v) (CV) = ( S / x ) x 100
DISTRIBUZIONE NORMALE STD
Z = X - µ
σ
DISTRIBUZIONE UNIFORME Pr (X = x)
DISTRIBUZIONE DI BERNOULLI (dicotomica)
p(1-p) x k
DISTRIBUZIONE BINOMIALE Pr (X = x) = (n / x)
p(1-p) n-x x
DISTRIBUZIONE DI POISSON
Pr (X = x) = e1λ
K e-λ x
x!
Intervallo di confidenza (α nota)
per la media µ
X ± 2zα σ
‣n
Intervallo di confidenza (σ incognita) per la media µ
t = ( X − µ / x/‣n)
t (con n-1 grd.l)
Intervallo di confidenza per la p
proporzione
p± = zα
p(1-p)
p = x /n
≈ πA -πC = (πA+πC)
± 2zα
(√α,β) 𝖪
Test Z per la media (σ nota)
Z = X - µ
∂/&sqrt;n
Test t per la media (σ non nota)
t =( X - µ ) S√n )
Test Z per le proporzioni
Z = (p) (P)
√((1-τ) / n )
Test a due campioni
test per le medie
Z = (X̄1 - X̄2) - (μ1 - μ2)
-medie
σ1, σ2 note
C12 / n1 C22 / n2
t = (X̄1 - X̄2) - (μ1 - μ2) con variabili sconosciute
Sp2 = (n1-1)S1 + (n2-1)S2 / (n1-1) + (n2-1)
IC: < X1 + X2 ± tα/2 ; Sp2(1/n1 + 1/n2 )
e.g. t(μ1 = μ2) GDL
Confronto proporzioni
Z = (P1 - P2) - (Π1 - Π2)
p1 - X̄; p2 X̄2 / n2
P- = X̄1 + X̄2 / n1 + n2
IC ± (P1 - P2)
P4(1/n1 + 1/n2 )
R(1-PA) - P(1-P) PO(1-P0 )
Confronto varianze
Test F i.e., S12
n1 - 1 GDL Fi-1
n2 - 1 GDL F1 = 1/Fa
S2 = 1/nm-1 Σ(y-g)2
ANOVA
SST = SSA = SSW =
F = SSA + SSW
HMT = SST / n - 1 F = MSA / MSW
HSA = SSW / n - q
c = c-1 R(SSA) ANSDen
Tukey-Cramer
RC = Qui = 1 - 1 / nj / ni
MSW / 2
Q = (Ȳj - Ȳn + MJ - M4)
HSW / 2 = nJ + 1 / nM+2
GDL / nk+1
Chi Quad
χ2 = Σ ((⍴i - ⍴e)2 / ⍴e) freqlocale
TɪA-TɪB
Indipendenza
χ2 = Σ ((ϕo - ϕe)2 / ϕe)
Expected: (Er total rig x Tukhodi colonna N)
(4.4) Costruire un intervallo di confidenza a livello (1-α)=95% della differenza della proporzione di consumatori complessivamente soddisfatti (c1 - πA - πC). Si commentino i risultati, in particolar modo con riferimento al punto (4.3).
ICC95(πA - πC) = (pA - pC) ± zα/2 √((pA(1 - pA) / nA) + (pC(1 - pC) / nC)).
Commenti:
- All’interno dell’intervallo di confidenza non è contenuto lo zero, quindi si può rifiutare l'ipotesi nulla, concludendo che ci sia una differenza tra le due proporzioni (πA - πC).
- Allo stato attuale, la proporzione di clienti soddisfatti in A è comunque significativamente migliore rispetto a C.
(5.1) Per meglio veicolare la futura comunicazione pubblicitaria, è importante poter identificare eventuali caratteristiche individuali dei consumatori legate alla soddisfazione del prodotto. Un aspetto potenzialmente legato alla soddisfazione è la lunghezza della barba (1=corta, 2=folta, 3=lungo, 4=molto lunga). Commentare i seguenti diagrammi a torta in cui viene riportata la soddisfazione complessiva in funzione della lunghezza della barba:
- Dal momento che la PROP di clienti soddisfatti tende a diminuire all’aumentare della lunghezza semberebbe ci possa essere un legame inverso tra lunghezza e soddisfazione.
- Osservando visivamente non ci sono tendenze chiare.
(5.2) Dopo aver completato la tabella di contingenza usando le frequenze assolute riportate nei diagrammi a torta, applicare una procedura inferenziale (indicando sistema di ipotesi e statistica test) finalizzata a stabilire se vi è un’associazione significativa (α=0,01), tra soddisfazione complessiva e lunghezza della barba. Commentare i risultati ottenuti.
Soddisfazione complessiva1234 2122171 Commenti:- Al livello di significatività ha poco peso χ2calcolato = 23,423.
- Crediamo che non ci sia sufficiente evidenza.
- Per stabilire se la proporzione di consumatori soddisfatti é o meno la stessa rispetto alla lunghezza barba, si dovrebbe utilizzare
La stessa procedura applicata al punto (5.1); B Il test χ2; C Il test F-ANOVA.
(6.1) Il seguente diagramma di dispersione rappresenta la soddisfazione globale (analizzata in precedenza negli esercizi (4.1) e (4.2)) in funzione dell’età del consumatore. Commentare il grafico alla luce degli obiettivi dello studio.
- Ipotizziamo un legame debole, da confermare con ipotesi e test specifici.
Y2 = 0,211 + 0,011X; Y, con X Età del consumatore.
(5.4) Completare la tabella dell'analisi della varianza e condurre una verifica di ipotesi a livello di signf. α=0,01, specificando le due ipotesi
H0:β1=0 H1:β1≠0
Per verificare se sussiste una relazione lineare significativa tra età e soddisfazione globale.
ANALISI VARIANZA
- Regressione 61 F0,01
- Residuo N-1-2 8,96
- Totale 449 Ha
Commenti:
Perché Foss > Fe allora rifiuto H0 quindi affermo che c’è una relazione.
(5.11) Il valore osservato della statistica test Foss si trova nell’intervallo
- A) Foss∈ [5;10]
- B) Foss∈ [10;50]
- C) X
Foss∉ [50;+∞)
(7) Fissato α=0,01, quale affermazione è FALSA?
- A) ∃ esiste una relazione lineare diretta tra età e soddisfazione globale
- B) L'età è un aspetto del consumatore legato alla soddisfazione;
- C) L’età è l’unico aspetto del consumatore legato alla soddisfazione
(5.5) Dopo aver fornito la definizione di residuo, commenta il seguente output:
residuo = somma dell'errore da campionamento cause
(8) Con riferimento al termine di errore casuale e del modello di regressione e del relativo residuo, quale affermazione è vera?
- A) E ed e possono coincidere;
- B) E è concettualmente collegato ad e;
- C) E è concettualmente indipendente da e.
(5.12) Con riferimento al punto (5.5), quale affermazione è vera? L’assunzione sul termine di errore è decisamente non supportata e
- A) l’indipendenza;
- B) la normalità;
- C) l'eteroschedasticità.
(6) Indicare la risposta corretta alle seguenti affermazioni, indicando unicamente una tra le tre possibili scelte.
- L'asimmetria di una distribuzione di frequenza può essere definita per quale dei seguenti tipi di variabili?
- A) Categoriale nominale; B) Dicotomica/binaria; C) ❑ numerica.
- Quando ci sono due etichette (sì/no, presenza/assenza, ecc) utilizzati per identificare una caratteristica con due modalità/valori, si tratta di una variabile
- A) categoriale nominale; B) ❑ dicotomica/binaria; C) numerica.
- Il grafico appropriato per rappresentare la frequenza delle modalità/categorie di una variabile qualitativa nominale è
- A) il biplot; B) il diagramma di dispersione; C) ❑ il diagramma a torta.
- Dopo aver ordinato in modo crescente un insieme di valori numerici, 1° quartile è il valore che ripartisce la serie ordinata n-1 parti con
- A) pari numerosità; B) ❑ ¼ di numerosità a sin. e ¾ a destra; C)❑ ½ di numerosità a sin. e ½ a destra.
- [13] Dati n valori numerici, nel calcolo della varianza campionaria il valore da porre al denominatore è
- A) n; B) ❑ n-1; C) 1/(n-1).
- [14] Se un campione di numerosità n viene estratto da una popolazione non normale ma simmetrica, si può affermare che la sua
- A) distribuzione campionaria; B) media campionaria; C) ❑ varianza campionaria distribuita anch’essa normale, per una dimensione della numerosità n>10.
- [15] Poste due ipotesi nulle su vera, la probabilità con cui un ricercatore conclude correttamente che la differenza osservata tra le statistiche campionaria e il parametro della popolazione è dovuta al caso (non è significativa), è un concetto di...
- A) Il livello di significatività del test; B) Il livello di confidenza; C) ❑ Potenza del test statistico.
- [16] Nella scomposizione della somma dei quadrati del test F, Q campioni, la quantità SST si riferisce alla varianza
- A) attribuibile alla differenza delle media y gruppo; B) complessiva della risposta numerica;C) ❑ del errore casuale.
- Nella verifica di ipotesi per il confronto delle proporzioni di 2 popolazioni, se è vera l’ipotesi nulla la statistica test Z è in media pari a
- A) 0; B) ❑ 1;
- [18] Nell’ambito della regressione lineare multipla, la differenza tra il valore osservato della variabile dipendente e il valore previsto/stimato dal modello di regressione viene definita con il termine
- A) ❑ errore casuale; B) residuo C) scarto quadratic.