Anteprima
Vedrai una selezione di 6 pagine su 24
Esercizi di Statistica Pag. 1 Esercizi di Statistica Pag. 2
Anteprima di 6 pagg. su 24.
Scarica il documento per vederlo tutto.
Esercizi di Statistica Pag. 6
Anteprima di 6 pagg. su 24.
Scarica il documento per vederlo tutto.
Esercizi di Statistica Pag. 11
Anteprima di 6 pagg. su 24.
Scarica il documento per vederlo tutto.
Esercizi di Statistica Pag. 16
Anteprima di 6 pagg. su 24.
Scarica il documento per vederlo tutto.
Esercizi di Statistica Pag. 21
1 su 24
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

FORMULE STATISTICHE

Freq. assoluta:

Freq. relativa:

Freq. cumulata o retrocumulata:

media aritmetica: 𝖵 = i=1k (xj x µi )

oppure xj = i=1n (xj x pj)

se sono raggruppati in classi

𝖵 = i=1k (xj x µi)

quartili Qx X (n+1)

Mediana ( n+1 ) = ¶ n 2 = ¶

range xmax - xmin

varianza: 𝖤2 = j=1n 𝑫 = j=1 (xi - µj) h

scarto quadratico S = hn+1 i=1(xj - xi)

cio devazione STD 𝜎 = 2 √(S2)

Var coeff:

C(v) (CV) = ( S / x ) x 100

DISTRIBUZIONE NORMALE STD

Z = X - µ

σ

DISTRIBUZIONE UNIFORME Pr (X = x)

DISTRIBUZIONE DI BERNOULLI (dicotomica)

p(1-p) x k

DISTRIBUZIONE BINOMIALE Pr (X = x) = (n / x)

p(1-p) n-x x

DISTRIBUZIONE DI POISSON

Pr (X = x) = e1λ

K e-λ x

x!

Intervallo di confidenza (α nota)

per la media µ

X ± 2zα σ

‣n

Intervallo di confidenza (σ incognita) per la media µ

t = ( X − µ / x/‣n)

t (con n-1 grd.l)

Intervallo di confidenza per la p

proporzione

p± = zα

p(1-p)

p = x /n

≈ πAC = (πA+πC)

± 2zα

(√α,β) 𝖪

Test Z per la media (σ nota)

Z = X - µ

∂/&sqrt;n

Test t per la media (σ non nota)

t =( X - µ ) S√n )

Test Z per le proporzioni

Z = (p) (P)

√((1-τ) / n )

Test a due campioni

test per le medie

Z = (1 - X̄2) - (μ1 - μ2)

-medie

σ1, σ2 note

C12 / n1     C22 / n2

t = (1 - X̄2) - (μ1 - μ2) con variabili sconosciute

Sp2 = (n1-1)S1 + (n2-1)S2 / (n1-1) + (n2-1)

IC: < X1 + X2 ± tα/2 ; Sp2(1/n1 + 1/n2 )

e.g. t(μ1 = μ2) GDL

Confronto proporzioni

Z = (P1 - P2) - (Π1 - Π2)

p1 - X̄; p22 / n2

P- = X̄1 + X̄2 / n1 + n2

IC ± (P1 - P2)

P4(1/n1 + 1/n2 )

R(1-PA) - P(1-P)     PO(1-P0 )

Confronto varianze

Test F i.e., S12

n1 - 1 GDL   Fi-1

n2 - 1 GDL   F1 = 1/Fa

S2 = 1/nm-1 Σ(y-g)2

ANOVA

SST =    SSA =    SSW =

F = SSA + SSW

HMT = SST / n - 1   F = MSA / MSW

HSA = SSW / n - q

c = c-1 R(SSA) ANSDen

Tukey-Cramer

RC = Qui = 1 - 1 / nj / ni

MSW / 2

Q = (j - Ȳn + MJ - M4)

HSW / 2 = nJ + 1 / nM+2

GDL / nk+1

Chi Quad

χ2 = Σ ((⍴i - ⍴e)2 / ⍴e) freqlocale

TɪA-TɪB

Indipendenza

χ2 = Σ (o - ϕe)2 / ϕe)

Expected: (Er total rig x    Tukhodi colonna N)

(4.4) Costruire un intervallo di confidenza a livello (1-α)=95% della differenza della proporzione di consumatori complessivamente soddisfatti (c1 - πA - πC). Si commentino i risultati, in particolar modo con riferimento al punto (4.3).

ICC95A - πC) = (pA - pC) ± zα/2 √((pA(1 - pA) / nA) + (pC(1 - pC) / nC)).

Commenti:

  • All’interno dell’intervallo di confidenza non è contenuto lo zero, quindi si può rifiutare l'ipotesi nulla, concludendo che ci sia una differenza tra le due proporzioni (πA - πC).
  • Allo stato attuale, la proporzione di clienti soddisfatti in A è comunque significativamente migliore rispetto a C.

(5.1) Per meglio veicolare la futura comunicazione pubblicitaria, è importante poter identificare eventuali caratteristiche individuali dei consumatori legate alla soddisfazione del prodotto. Un aspetto potenzialmente legato alla soddisfazione è la lunghezza della barba (1=corta, 2=folta, 3=lungo, 4=molto lunga). Commentare i seguenti diagrammi a torta in cui viene riportata la soddisfazione complessiva in funzione della lunghezza della barba:

  • Dal momento che la PROP di clienti soddisfatti tende a diminuire all’aumentare della lunghezza semberebbe ci possa essere un legame inverso tra lunghezza e soddisfazione.
  • Osservando visivamente non ci sono tendenze chiare.

(5.2) Dopo aver completato la tabella di contingenza usando le frequenze assolute riportate nei diagrammi a torta, applicare una procedura inferenziale (indicando sistema di ipotesi e statistica test) finalizzata a stabilire se vi è un’associazione significativa (α=0,01), tra soddisfazione complessiva e lunghezza della barba. Commentare i risultati ottenuti.

Soddisfazione complessiva1234 2122171 Commenti:
  • Al livello di significatività ha poco peso χ2calcolato = 23,423.
  • Crediamo che non ci sia sufficiente evidenza.
  1. Per stabilire se la proporzione di consumatori soddisfatti é o meno la stessa rispetto alla lunghezza barba, si dovrebbe utilizzare

La stessa procedura applicata al punto (5.1); B Il test χ2; C Il test F-ANOVA.

(6.1) Il seguente diagramma di dispersione rappresenta la soddisfazione globale (analizzata in precedenza negli esercizi (4.1) e (4.2)) in funzione dell’età del consumatore. Commentare il grafico alla luce degli obiettivi dello studio.

  • Ipotizziamo un legame debole, da confermare con ipotesi e test specifici.

Y2 = 0,211 + 0,011X; Y, con X Età del consumatore.

(5.4) Completare la tabella dell'analisi della varianza e condurre una verifica di ipotesi a livello di signf. α=0,01, specificando le due ipotesi

H01=0 H11≠0

Per verificare se sussiste una relazione lineare significativa tra età e soddisfazione globale.

ANALISI VARIANZA

  • Regressione 61 F0,01
  • Residuo N-1-2 8,96
  • Totale 449 Ha

Commenti:

Perché Foss > Fe allora rifiuto H0 quindi affermo che c’è una relazione.

(5.11) Il valore osservato della statistica test Foss si trova nell’intervallo

  • A) Foss∈ [5;10]
  • B) Foss∈ [10;50]
  • C) X

Foss∉ [50;+∞)

(7) Fissato α=0,01, quale affermazione è FALSA?

  • A) ∃ esiste una relazione lineare diretta tra età e soddisfazione globale
  • B) L'età è un aspetto del consumatore legato alla soddisfazione;
  • C) L’età è l’unico aspetto del consumatore legato alla soddisfazione

(5.5) Dopo aver fornito la definizione di residuo, commenta il seguente output:

residuo = somma dell'errore da campionamento cause

(8) Con riferimento al termine di errore casuale e del modello di regressione e del relativo residuo, quale affermazione è vera?

  • A) E ed e possono coincidere;
  • B) E è concettualmente collegato ad e;
  • C) E è concettualmente indipendente da e.

(5.12) Con riferimento al punto (5.5), quale affermazione è vera? L’assunzione sul termine di errore è decisamente non supportata e

  • A) l’indipendenza;
  • B) la normalità;
  • C) l'eteroschedasticità.

(6) Indicare la risposta corretta alle seguenti affermazioni, indicando unicamente una tra le tre possibili scelte.

  1. L'asimmetria di una distribuzione di frequenza può essere definita per quale dei seguenti tipi di variabili?
  2. A) Categoriale nominale; B) Dicotomica/binaria; C) ❑ numerica.
  3. Quando ci sono due etichette (sì/no, presenza/assenza, ecc) utilizzati per identificare una caratteristica con due modalità/valori, si tratta di una variabile
  4. A) categoriale nominale; B) ❑ dicotomica/binaria; C) numerica.
  5. Il grafico appropriato per rappresentare la frequenza delle modalità/categorie di una variabile qualitativa nominale è
  6. A) il biplot; B) il diagramma di dispersione; C) ❑ il diagramma a torta.
  7. Dopo aver ordinato in modo crescente un insieme di valori numerici, 1° quartile è il valore che ripartisce la serie ordinata n-1 parti con
  8. A) pari numerosità; B) ❑ ¼ di numerosità a sin. e ¾ a destra; C)❑ ½ di numerosità a sin. e ½ a destra.
  9. [13] Dati n valori numerici, nel calcolo della varianza campionaria il valore da porre al denominatore è
  10. A) n; B) ❑ n-1; C) 1/(n-1).
  11. [14] Se un campione di numerosità n viene estratto da una popolazione non normale ma simmetrica, si può affermare che la sua
  12. A) distribuzione campionaria; B) media campionaria; C) ❑ varianza campionaria distribuita anch’essa normale, per una dimensione della numerosità n>10.
  13. [15] Poste due ipotesi nulle su vera, la probabilità con cui un ricercatore conclude correttamente che la differenza osservata tra le statistiche campionaria e il parametro della popolazione è dovuta al caso (non è significativa), è un concetto di...
  14. A) Il livello di significatività del test; B) Il livello di confidenza; C) ❑ Potenza del test statistico.
  15. [16] Nella scomposizione della somma dei quadrati del test F, Q campioni, la quantità SST si riferisce alla varianza
  16. A) attribuibile alla differenza delle media y gruppo; B) complessiva della risposta numerica;C) ❑ del errore casuale.
  17. Nella verifica di ipotesi per il confronto delle proporzioni di 2 popolazioni, se è vera l’ipotesi nulla la statistica test Z è in media pari a
  18. A) 0; B) ❑ 1;
  19. [18] Nell’ambito della regressione lineare multipla, la differenza tra il valore osservato della variabile dipendente e il valore previsto/stimato dal modello di regressione viene definita con il termine
  20. A) ❑ errore casuale; B) residuo C) scarto quadratic.
Dettagli
Publisher
A.A. 2018-2019
24 pagine
1 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher marco_zanetti di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Padova o del prof Corain Livio.