Anteprima
Vedrai una selezione di 10 pagine su 41
Statistica - Inferenza statistica, campionamento, statistica descrittiva, elementi di probabilità Pag. 1 Statistica - Inferenza statistica, campionamento, statistica descrittiva, elementi di probabilità Pag. 2
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Statistica - Inferenza statistica, campionamento, statistica descrittiva, elementi di probabilità Pag. 6
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Statistica - Inferenza statistica, campionamento, statistica descrittiva, elementi di probabilità Pag. 11
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Statistica - Inferenza statistica, campionamento, statistica descrittiva, elementi di probabilità Pag. 16
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Statistica - Inferenza statistica, campionamento, statistica descrittiva, elementi di probabilità Pag. 21
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Statistica - Inferenza statistica, campionamento, statistica descrittiva, elementi di probabilità Pag. 26
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Statistica - Inferenza statistica, campionamento, statistica descrittiva, elementi di probabilità Pag. 31
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Statistica - Inferenza statistica, campionamento, statistica descrittiva, elementi di probabilità Pag. 36
Anteprima di 10 pagg. su 41.
Scarica il documento per vederlo tutto.
Statistica - Inferenza statistica, campionamento, statistica descrittiva, elementi di probabilità Pag. 41
1 su 41
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

CAP. 14 – INTRODUZIONE ALL'INFERENZA STATISTICA

Nell'inferenza statistica i due termini sempre presenti sono:

  • popolazione, insieme generale di riferimento spesso molto numeroso e a volte indefinito da cui viene estratto un sottinsieme detto campione, numericamente più ridotto, che si suppone di poter osservare completamente. Quando la popolazione è finita può essere possibile anche conoscerne o stimarne la dimensione (N). Il numero n di elementi estratti formano la dimensione campionaria.
  • campione, ottenuto estraendo un certo numero n di elementi dalla popolazione P, secondo un certo criterio di campionamento C.

Una volta definiti P, N, C e n si possono estrarre molti campioni differenti che costituiscono un insieme U = U(P,C,n) detto universo dei campioni - più numeroso della popolazione stessa. Se le osservazioni sono a due a due indipendenti, il campione si dice bernoulliano.

Una statistica campionaria è il risultato di una qualunque operazione eseguita sui valori campionari, ogni campione fornisce il suo valore della statistica. L'insieme di questi valori assunti da una statistica t nell'intero universo dei campioni, genera la distribuzione campionaria T associata alla statistica t.

Necessaria per effettuare qualunque procedura di inferenza statistica, si cerca di conoscere, quando possibile: valore atteso (valore medio) E(T), varianza V(T) e/o lo scarto S(T), legge distributiva completa.

STIMATORI E STIME

L'inferenza statistica comprende diversi tipi di procedure classificate in tre gruppi: stima di parametri, test di ipotesi e stima di densità non parametrica (trattate le prime due) →

  • quando lo scopo dell'inferenza è la stima di parametri, si cerca di approssimare il valore assunto da uno o più parametri nell'intera popolazione sulla base dell'informazione data dal campione osservato. Si usano lettere latine per indicare le statistiche campionarie e le greche per indicare i parametri della popolazione.
  • un parametro θ come la media o varianza può assumere un insieme di valori detto spazio parametrico. Una statistica campionaria che assume valori appartenenti allo spazio parametrico si chiama stimatore, e il suo valore in un campione si chiama stima (puntuale). Ad uno stimatore corrispondono tante possibili stime ognuna generata da un determinato campione.

DISTORSIONE ED ERRORE QUADRATICO MEDIO

Quando si cerca di stimare un generico parametro θ, è importante scegliere bene lo stimatore. Questa scelta può essere fatta sulla base di alcune proprietà ottimali che uno stimatore può avere o no, i 2 indicatori da considerare sono:

  • distorsione, la differenza tra il valore atteso della distribuzione campionaria T e il parametro θ → B(T) = E(T) - θ. Se la distorsione è positiva lo stimatore tende a sovrastimare il parametro, se è negativa lo stimatore tende a sottostimare il parametro.

Infine, se si ha B(T) = 0 lo stimatore è corretto/centrato.

  • errore quadratico medio → EQM(T) = E[T-θ]^2 = E[T-E(T)+E(T)-θ]^2 = V(T)+ [B(T)]^2. Quindi se lo stimatore t è corretto il suo EQM coincide con la varianza. Se uno stimatore t1 ha un EQM inferiore a un altro stimatore t2, si dice che t1 è più efficiente di t2. Se due stimatori sono entrambi corretti, il più efficiente è quello che ha la minor varianza.

DISTRIBUZIONE DELLA MEDIA ARITMETICA CAMPIONARIA

Quando si studia una variabile statistica Y in una popolazione si può indicare con y1, y2, ..., yn un campione di n osservazioni estratte casualmente dalla popolazione stessa.

Uno stimatore intuitivo del valore medio E(Y) = m è la media aritmetica campionaria → ȳ_n = Σ_n j=1 yj = 1/n y1+r 1/n y2 t.. 1/n yn

La distribuzione campionaria dello stimatore ȳ può essere analizzata, qualunque sia la forma distributiva nella popolazione. Se si indica con m il valore medio della popolazione e se si utilizzano le proprietà del valore atteso, si ottiene:

E(ȳ) = E(Σ_n j=1 yj) = Σ_n f(yj) = f(y1)+r(f(y2)+f(y... = mu t.. n = m = mu

Quindi, lo stimatore ȳ è sempre corretto per il parametro M.

Indicando con s^2 la varianza supposta finita dell'intera popolazione e ipotizzando che le osservazioni campionarie siano a due a due indipendenti, si ottiene inoltre→

V(ȳ) = V(Σ_n yj) = Σ_n V(yj) = V(y1)+V(y2)+..tV(yn) = nσ² = σ²/n = (σ/(n) )²

Infine, se è possibile ipotizzare che la popolazione sia normalmente distribuita si può conoscere la distribuzione esatta dello stimatore. Essendo la (14.3) una combinazione lineare di v.a. Gaussiane, è a sua volta una Gaussiana N (M ; (σ/n) ).

Tuttavia, il valore del parametro non è noto e non si riesce a calcolare direttamente il denominatore. Pertanto, occorre sostituire al parametro la sua stima f* ottenendo una nuova statistica z* che può essere approssimata altrettanto bene con una normale standardizzata:

Gli intervalli di confidenza risultanti sono i seguenti:

Essendo il fattore (N-n)/(N-1) minore di 1, gli intervalli risultanti saranno più ridotti a parità di livello di confidenza.

CAP. 16 - STIMA DEI PARAMETRI DI UNA POPOLAZIONE NORMALE

STIMA PUNTUALE E INTERVALLARE PARAMENTO µ

Sia Y una variabile che segue una distribuzione normale N(µ, σ) nella popolazione oggetto di studio, e sia y1, y2,..., yn un campione bernoulliano estratto dalla popolazione. I parametri da stimare sono: la media µ e lo scarto σ'.

Per ottenere una stima puntuale della media si può usare lo stimatore “media aritmetica campionaria”:

Come detto in precedenza, la normalità distributiva della popolazione permette di conoscere la distribuzione esatta dello stimatore precedente, che è una

Standardizzando tale distribuzione, si ottiene una statistica che segue una v.a. N(0,1):

Essa però non può essere quasi mai utilizzata perché non si conosce il valore di σ'. Per stimare tale parametro si può ricorrere alla radice quadrata della varianza corretta:

La statistica risultante è però, a causa della variabilità indotta dal penultimo stimatore, la statistica t non ha una distribuzione N(0,1) bensì una distribuzione di t di Student con n-1 gradi di libertà. Stabilito il livello di confidenza 1-α v identificato sulle suddette tavole, il centile t α/2 corrispondente a una probabilità pari a α/2. si può definire l’intervallo di confidenza bilaterale:

CAP. 19 - TEST IPOTESI SUI PARAMETRI DI UNA POPOLAZIONE NORMALE

Il test di ipotesi per il valore di una media si applica quando la popolazione può essere considerata normalmente distribuita, per cui si ha: Y~N(μ.,σ). Il test riguarda il valore del parametro media μ, che va confrontato con un valore di riferimento μ0.

Lo stimatore media aritmetica campionaria ȳ, sotto l'ipotesi nulla segue una legge distributiva gaussiana di media μ0 e di scarto σ/√n, si può già definire una statistica test:

Z = ( ȳ – μ0 ) / ( σ/√n )

In generale il valore del parametro σ' non si conosce e va stimato con il consueto “scarto corretto” s, già definito. La statistica ottenuta non è più gaussiana perché risente anche della variabilità di s. Quindi si ottiene

t = ( ȳ – μ0 ) / ( s/√n )

In base alla forma dell’ipotesi alternativa, il test sarà in coda sinistra o destra.

TEST PER IL CONFRONTO TRA DUE VARIANZE (test di omoschedasticità)

Questo test si può applicare quando si pongono a confronto due popolazioni (A e B) che sono normalmente distribuite rispetto a un carattere quantitativo Y, si ha:

YA~N(μAA) YB~N(μBB)

Il test riguarda il confronto dei valori del parametro scarto (σA',σB') e si basa su due campioni, entrambi bernoulliani (A e B). Il test si esegue confrontando le due varianze campionarie corrette ŝA2 e ŝB2 e ponendo la più grande al numeratore e la più piccola al denominatore:

F = max (ŝA2, ŝB2) / min (ŝA2, ŝB2)

I gradi di libertà andranno invertiti se la varianza al numeratore è ŝB2

TEST PER IL CONFRONTO TRA DUE MEDIE (test di Student)

Anche per questo confronto si deve supporre che le popolazioni di riferimento siano normalmente distribuite rispetto a un carattere quantitativo Y, per cui si ha:

YA~N(μAA) YB~N(μBB)

Il test riguarda il confronto dei valori del parametro media e utilizza due campione bernoulliani. Le condizioni di applicabilità del test di Student sono: normalità distributiva e omoschedasticità delle popolazioni, indipendenza dei campioni. L’omoschedasticità delle due popolazioni dovrebbe essere controllato applicando il test per il confronto delle due medie pure o proseguendo verso l’applicazione del solo t-test nulla H0. α 0= α 0 non viene rifiutata. Pertanto si

Dettagli
Publisher
A.A. 2022-2023
41 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher carlottasassi di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bologna o del prof Brizzi Maurizio.