Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Donato Posa
Sandra De Iaco
FONDAMENTI DI STATISTICA INFERENZIALE
Capitolo 1
Principi di inferenza statistica
La statistica svolge un ruolo fondamentale perché, oltre ad avere fornito tecniche per l'elaborazione dei dati e descrizione dei fenomeni, dell'altro risguo delle metodologie per indagare sui fenomeni, utilizzando osservazioni di una piccola parte del collettivo.
Nel primo caso parliamo di statistica descrittiva che risolve problemi di tipo deduttivo, nel secondo caso parliamo di statistica inferenziale che affronta problemi di tipo induttivo, fenomeni anche problemi inversi.
La statistica inferenziale è una disciplina che si compone di risultati teorici fondamentali ed appropriate metodologie che consentono di utilizzare le osservazioni relative ad un campione, allo scopo di giungere a conclusioni valide per la popolazione di riferimento.
Popolazione e campione
L’insieme, finito o infinito, numerabile o non numerabile, degli elementi in cui si manifesta il fenomeno oggetto di studio viene denominato popolazione.
Gli elementi che costituiscono una popolazione sono denominati unità statistiche.
Assegnare una popolazione in qualsiasi raggruppamento estratto dalla popolazione stessa viene denominato campione.
Viene denominato piano di campionamento un prospetto in cui si stabiliscono il criterio di selezione del campione dalla popolazione e relativi vincoli. Le popolazioni possono essere finite o infinite.
Una procedura di campionamento viene definita casuale se l'estrazione delle unità che costituiscono il campione avviene secondo un criterio che non privilegia alcuna unità rispetto ad altre.
Esperimenti Casuali
Un esperimento è un processo mediante il quale si osserva il risultato di una o più azioni o, in generale, di un fenomeno. Esso viene denominato casuale o aleatorio, se l'esito o il risultato dell'esecuzione dell'esperimento stesso non è certo o noto a priori.
È spesso possibile individuare l'insieme dei risultati che si possono verificare ricorrendo al calcolo delle probabilità. Gli esperimenti deterministici sono, invece, caratterizzati dalla prevedibilità del risultato ottenuto.
Spazio Campionario ed Eventi
Ogni possibile esito o risultato di un esperimento casuale viene denominato punto campionario, o evento semplice, e viene indicato con ω. L'insieme o la collezione di tutti i possibili risultati alternativi di un esperimento casuale, viene denominato spazio campionario e viene indicato con Ω.
Gli spazi campionari possono essere distinti in numerabili, (ovvero di tipo quantitativo che qualificativo, o non numerabili). Si osservi che, più eventi semplici, legati da una caratteristica comune, costituiscono un evento composto.
Un evento è un sottoinsieme dello spazio campionario Ω, e viene solitamente indicato con le lettere maiuscole dell'alfabeto latino.
Anche l'insieme vuoto ∅ e l'insieme Ω, come sottoinsiemi di Ω sono eventi: chiamarsi evento impossibile ed evento certo.
Probabilità Condizionata ed Indipendenza
Nelle situazioni sperimentali si manifesta spesso la necessità di calcolare la probabilità di un evento, dopo aver accertato che si è presentato un altro evento. In questo si inferisce il verificarsi del primo ricorrendo al concetto di probabilità condizionata.
- Probabilità Condizionata
Assegnato uno spazio di probabilità (Ω, A, P), siano A e B due eventi appartenenti ad A, con P(B) > 0.
Viene denominata probabilità condizionata di A, assegnato B, e si indica con P(A|B), il rapporto tra la probabilità dell'evento intersezione (A ∩ B) e la probabilità dell'evento B.
1) Se P(B) > 0; P(A|B) = P(A ∩ B) / P(B); P(A ∩ B) = P(B) · P(A|B)
2) Se P(A) > 0; P(B|A) = P(A ∩ B) / P(A)
- Indipendenza Tra Eventi
- Indipendenza Tra 2 Eventi:
Assegnati due eventi A e B appartenenti ad A, essi sono indipendenti, se il verificarsi dell’evento B, con P(B) > 0, lascia invariata la probabilità che si presenti l’evento A, e quindi:
P(A|B) = P(A)
Oppure, in maniera alternativa, se il verificarsi dell’evento A, con P(A) > 0, lascia invariata la probabilità che si presenti l’evento B e quindi:
P(B|A) = P(B)
MOMENTI DI UNA VARIABILE ALEATORIA
L'analisi di una variabile aleatoria richiede il calcolo di alcuni valori caratteristici, denominati anche momenti, che permettono di specificare la distribuzione di probabilità di una variabile aleatoria.
- Valore atteso
Gli esperimenti casuali manifestano delle regolarità e quindi dei risultati attendibili, in un numero elevato di verifiche.
Il calcolo del valore atteso consente di valutare tali aspettative in lungo termine.
Valore atteso:
Assegnata una variabile aleatoria X discreta, con funzione di probabilità pX(xi), il suo valore atteso, indicato con E(x), è definito:
E(x) = ∑i=1∞ xi · pX(xi)
Il valore atteso rappresenta una "media delle realizzazioni".
Proprietà del valore atteso
Teorema:
Assegnate due variabili aleatorie X ed Y, con valori attesi, rispettivamente E(x) ed E(y), risulta:
- ∀ a ∈ ℝ, E(a) = a dove a è una costante
- ∀ a ∈ ℝ, E(a·x) = a·E(x) , E(a+x) = a + E(x)
- E(x+y) = E(x) + E(y)
L'area sotto la curva rappresenta una probabilità se di conseguenza
l'area complessiva sotto la curva è sempre pari a 1 con divisione
in 0,5 di un'area destra e 0,5 di un'area sinistra.
Essendo una distribuzione Normale possiamo assumere che:
- μ-σ / μ+σ ⇒ 68,26%
- μ-2σ / μ+2σ ⇒ 95,44%
- μ-3σ / μ+3σ ⇒ 99,72%
Variabile detta Normale Standardizzata
Assegnata una variabile detta X~N(μ,σ2), la variabile
detta Z, si ottiene mediante la seguente operazione di
standardizzazione:
Z = (X - μ) / σ
Presenta distribuzione Normale con parametri 0 ed 1 e viene
denominata variabile detta Normale Standardizzata.
Analogamente alla notazione definita per una variabile detta
Normale, la variabile detta Z standardizzata, si indica come:
Z~N(0,1)
Per eseguire la standardizzazione si usano, in tavola delle variabili
dette che riportano i valori Z non negativi.
Per valori Z negativi si può agevolmente tramutare utilizzando:
Fz(-Z) = 1 - Fz(Z) ∀Z≥0
- Intervallo con grandi campioni
In presenza di campioni di numerosità elevata (m ≥ 30) la variabile aleatoria P standardizzata si idea che:
Z = P̂ - π/√π(1-π)/m d N(0,1)
Pertanto in presenza di grandi campioni, l'intervallo di confidenza per il parametro π di una variabile aleatoria X ~ Ber(π), a livello 100(1-α)%, risulta essere:
Z ~ N(0,1) P̂ - Zα/2 √P̂(1-P̂)/m ; P̂ + Zα/2 √P̂(1-P̂)/m