Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
INFERENZA
Discutere concetti e obiettivi dell'Inferenza statistica e le specifiche problematiche rispetto alla Statistica descrittiva. Più spesso non si dispone dell'intera popolazione ma solo di dati parziali relativi ad un sottoinsieme di U campione. L'obiettivo dell'inferenza statistica è estendere l'analisi del comportamento di X all'intera U, in quanto si tratta di inferire dal campione all'intera popolazione. La rilevazione completa di U si chiama censimento mentre quando l'osservazione di X avviene solo su una parte di U si effettua una rilevazione campionaria. Le rilevazioni campionarie sono più frequenti e preferibili rispetto al censimento per ragioni di budget, in quanto una rilevazione campionaria richiede risorse ridotte in termini di tempo e costi, per ragioni di precisione e in alcuni casi la rilevazione parziale si impone rispetto alla rilevazione esaustiva perché quest'ultima risulta impossibile o
sconveniente. È ignoto: non abbiamo tutte le info di tutte le unità statistiche e disponiamo solo dei dati campionari. L'inferenza statistica è un'inferenza induttiva (dal particolare al generale) che procede dal campione (una parte) alla popolazione (il tutto) ed è a rischio di errore, ma nonostante questo controlla l'effetto del caso attraverso la probabilità. Il campione deve essere rappresentativo, cioè è un'immagine in scala ridotta ma fedele dell'intera U, deve essere casuale, cioè scelto a caso da U stessa. La casualità del campione è garanzia della sua rappresentatività. Con inferenza ci troviamo in una situazione casuale in quanto vi è sempre una componente di incertezza. Esporre i concetti di Esperimento casuale, Evento elementare, Spazio campionario, Evento causale Esperimento casuale: è un esperimento condotto sotto l'effetto del caso, cioè quando ènotasolo una parte delle circostanze che consentirebbero di prevederne il risultato con certezza apriori. Di un esperimento casuale è possibile solo elencare a priori l'insieme dei possibili esiti. Un esempio sono i giochi d'azzardo con monete, dadi, roulette) eseguiti regolarmente e senza barare.
Evento elementare: ciascuno dei possibili esiti di un esperimento casuale
Spazio campionario: è l'insieme di tutti i possibili esiti di un esperimento casuale, elencabili a priori, è quindi l'insieme di tutti gli eventi elementari. Usiamo la lettera omega maiuscola per denotare lo spazio campionario
Evento casuale: è un sottoinsieme dello spazio campionario ed è un concetto più generale rispetto a quello di evento elementare in quanto un evento elementare è un singolo evento di omega, mentre l'evento casuale è un sottoinsieme di omega cioè un insieme di eventi elementari. Infatti può contenerne uno, nessuno,
molti ,pochi. La notazione che usiamo per indicarlo è la E, i cui elementi sono appunto eventi elementari i quali possono appartenere o non appartenere a E. Esporre, e discutere comparativamente, le definizioni classica e frequentista di probabilità. Classica: è la più antica e semplice ed è applicabile a spazi campionari finiti. P(E) è il rapporto (cioè una frazione) fra il numero di casi favorevoli a E e il numero di tutti i casi possibili. Due limiti: i casi devono essere ugualmente possibili (equiprobabili) e bisogna contare sia il numero di casi favorevoli che il numero di casi possibili (e con eventi complessi non sempre è possibile). Questa definizione è insufficiente: è impraticabile o impossibile contare i casi possibili e i casi favorevoli al verificarsi di eventi complessi. La definizione classica è limitata solo ai casi in cui E è bilanciato, quindi finito e simmetrico. Frequentista: definizione basata sull'osservazione,Legge empirica del caso, si osserva nella pratica. L'evento E di cui si vuole calcolare la probabilità P(E) è pensato come il risultato di un esperimento casuale ripetibile un gran numero N di volte sempre nelle stesse condizioni. Al termine di tali N prove, E si sarà verificato f volte (e non si sarà verificato le restanti N-f volte).
La legge empirica del caso dice che la frequenza relativa f/N del verificarsi di E tende a stabilizzarsi intorno a un certo valore man mano che aumenta il numero N di ripetizioni dell'esperimento. La probabilità di E è quel valore intorno al quale tende a stabilizzarsi la frequenza relativa dopo un numero sufficientemente grande di prove:
P(E) = lim per N che tende a infinito di f/N.
La definizione frequentista di probabilità è più ampia di quella classica: permette di considerare spazi campionari infiniti e di calcolare la probabilità di eventi anche quando i casi possibili non sono
Tutti ugualmente possibili. Permette di probabilizzare eventi più complessi. Ha anche i suoi problemi:
- Le prove devono essere ripetute tutte nelle stesse condizioni
- Casistiche "sufficientemente grandi"
La probabilità di un qualunque evento casuale E è un numero compreso tra 0 e 1. Elimina la circolarità e la limitatezza della definizione classica. Gli eventi non sono ugualmente possibili. Supera la definizione classica ma è ancora limitata: l'oggetto cresce sempre di più con l'avanzamento tecnologico.
Esporre il concetto di variabile casuale, la sua utilità in relazione all'esperimento casuale, e l'analogia con la variabile statistica (descrittiva) inclusi i concetti di media e varianza.
La variabile casuale è lo strumento matematico che permette di concentrarsi sulle sole caratteristiche dell'esperimento che interessano e che trasforma gli eventi casuali in numeri reali, conservandone comunque la probabilità.
È una funzione con dominio nello spazio campionario Ω e codominio nell'insieme dei numeri reali, a cui rimangono associate le probabilità degli eventi di Ω. La variabile casuale prende gli elementi di Ω e suoi sottoinsiemi e li trasforma in numeri reali, cioè in valori della variabile casuale. Nasce un'osservazione parziale e casuale della realtà. Il procedimento è analogo a quello della statistica descrittiva; si parte da un'inferenza statistica (nel caso della descrittiva si parte appunto dalla statistica descrittiva), si crea la variabile casuale formata dalle coppie (nel caso della descrittiva si crea la v. statistica) e infine la v. casuale trasforma gli elementi dei sottoinsiemi dello spazio campionario in valori, cioè probabilità del corrispondente evento (nel caso della descrittiva la v. statistica contiene modalità e frequenze relative). Una variabile casuale è detta discreta quando assume un valore finito o numerabile di valori.numero finito di valori x che di solito sono numeri interi e la somma di tutti questi valori è pari a 1 in perfetta analogia con la somma delle frequenze relative della variabile statistica. Quindi sfruttando l'analogia con la v.s è possibile trasferire sulla v.c concetti della statistica descrittiva, come ad esempio il concetto di media che quando è riferita a una v.c viene chiamata valore atteso o expectation. Un altro concetto è quello della varianza che nel caso della vc è definita e calcolata come per la v.s, ma usando le probabilità al posto delle frequenze; è una misura della variabilità di X, cioè della dispersione dei suoi valori intorno al suo valore atteso ponderata con le probabilità. Esporre (a parole) le caratteristiche e le proprietà della variabile casuale Normale discutendone il ruolo centrale nell'inferenza statistica. La variabile casuale continua si usa per fare inferenza statistica su
fenomeni continui, quelli che non si possono contare ma si possono misurare. Le variabili casuali normali assumono infiniti valori e quindi occorre far riferimento a insiemi di valori, ovvero intervalli; la probabilità è calcolabile solo per gli intervalli. Siccome i singoli valori non sono visibili, non si parla più di probabilità P(X=x) ma di funzione di densità, che indichiamo con la lettera greca fi e serve per calcolare le probabilità di intervalli di valori. Infine le probabilità non sono singoli valori ma aree: l'area sottesa al grafico della funzione di densità fi(x) in un intervallo è la probabilità che X assuma valori in quell'intervallo. La variabile casuale Normale è la più nota tra le variabili casuali continue ed è la più utile nell'inferenza statistica. È continua, cioè utilizzata per fare inferenza su fenomeni continui. Notazione: X ~ N(μ, varianza) che si legge "X segue una distribuzione normale con media μ e varianza".è una v.c. normale di parametri μ e varianza “.
Il parametro μ può essere un numero reale qualunque mentre il parametro “varianza” è un numero reale positivo.
Questa v.c presenta 10 proprietà:
- È v.c. continua e assume tutti i possibili valori reali:
- Ha la funzione di densità fi(x). L’area sottesa al grafico della fi(x) in un certo intervallo rappresenta la probabilità che la v.c. assuma valori in quell’intervallo. La sua rappresentazione grafica è la curva a campana centrata sul valore μ.
- L’area sottesa all’intera curva fi(x) corrisponde alla probabilità dell’intero intervallo “- infinito + infinito “ ed è pari a 1.
- Il parametro μ è la media di X-N (μ, varianza). In formule: E(X)= μ
- Il secondo parametro è la varianza di X-N (μ, varianza). In formule: V(X)=varianza e dunque SD(X)= radice quadrata della varianza = deviazione standard
La curva a campana è simmetrica rispetto a μ, cioè l'area sottesa alla curva a destra e a sinistra di μ è uguale e dunque pari a 0,5. P(X<= μ)= p(X>=μ)=0.5X assume valori sotto media e sopra media con la stessa probabilità.7. Il parametro μ rappresenta anche la mediana e la moda di X8. I flessi (le due code) corrispondono ai punti μ-varianza, μ+varianza , cioè una deviazione standard dal valore medio. Tra questi due valori c'è la pancia dove è compresa la maggior probabilità. La curva cambia concavità in corrispondenza dei flessi; dove c'è meno probabilità l'area si riduce9. I parametri μ e varianza della normale, oltre che rappresentare moda, media, mediana e varianza di X, determinano anche la posizione e la forma della campana.10. La probabilità di un qualunque intervallo di valori X è l'area sottesa alla campana in quell'intervallo.
normale tende a manifestarsi con un valore sistematico prevalente