vuoi
o PayPal
tutte le volte che vuoi
Formattazione del testo
Questa tabella è una distribuzione simmetrica, in cui 7 è media, moda e mediana. In probabilità ciò è chiamato valore atteso, poiché è il valore più probabile. Valore atteso = E(x).
Nelle variabili continue è più conveniente lavorare in classi per eliminare i numeri decimali, ad esempio l'altezza:
Classe | Ni | Pi |
---|---|---|
150-160 | 27 | 27/66 = 0,41 |
160-175 | 33 | 33/66 = 0,50 |
175-190 | 6 | 6/66 = 0,09 |
TOT | 66 | TOT = 1,00 |
Essendo variabili continue, sono rappresentabili con un istogramma. Il poligono di frequenza è una spezzata che si costruisce sopra l'istogramma. Ad esempio:
Per creare un poligono di frequenza, inizialmente si individuano le parti centrali superiori. A seconda di quanto sia lunga la prima classe, si stacca un segmento che dev'essere la metà (per esempio, se la prima classe è 10, allora il segmento è 5). Si fa la stessa operazione nell'ultima classe e si uniscono i punti segnati nella parte superiore dell'istogramma.
L'area che...
è sotto il poligono di frequenza è la somma delle probabilità.
In un grafico con curve invece il segmento è una densità, le aree singole sono sotto le singole curve.
Distribuzione normale
La curva normale (o curva di Gauss), sull'asse della y sono presenti le densità e quella delle x le probabilità.
È una curva a campana, simmetrica e asintotica (le code della curva non toccano mai l'asse delle x, ma lo toccano all'infinito).
Nel caso di una retta è necessario conoscere semplicemente i parametri a e b (es. y=a+bx).
Nella curva quante più concavità e più convessità sono presenti tanto più la curva sarà complicata, nel caso della curva normale la formula è (vedere le foto), in cui la E è il numero di Nepero (2,72).
Mentre le due incognite nella retta erano a e b, nella curva normale sono sigma (lo scarto quadratico medio) e Ni (la media aritmetica).
Se cambia la media
la curva si muoverà nel grafico orizzontalmente, se cambia lo scarto quadratico medio ma la media rimane la stessa la curva si muoverà verticalmente (se sigma è grande la curva si innalza se è più piccolo si appiattisce).
I fenomeni più probabili sono quindi quelli più vicini alla media.
La logica probabilistica è alla base del campionamento, si vogliono conoscere certe costanti di una popolazione, si devono quindi prendere in considerazione certi parametri come la media della popolazione, il pi greco (frequenza relativa), il sigma, ecc (quando si calcola qualcosa dentro la popolazione si usano lettere greche, per riferirsi a qualsiasi di questi parametri si può utilizzare la lettera beta).
Se la popolazione è molto grande è più conveniente selezionare un campione della popolazione (in tal caso si usano lettere latine).
Un buon campione è un campione rappresentativo, così da poter riferire il campione
alla popolazione, ma purtroppo non possiamo mai sapere se un campione è rappresentativo perché conosciamo solo il campione, non la popolazione.
Stima dei parametri = non conoscendo la media della popolazione si mette in atto un percorso di ricerca per capire quanto potrebbe essere, estraendo un campione su cui calcolare la corrispondente quantità (n1/x1) per poi riferirla alla popolazione.
Per far ciò bisogna applicare la formula stimatore (es. formula media campionaria) al campione.
Stimatore = formula che si usa nel campione per ottenere il risultato di interesse.
Il risultato di questa formula è quindi la stima.
Tra la stima ed il parametro ci sarà una differenza, definita un errore di stima.
Questa è la fine del campionamento non-casuale, che è comunque necessario per certi tipi di ricerche.
Col metodo casuale è possibile farsi un'idea della misura dell'errore di stima.
Se da una popolazione si estrae un campione con un metodo qualunque (es.
Il tuo compito è formattare il testo fornito utilizzando tag html.
ATTENZIONE: non modificare il testo in altro modo, NON aggiungere commenti, NON utilizzare tag h1;
campionamento casuale semplice con reinserimento di 100 persone),la precondizione è che bisogna avere l'elenco di tutte le unità dellapopolazione.Successivamente testa il tema di interesse (es. intelligenza media) per poicalcolare usando lo stimatore la media campionaria ottenendo un risultato,vale a dire la stima (es. 106).Estraendo un altro campione e utilizzando lo stesso metodo e la stessanumerosità si sarebbe ottenuta una stima diversa (es. 104), ciò vale perqualsiasi altro campione estraibile.Il numero di campioni estraibile è N^n.Se N fosse 100, e ne estraessi un campione di 10 potrei estrarre campionidi 100^10, e per ogni campione ci sarebbe una stima.È quindi più conveniente estrarre un singolo campione, tenendo comunqueconto che la stima che ne risulterà è solo una tra le molte possibili.Esiste una distribuzione di tutte queste possibili stime.Xi PiX N1 1X N2 2X N3 3X N4 4... ....
A queste stime,
poiché sono ipotetiche e non sono state effettivamente calcolate, si associa una probabilità. Questa è una distribuzione teorica definita distribuzione campionaria dello stimatore, in questo caso è della media. Le modalità di una distribuzione campionaria sono tutte le possibili stime ottenibili. Questa distribuzione è una variabile casuale, poiché associa un numero reale ad un possibile esperimento. Le variabili casuali sono discrete e continue. È necessario immaginare questa distribuzione come una variabile continua: Xi Pi X --| X P 1 2 1 X --| X P 2 3 2 ... ... TOT = 1,00 Rappresentata graficamente la distribuzione campionaria sarebbe una curva. La frequenza relativa del campione si calcola con ni/n, la distribuzione campionaria delle frequenza relativa sarà quindi: Fi Pi F --| F P 1 2 1 F --| F P 2 3 2 ... ... TOT = 1,00 E(f) = media aritmetica della distribuzione campionaria della frequenza relativa. Lo scarto quadratico medio (il libro ne parla in)termini di varianza) delladistribuzione campionaria è quanto in media le stime si discostano dalvalore atteso e quindi anche dal parametro, tramite questo indice possiamosapere quanto in media tutte le possibili stime si differenziano dalparametro, vale a dire un valore medio dell'errore di stima.
Errore quadratico medio (MSE) = errore commesso tra le stime ed ilparametro, errore medio di stima; composto da varianza dello stimatore edil quadrato della distorsione; è una misura della distribuzione campionaria.
Nello stimatore corretto B(t)^2 = 0; MSE = alla varianza della distribuzionecampionaria.
Nella distribuzione campionaria della media l'MSE si può calcolare se ilcampionamento è casuale, attraverso la formula scarto quadratico mediocalcolato sul campione su radice di n.
Questo stimatore non è corretto, la media di tutte le stime non sarebbe ilparametro, si sostituisce quindi con s cappelletto.
MSE = sigma/radice quadrata di n; sostituito con
S cappelletto/radicequadrata di n; calcolato nel caso della media campionaria. Proprietà degli stimatori:- Correttezza = il valore atteso dello stimatore, è uguale al parametro della popolazione, E(t) = theta, se lo stimatore è diverso dal parametro allora non è corretto (distorto, B); B(t) = E(t)- theta; noi lavoriamo con stimatori corretti.
- Proprietà di efficienza = scegliere gli stimatori più corretti e più efficienti.
corrispondenti punti standardizzati sono:Se la variabile X nella popolazione si distribuisce normalmente, anche lavariabile standardizzata z si distribuisce normalmente; altrimenti z sidistribuisce normalmente al crescere di n (numerosità campionaria).
Stima puntuale dei parametriStimare significa attribuire un valore ad un dato incognito.“Stimo” qualcosa che non conosco.Riferiamo la stima al valore che si attribuisce ad un parametro incognito(es. µ media ; ơ2 varianza; p proporzione).Nella stima puntuale assume particolare rilevanza l’errore standard.È la misura dell’attendibilità della stima.Esprime quanto, in media, i valori della stima si discostano dal valore verodel parametro (per stimatori corretti).Le misure dell'errore quadratico medio della media campionaria dipendonodal tipo di campionamento.Se si vuole sapere quant'è l'errore quadratico medio della distribuzionecampionaria della media si deve usare
Questa formula (σ su radice din) quando si usa il campionamento casuale semplice con reinserimento. Non conoscendo σ lo si sostituisce con un'analoga quantità ottenuta sul campione, che sarà S cappelletto su radice di n. Se il campione fosse casuale semplice senza reinserimento la formula cambierebbe leggermente (la si trova sul libro). Tipicamente la rappresentazione grafica della distribuzione campionaria sarà una curva. La media campionaria si distribuisce come una curva normale (N), sull'asse delle x saranno presenti le stime corrette, con al centro equivalente alla media il valore atteso.