Anteprima
Vedrai una selezione di 14 pagine su 65
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 1 Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 2
Anteprima di 14 pagg. su 65.
Scarica il documento per vederlo tutto.
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 6
Anteprima di 14 pagg. su 65.
Scarica il documento per vederlo tutto.
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 11
Anteprima di 14 pagg. su 65.
Scarica il documento per vederlo tutto.
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 16
Anteprima di 14 pagg. su 65.
Scarica il documento per vederlo tutto.
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 21
Anteprima di 14 pagg. su 65.
Scarica il documento per vederlo tutto.
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 26
Anteprima di 14 pagg. su 65.
Scarica il documento per vederlo tutto.
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 31
Anteprima di 14 pagg. su 65.
Scarica il documento per vederlo tutto.
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 36
Anteprima di 14 pagg. su 65.
Scarica il documento per vederlo tutto.
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 41
Anteprima di 14 pagg. su 65.
Scarica il documento per vederlo tutto.
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 46
Anteprima di 14 pagg. su 65.
Scarica il documento per vederlo tutto.
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 51
Anteprima di 14 pagg. su 65.
Scarica il documento per vederlo tutto.
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 56
Anteprima di 14 pagg. su 65.
Scarica il documento per vederlo tutto.
Riassunto esame Analisi dei dati, Prof. Rosato Rosalba, libro consigliato Statistica per le scienze del comportamento, Maggioli Editore (capitoli 8-21)., J. Welkowitz, B. Cohen, R. Ewen Pag. 61
1 su 65
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Metodo di campionamento stratificato

M].3. Si estrae un campione da ogni strato con la procedura del campionamento casuale semplice. 4. Si uniscono i campioni provenienti dai singoli strati e l'analisi è compiuta su questo campione totale. Esempio - voglio estrarre un campione di soggetti affetti da sclerosi multipla. N=1000, n=200 con frazione di campionamento f=200/1000=0,20. Ho Nf=700, Nm=300, ciascuno strato ha una numerosità pari al prodotto tra la frazione di campionamento e la numerosità della popolazione in quello strato. Quindi nf=0,2*700=140; nm=0,2*300=60. Il vantaggio di uno stratificato rispetto al casuale semplice è che se la variabile genere influenza la variabile di interesse, se io la tengo sotto controllo costruendo un campione proporzionale e fedele alla popolazione, mi bastano meno unità per ottenere la medesima precisione nelle stime. Talvolta non siamo nelle condizioni di applicare la teoria della probabilità e quindi scegliamo campioni non probabilistici con.unità scelte su una selezione di criteri identificata dal ricercatore che conosce il fenomeno e sa quali elementi tenere sotto controllo.
Campionamento a scelta ragionata [non probabilistico]
Al ricercatore è dato il compito di identificare le unità che secondo lui sono più rappresentative del fenomento da studiare.
Campionamento a valanga [non probabilistico]
Se la popolazione è molto ristretta, per uno sperimentatore è difficile arrivare alla totalità della popolazione. Quindi si scelgono n unità campionarie casualmente, e a ciascuna di queste unità viene chiesto di indicare altri k unità che appartengono alla stessa popolazione.
Abbiamo introdotto il concetto di campionamento partendo dal concetto di inferenza statistica, perché sono due processi speculari, dato che io identifico un campione dalla popolazione in base alle tecniche di campionamento, il campione poi viene analizzato dal ricercatore per capire cosa

Accade nel campione e per poi estendere e generalizzare quello che accade nel campione alla popolazione! L'inferenza statistica ha due obiettivi:

  1. Calcolare una statistica su un campione e stimare i parametri omologhi sulla popolazione partendo dalla statistica campionaria
  2. Quante probabilità ho di aver osservato un campione come quello che ho studiato se la popolazione di partenza ha un certo valore o determinate caratteristiche? A partire dal risultato ottenuto sul campione andare ad attribuire un valore di probabilità associata a quel risultato se la popolazione di partenza ha alcune caratteristiche.

La distribuzione campionaria di una statistica: Ho ottenuto il campione dalla popolazione, ora devo calcolare la statistica. Per attribuire un valore di probabilità alla statistica devo sapere come si distribuisce! Se lo scopo è quello di stimare i parametri della popolazione noi dobbiamo estrarre tutti i possibili campioni con una determinata n dalla popolazione.

Calcolare la statistica che ci interessa osservare come si distribuisce. La distribuzione di tutti i risultati viene definita come distribuzione campionaria. Noi vedremo la distribuzione campionaria della statistica media.

La distribuzione campionaria della media. La media campionaria, quella calcolata su un campione, viene utilizzata per stimare la media nella popolazione. La media campionaria è uno stimatore corretto della media della popolazione - vuol dire che se io estraggo tutti i possibili campioni della popolazione, e calcolo su ciascun campione la media, per poi fare la media di tutte le medie, ecco che la media delle medie campionarie è uguale alla media della popolazione! Quindi il valore atteso della statistica è uguale al valore vero del parametro.

Se io nella ricerca lavoro sempre su un campione, non è la media del mio campione ad essere uguale alla popolazione!!

Esempio: Ho una popolazione N=4. Ai candidati viene fatta una prova, questi devono scrivere al pc un testo di 300 parole.

popolazione. La deviazione standard delle medie dei campioni è un indicatore della precisione con cui la media campionaria stimata approssima la media della popolazione. La deviazione standard delle medie dei campioni può essere calcolata utilizzando la formula: σ/√n dove σ è la deviazione standard della popolazione e n è la dimensione del campione. In questo caso, poiché stiamo considerando tutti i possibili campioni di dimensione 2, la deviazione standard delle medie dei campioni sarà: σ/√2 La deviazione standard delle medie dei campioni è quindi più piccola rispetto alla deviazione standard della popolazione, poiché la dimensione del campione riduce la variabilità delle medie campionarie. In conclusione, la deviazione standard delle medie dei campioni è un indicatore dell'errore standard della media campionaria, cioè della variabilità delle singole medie campionarie rispetto alla media della popolazione.distribuzione nella popolazione, perché le medie tendono ad essere più vicine alla media della popolazione, questo perché l'errore standard è una funzione sia del fenomeno di variabilità sigma, sia della grandezza del campione [più è grande n, più è piccolo l'errore standard]. Se io non conosco la varianza della popolazione, e devo stimarla a partire dalla varianza del campione, cosa succede, visto che l'errore standard è diverso dalla deviazione standard della popolazione? Per stimare la varianza della popolazione attraverso la varianza del campione io non mi trovo di fronte ad uno stimatore corretto! Questi due sono legati da un fattore di correzione! Io quindi posso correggere la varianza campionaria andando a calcolare la varianza su un campione come varianza campionaria corretta. Quindi la somma degli scarti dalla media li divido per n-1 e non più per n! Apportando questa semplice correzione.avrò come conseguenza che il valore atteso della varianza campionaria sarà uguale alla varianza della popolazione. La forma della distribuzione della media campionaria. La media campionaria può essere standardizzata, producendo una distribuzione normale! La media campionaria quindi ha una distribuzione normale a patto che noi partiamo da una variabile che si distribuisce normalmente nella distribuzione! Se io invece ho una caratteristica che non ha distribuzione normale nella popolazione, cosa avviene nella media campionaria? Ci viene in aiuto il: Teorema del limite centrale. Quando l'ampiezza del campione diventa sufficientemente grande, la distribuzione della media campionaria può essere approssimata alla distribuzione di probabilità normale indipendentemente dalla forma della distribuzione nella popolazione. Questo teorema è fondamentale perché ci dice che se io ho una caratteristica che segue un andamento diverso dalla normale, se io voglio fareinferenza sulla media quando il campione è di dimensioni ridotte? In questo caso, la distribuzione della media campionaria non segue una distribuzione normale e non possiamo fare inferenze sulla media della popolazione. È importante notare che l'assunzione di una distribuzione normale della media campionaria vale solo per campioni sufficientemente grandi, generalmente quando n > 30. Man mano che aumentiamo la dimensione del campione, la distribuzione della media campionaria si avvicina sempre di più a una distribuzione normale. Questo concetto è fondamentale perché la variabilità della media campionaria è inferiore rispetto alla variabilità del fenomeno di partenza. Questo accade perché l'ampiezza della distribuzione dipende sia dalla varianza del fenomeno che dalla dimensione del campione. In altre parole, all'aumentare della numerosità del campione, l'errore standard diventa sempre più piccolo e la distribuzione diventa più stretta. Se non conosciamo la varianza della popolazione, possiamo stimarla utilizzando la varianza campionaria corretta. Tuttavia, è importante sottolineare che quando il campione è di dimensioni ridotte, non possiamo fare inferenze sulla media della popolazione utilizzando la distribuzione normale della media campionaria. In questi casi, è necessario utilizzare metodi statistici alternativi, come ad esempio i test non parametrici.

standardizzazione della media campionaria se io non conosco la varianza della popolazione? Io ho così introdotto un elemento di aleatorietà in più, ovvero utilizzando un'altra statistica campionaria come una stima di un parametro della distribuzione. La media campionaria a quel punto segue una distribuzione t di Student e non una normale! La t di Student differisce dalla normale perché ha una variabilità maggiore, è più piatta rispetto alla normale. Se i gradi di libertà aumentano e quindi n aumenta oltre ai 30-40 gradi di libertà ecco che la t di Student converge con la z. Quindi se io stimo la varianza della popolazione a partire dalla campionaria, in teoria la mia media campionaria standardizzata segue una distribuzione t di Student, non più z. Ma se il campione > 30 io posso usare z per fare inferenza, perché t converge con z!

Procedure di inferenza statistica:

stima

Parliamo di

Noi siamo interessati a dire qualcosa riguardo al fenomeno indagato.

livello dellapopolazione, non tanto a livello del campione sul quale calcoliamo le statistiche.Una statistica calcolata su un campione, usata per stimare il parametro della popolazione, sichiama stimatore, che è una funzione dei dati, una statistica calcolata sui dati a partire daalcune formule. I risultati del campione diventano stimatori nel momento in cui uso queirisultati per stimare l'omologo parametro nella popolazione.

Dobbiamo distinguere due diverse categorie di stimatori:

  • Stimatore puntuale. Quando calcolo la statistica campionaria sul mio campione, ad esempio la media, euso quel valore ottenuto come stima del parametro sulla popolazione, sto facendo unastima puntuale.

Dobbiamo fare attenzione ad alcune caratteristiche di questi stimatori, le statistichedevono avere proprietà desiderabili, devono essere attendibili.Affinché uno stimatore t sia un buon stimatore del parametro theta nella popolazione ènecessario che siano presenti alcune

caratteristiche:
  • Correttezza: Questa proprietà l'abbiamo già vista in precedenza con la media del campione! Il valore atteso delle medie è uguale alla media della popolazione, ecco uno stimatore corretto. Lo stimatore t è corretto se e solo se il suo valore atteso corrisponde al valore del parametro theta nella popolazione. Uno stimatore definito come distorto, non è centrato rispetto al valore vero del parametro. La distanza tra il valore atteso dello stimatore e il valore vero del parametro è definito bias [B=E(t) - theta]. Lo stimatore distorto che abbiamo trovato in precedenza è la varianza campionaria! La varianza campionaria e la varianza della popolazione sono legate da un fattore di correzione, che è n-1/n*sigma.
  • Efficienza o precisione: Questo fa riferimento alla variabilità dello stimatore. Uno stimatore è tanto più efficiente o preciso quanto più piccola è la sua variabilità.
Dettagli
Publisher
A.A. 2021-2022
65 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Alessia_c_ di informazioni apprese con la frequenza delle lezioni di Analisi dei dati e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli studi di Torino o del prof Rosato Rosalba.