Estratto del documento

Introduzione

Nell’approccio sperimentale abbiamo sempre a che fare con un elemento non eliminabile: il caso (misura, per esempio, è sempre dotata di errore, sempre e comunque affetta da imprecisione).

Legge deterministica

La legge deterministica prevede una corrispondenza univoca fra due eventi, causa ed effetto. Per controllare l’errore usiamo il metodo probabilistico: rappresentiamo l’errore attraverso la probabilità. Per esempio, se si viaggia in treno, l’arrivo previsto è alle ore X, questo si verifica con una certa probabilità. È vero che l’errore è ineliminabile ed incrollabile, ma possiamo gestire le caratteristiche della sua casualità attraverso la probabilità.

Esempio: una misura è 20, ma può essere 19.9 o 20.1: attraverso la probabilità so che la misura è dotata di una certa oscillazione che ha determinate caratteristiche: ad un certo evento, può seguire uno di tanti possibili effetti, ciascuno con una diversa probabilità.

Legge probabilistica

La legge probabilistica prevede una corrispondenza fra un evento e un insieme di possibili eventi. Lo studio dei possibili eventi e di quanto siano credibili fa parte della probabilità.

Finalità della ricerca scientifica

  • La scienza oggi si occupa di dimostrare ipotesi scientifiche su base sperimentale.
  • Le scoperte scientifiche vengono oggi considerate tali se sono provate sperimentalmente.
  • La legge scientifica è una legge generale falsificabile (Popper):
    • Generale: riguarda una categoria di eventi, non alcuni soggetti (per es., con l’età aumenta il rischio di depressione, ci si riferisce a tutti i soggetti che raggiungono una certa età e non alla popolazione generale, alcuni: una categoria, ovvero i soggetti che soddisfano una certa condizione – l’età).
    • Falsificabile: vuol dire che c’è un esperimento in grado di dimostrarla falsa.

Definizioni di probabilità

Classica

Dato un insieme di eventi equiprobabili, la probabilità di un evento è data dal numero di eventi favorevoli diviso il numero di eventi possibili.

PRO: questa definizione fornisce la formula più utilizzata per il calcolo della probabilità; CONTRO: la definizione di probabilità è tautologica, in quanto utilizza il termine “equiprobabili” che per essere compreso necessita prima della definizione di probabilità stessa.

Esempio: Gioco delle tre carte: se estraggo una carta, per esempio quella col lato rosso, qual è la probabilità che dall’altro lato sia bianca? La probabilità è di una su tre. L’evento "altra faccia bianca e altra faccia rossa" non sono equiprobabili. Richiedendo la condizione di equiprobabilità, non è una definizione accettabile: è una formula utilizzata molto di frequente per il calcolo. Per esempio, nel lancio di una moneta, in quanto gli eventi testa e croce sono equiprobabili.

Assiomatica

Basata su tre assiomi:

  • Ad ogni evento di A corrisponde un valore p(A) maggiore o uguale a zero.
  • La probabilità che avvenga uno qualsiasi dei possibili eventi è uno.
  • La probabilità che avvenga o uno o l’altro di due possibili eventi è data dalla somma delle due probabilità.

PRO: non è attaccabile sul piano logico e matematico, si presta di più per una spiegazione teorica; CONTRO: questa definizione non è utile a comprendere cosa sia la probabilità.

Frequentista

È la frequenza con cui un evento si presenta in un numero molto elevato di prove (in teoria, un numero infinito).

PRO: dà un’idea utile a livello pratico di cosa sia la probabilità; CONTRO: problema pratico (se prendiamo una moneta e la lanciamo 1 milione di volte, non ci si può aspettare 500mila teste e 500mila croce. Non si otterrà mai il 50% di eventi); problema teorico (per la legge dei grandi numeri: al crescere del numero delle prove, cresce la probabilità che lo scarto tra frequenza e probabilità diventi minore di un numero piccolissimo, ovvero la probabilità di verificarsi dell’evento si avvicina alla frequenza dell’evento stesso e la loro differenza tende ad annullarsi). La legge dei grandi numeri non vincola il singolo evento: alla lunga circa esattamente le cose dovrebbero andare così, non così.

Soggettivista

È la misura del grado di fiducia (quanto si è disposti a scommettere) attribuita al verificarsi di un evento, in maniera coerente nel momento in cui un soggetto può essere arbitrario, può essere soggetto ad un controllo. (Esempio dividere pizza)

  • Coerenza: stabilita la probabilità di un evento A, si è disposti a scommettere allo stesso modo sul verificarsi di (non A).
  • Informazioni: la probabilità di un evento dipende dal grado di informazioni che ha un soggetto (non esiste la probabilità in assoluto).

Approccio Bayesiano

  • La probabilità è definita come il grado di fiducia sul verificarsi di un evento. Il suo valore si modifica rispetto a una probabilità a priori in funzione dei risultati sperimentali.
  • La coerenza è garantita dal rispetto degli assiomi sulla probabilità.
  • Esistono due teorie Bayesiane:
    • Soggettiva: la probabilità a priori viene stimata in base alla fiducia del soggetto sul verificarsi dell’evento.
    • Oggettiva: la probabilità a priori viene stimata oggettivamente in base alle conoscenze note.

Per esempio, si consideri una scuola che ha il 60% di studenti maschi e il 40% di studentesse femmine. Le studentesse indossano in egual numero gonne o pantaloni; gli studenti indossano tutti quanti i pantaloni. Un osservatore, da lontano, nota un generico studente coi pantaloni. Qual è la probabilità che quello studente sia una femmina? PRO: definizione assolutamente nuova che considera la valutazione probabilistica come una scommessa sul verificarsi di un evento, e quindi come legata al grado di informazioni e alla coerenza dell’individuo che valuta.

Il paradosso Bertrand

  1. Il cerchio inscritto in un triangolo rettangolo inscritto nella circonferenza, ha il raggio pari alla metà del raggio della circonferenza cui è inscritto. Tutte le corde che hanno il punto centrale iscritto dentro il cerchio, sono più lunghe del lato del triangolo. Il rapporto tra gli infiniti punti all’interno del cerchio inscritto e gli infiniti punti al di fuori, è in proporzione all’area dei due cerchi. L’area dei due cerchi è in proporzione di 1 a 4, essendo il raggio del cerchio inscritto pari alla metà dell’altro cerchio.
  2. Un triangolo equilatero inscritto divide la circonferenza in tre aree uguali: solo un terzo delle corde è più lungo del lato.
  3. Traccio un raggio e, successivamente, tutte le corde perpendicolari a questo raggio. Le corde perpendicolari al raggio, così costruite, sono più lunghe.

Questo paradosso è stato analizzato a lungo ma ha solo tre possibili soluzioni. Non si può considerare un paradosso perché, nel paradosso, si dimostra il contrario di quello che si afferma. Questo è un ulteriore apporto alla teoria di De Finetti in quanto la probabilità è in funzione delle informazioni a disposizione, cioè di come viene posto il quesito, quindi delle informazioni che si hanno nel momento in cui la si deve individuare.

Proprietà della probabilità

  1. La probabilità di un evento impossibile è zero. Es. La probabilità di ottenere 7 nel lancio di un dado a sei facce è zero. Non è vero il contrario! Un evento che ha probabilità zero non sempre è un evento impossibile; Es. La probabilità di non ottenere nessuna testa su infiniti lanci di una moneta è zero, perché è un evento favorevole su infiniti eventi possibili, ma non è impossibile.
  2. La probabilità di un evento certo è uno. Es. La probabilità di ottenere un numero compreso fra uno e sei nel lancio di un dado è uno. Non è vero il contrario! Un evento che ha probabilità uno non sempre è un evento certo; Es. La probabilità di ottenere almeno una testa su infiniti lanci di una moneta è uno, perché è la probabilità complementare dell’evento “nessuna testa su infiniti lanci”, però non è un evento certo.
  3. La probabilità condizionata è la probabilità che avvenga A sapendo che si è verificato B. P(A|B) = Probabilità che si verifichi A sapendo che si è verificato B Es. la probabilità che avendo due figli siano entrambi maschi si ottiene calcolando P(2 maschi | 2 figli) Paradosso delle tre carte: - Qual è la probabilità che, avendo estratto una carta con la faccia rossa, essa sia bianca dall’altro lato?
  4. Eventi indipendenti: A e B sono indipendenti quando l’avverarsi di uno non influenza l’avverarsi dell’altro. Cioè: P(A|B) = p(A)
  5. Eventi disgiunti: A e B sono eventi disgiunti se il verificarsi dell'uno esclude il verificarsi dell'altro.
  6. Evento prodotto: Evento in cui si verifica sia A che B. Se A e B sono indipendenti:
  7. Evento somma: Evento in cui si verifica A o B o, se non sono disgiunti, entrambi.
  8. Evento complementare: l’evento in cui non si verifica A. (A)

Parametri statistici

Parametri descrittivi

  1. Variabili: insieme di caratteristiche rilevate su un campione di riferimento come esito di un’indagine. Servono per descrivere una realtà complessa e per poter utilizzare un test statistico. Possono essere:
    • Qualitative
    • Quantitative:
      • Discrete: misurano una quantità in maniera discreta e possono assumere solo certi valori: esempio, il numero di studenti di un corso.
      • Continue: ammettono tutti i possibili valori reali (l’altezza di un soggetto).
  2. Frequenza di un evento: il numero di volte in cui si verifica un evento. La frequenza può essere:
    • Relativa (diviso il numero totale delle possibilità, varia da zero ad un massimo di uno)
    • Assoluta (il semplice numero degli eventi), percentuale. È il tipico parametro che si utilizza in presenza di variabili discrete.
  3. Media: somma dei valori ottenuti su n diviso il numero dei soggetti n. È una buona descrizione sintetica di una realtà abbastanza complessa. Dà un’informazione riassuntiva che mi dice attorno a quale valore di riferimento oscillano i miei dati sperimentali, si chiama anche parametro di tendenza centrale, ma da sola non restituisce una buona fotografia della situazione perché è necessario sapere che variabilità c’è attorno a questa media, ovvero almeno il range, minimo e massimo.
  4. Varianza: somma degli scarti di ogni valore dal valore medio, elevati al quadrato divisa per i suoi gradi di libertà cioè il numero di valori che possono variare casualmente (N-1): uno degli N valori dev’essere tale che la somma degli scarti produca un totale uguale a zero, per questo i gradi di libertà non sono N ma N-1. Dà un’informazione sulla variabilità dei valori dei nostri dati, e pertanto è una misura dell’oscillazione attorno alla media. Si procede con la potenza al quadrato perché, se così non fosse, i valori si annullerebbero. Tuttavia, elevando al quadrato, l’unità di misura diventa il quadrato dell’unità di misura, perciò si usa spesso la deviazione standard che è, semplicemente, la radice quadrata della varianza. Nel caso i valori siano delle medie, cioè se si tratta di varianze di medie, si parla di errore standard della media. Si preferisce fornire la deviazione standard e l’errore standard della media perché è nella stessa unità di misura della variabile misurata (per es, i cm). Questo problema viene risolto utilizzando, anziché la media, il valore atteso.
  5. Valore atteso: somma dei prodotti dei singoli valori sperimentali moltiplicati per la loro probabilità. Nei casi sperimentali, corrisponde proprio alla media. Questo è possibile nel caso di variabili discrete. Nel caso di variabili continue, avendo infiniti possibili valori, non è possibile sommarli e dividerli per infinito: si passa quindi dall’utilizzo di una somma a quello di un integrale. La varianza diventa quindi il valore atteso degli scarti al quadrato. Esprime, in sostanza, il valore che mi attendo.
  6. Percentile: dà informazioni riguardo la comparazione fra un singolo valore e il valore della popolazione (globale); si utilizza nelle classificazioni. L’n-esimo percentile è il limite al di sotto del quale si trova l’n% dei casi. Es pediatria, per giudicare il peso o la lunghezza di un bambino.
  7. Mediana: è situata attorno al 50esimo percentile e rappresenta il valore al di sotto e al di sopra del quale di trova il 50% della popolazione. Esso divide la popolazione in due percentuali uguali, ma NON dà informazioni su quale valore sia più probabile.
  8. Moda: il valore di picco della frequenza. Caratterizza la distribuzione che può avere più picchi (unimodale, bimodale).

Domanda

Perché anziché la media si utilizza il valore atteso?

Anteprima
Vedrai una selezione di 7 pagine su 27
Lezioni, Statistica Psicometrica Pag. 1 Lezioni, Statistica Psicometrica Pag. 2
Anteprima di 7 pagg. su 27.
Scarica il documento per vederlo tutto.
Lezioni, Statistica Psicometrica Pag. 6
Anteprima di 7 pagg. su 27.
Scarica il documento per vederlo tutto.
Lezioni, Statistica Psicometrica Pag. 11
Anteprima di 7 pagg. su 27.
Scarica il documento per vederlo tutto.
Lezioni, Statistica Psicometrica Pag. 16
Anteprima di 7 pagg. su 27.
Scarica il documento per vederlo tutto.
Lezioni, Statistica Psicometrica Pag. 21
Anteprima di 7 pagg. su 27.
Scarica il documento per vederlo tutto.
Lezioni, Statistica Psicometrica Pag. 26
1 su 27
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/05 Statistica sociale

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher studenti.matildedicanossa di informazioni apprese con la frequenza delle lezioni di Statistica psicometrica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bologna o del prof Bolzani Roberto.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community