Considerazioni sul metodo statistico
La statistica tratta caratteri, ossia aspetti della realtà osservabili e variabili, nel senso che questi caratteri possono assumere espressioni differenti. I caratteri devono poter essere rilevati sui soggetti che li esprimono, che identifichiamo come unità statistiche, le quali devono appartenere a una collettività. Le scienze umanistiche sono classificabili ed individuabili come espressione di fenomeni reali che investono l’individuo in quanto essere sociale in continua evoluzione e trasformazione.
Ciò che caratterizza un fenomeno reale è la replicabilità ed ogni volta che si replica individuiamo una unità di replica ossia un nuovo individuo sul quale andiamo ad osservare le caratteristiche di uno specifico fenomeno reale. L’insieme di tutte le repliche andrà a costituire il collettivo o popolazione su cui il fenomeno si manifesta.
Gli scopi della statistica sono sintetizzare e generalizzare. Nel primo caso ci si focalizza nel predisporre i dati raccolti in una forma che consenta di comprendere meglio il fenomeno rispetto ai quali è stata eseguita la rilevazione. Nella sintesi viene incontro all’esigenza di semplificare che a sua volta deriva dalla limitata capacità della mente umana di gestire informazioni articolate, complesse o multidimensionali. Nella sintesi intendiamo il valore più rappresentato di una distribuzione, ossia fra tutte le repliche quella che ti aspetti sia la più frequente.
I metodi orientati a soddisfare questa finalità appartengono alla statistica descrittiva. Il secondo scopo della statistica è quello di estendere il risultato dell’analisi effettuata sui dati di un gruppo limitato di unità statistiche all’intera collettività di appartenenza. Il metodo statistico ha come obiettivo lo studio della distribuzione del fenomeno reale attraverso una sintesi, una variabilità e una forma.
Variabilità e forma
Con il termine variabilità ci riferiamo al processo che indica la differenza di atteggiamenti rispetto al valore di sintesi ossia il modo in cui si comportano le nostre unità statistiche in riferimento al valore espresso dalla sintesi, mentre con forma, indichiamo il modo in cui sono distribuiti i dati e ci dice se la variabilità è rivolta più a valori alti o bassi rispetto alla sintesi. La forma quindi, ci consente di rappresentare graficamente di disegnare il nostro collettivo e di verificare se possa essere modellato attraverso un modello matematico economico, statistico, ecc.
Concetti base del linguaggio statistico
I concetti che sono alla base del linguaggio statistico includono fenomeno reale, collettivo, unità statistica, carattere e modalità. Alla base della valutazione dobbiamo porre il concetto di misura, ossia un criterio convenzionale che stabilisca un valore quantitativo o qualitativo da assegnare ad un’unità d’osservazione che sia invariante nel tempo e nello spazio.
La misurazione di un fenomeno deve essere oggettiva, ripetibile e convertibile. Quando ci riferiamo all’osservazione di un fenomeno reale ci ricolleghiamo al concetto di unità statistica di osservazione che viene definito come un oggetto o soggetto su cui si vuole effettuare una valutazione in relazione a uno specifico fenomeno reale. L’unità statistica rappresenta l’unità elementare su cui vengono osservati i caratteri oggetto di studio intendendo per caratteri gli aspetti della realtà osservabili.
Ciascuna unità del collettivo è identificabile da una serie di caratteristiche necessarie ai fini della valutazione del fenomeno reale che si vuole studiare. In statistica le diverse caratteristiche che sono osservabili su ciascuna unità del collettivo preso in esame vengono identificate con il termine carattere, a ciascun carattere viene assegnato un criterio di misura che sarà associato ad ogni unità del collettivo. Il modo con cui tale misura si manifesta sull’unità si chiama modalità.
Riassunto dei concetti principali
- Fenomeno reale: ad esempio, andamento corso di studi degli studenti di una facoltà.
- Collettivo o popolazione: tutto l’insieme degli studenti iscritti a quella determinata facoltà.
- Unità statistica: ognuno degli studenti.
- Carattere: tutte le caratteristiche che vogliamo osservare di ogni unità statistica.
- Modalità: è riferita ai caratteri osservati, es. il sesso si può esprimere con “maschio” o “femmina”, l’età con modalità diverse rappresentate da numeri, ecc.
Classificazione dei caratteri statistici
Un fenomeno reale oggetto di osservazione ed indagine presenta una serie di caratteristiche che devono essere misurate in maniera corretta. I caratteri si dividono in quantitativi quando le modalità sono esprimibili in misura numerica mentre saranno qualitativi quando le modalità sono attributi, ossia espressioni variabili in genere aggettivi che hanno la funzione di esprimere un giudizio sul carattere che si vuole misurare.
Un carattere si definisce variabile quando le sue modalità si esprimono con caratteri quantitativi ossia tramite numeri reali mentre si definisce mutabile, oppure variabile qualitativa se le sue modalità si esprimono con attributi aggettivi. La classificazione di un carattere in variabile o mutabile ci dà l’immediata percezione che i caratteri non possono essere trattati allo stesso modo quando si affronta il problema della loro misurazione.
I caratteri qualitativi possono essere distinti, in relazione alle loro specifiche caratteristiche, in sconnessi quando le modalità delle quali possono essere misurati non sono ordinabili o in ordinabili quando sono misurati attraverso un attributo che esprime la qualità la performance, il gradimento, per il quale si può stabilire un ordine. Possono ulteriormente essere distinti in discreti, quando sono misurabili con numeri finiti entro un intervallo di variazione ossia numeri naturali; o continui se comunque si fissino due valori entro l’intervallo in cui il carattere è osservabile, tutti i valori intermedi possono essere assunti come modalità del carattere.
La misura di un carattere qualitativo
Un carattere quantitativo è esprimibile, quindi, attraverso modalità numeriche, ma occorre fare un’ulteriore precisazione poiché non tutti i caratteri quantitativi presentano le medesime caratteristiche. Un carattere quantitativo esprimibile con i numeri naturali si definisce, in statistica, variabile discreta. Un carattere quantitativo esprimibile con l’insieme dei numeri reali, quindi si definisce in statistica variabile continua.
I caratteri quantitativi, possono essere classificati in: rettilinei quando le modalità sono disponibili su un asse orientato, ossia con modalità numeriche che hanno un origine di riferimento; o ciclici quando l’origine delle modalità coincide con l’ultima.
Errore accidentale e errore sistematico
L’errore accidentale è incontrollabile ed è ritenuto essere di media zero, nel senso che in prove ripetute esso si annulla presupponendo che lo stesso sia una volta in eccesso e un’altra in difetto. L’errore sistematico è sicuramente più grave e sta ad intendere che per cause da accertare la misura tende ad essere prevalentemente in eccesso o in difetto conducendo il rilevatore ad errore certo.
La misura di una variabile latente
Le variabili latenti sono tipi di variabili non direttamente osservabili in quanto rappresentano concetti molto generali o complessi. Quando vogliamo definire una variabile latente diamo, alla nostra definizione un’accezione negativa poiché diciamo che una variabile latente è una variabile non direttamente osservabile e misurabile in quanto manca di una origine e di un intervallo di misurazione.
Intuitivamente possiamo dire che questo tipo di variabili possono essere misurate e osservate tramite variabili osservabili direttamente, le quali possono essere aggregate in un modello per rappresentare in modo esplicito una data teoria. Le variabili latenti possono essere pensate come la rappresentazione di osservazioni su un fenomeno reale e sulle correlazioni di dati osservabili nell’ambiente. Il passaggio delle variabili osservate a quelle latenti non è un processo banale e richiede una particolare attenzione considerando il fatto che gli indicatori osservabili sono solo approssimazioni dei costrutti latenti.
La misurazione dell’incertezza: la probabilità
Lo strumento di misura che ci consente di valutare l’incidenza con la quale si può verificare un evento è il calcolo della probabilità. L’approccio corretto è quello di descrivere un fenomeno reale i cui risultati siano incerti tramite una misura quantitativa chiamata variabile casuale con una specifica distribuzione di probabilità. Tale distribuzione sarà chiamata modello decisionale; nel senso che può essere utilizzata per assumere decisioni sulla base di una valutazione quantitativa.
Il formatore deve essere in grado di riscrivere il problema reale attraverso una o più misure espresse su scala quantitativa purché ad ogni scelta sia associabile un valore numerico corrispondente alle modalità della variabile scelta, su questi presupposti si sviluppano i concetti di calcolo delle probabilità, ossia della disciplina che fornisce gli elementi formali per trattare in modo corretto il processo logico dei modelli di decisione in condizioni di incertezza.
Il calcolo delle probabilità
- L’esperimento casuale (o prova del gioco): ogni fenomeno reale può essere visto come una partita. Per ogni gioco si precisano le regole da rispettare.
- Gli eventi: I risultati sono eventi. L’insieme degli eventi è chiamato spazio degli eventi.
- La misura degli eventi: se il risultato è incerto abbiamo bisogno di una misura della sua incertezza.
Lo spazio degli eventi
Lo spazio degli eventi può essere costituito da un numero finito di eventi, in tal caso diremo che lo spazio è discreto o da infinito di eventi, in tal caso diremo che lo spazio è infinito. Ogni risultato possibile è detto evento elementare cosicché l’insieme di tutti gli eventi elementari definisce lo spazio degli eventi.
Le operazioni tra gli eventi necessitano di un’algebra le cui operazioni elementari sono:
- Definiamo evento complementare dell’evento A, che indichiamo con A, l’insieme di punti di Ω che non appartiene all’evento A.
- Siano A e B due eventi di Ω definiamo evento unione e lo indichiamo con C = A ∪ B l’insieme dei punti di Ω che appartengono o all’evento A, ossia C = dove con x abbiamo indicato un punto qualsiasi dello spazio degli eventi Ω.
- Due eventi di Ω, A e B sono incompatibili o disgiunti se non hanno elementi in comune, ovvero quando la loro intersezione è l’insieme vuoto.
- Siano A e B due eventi di Ω definiamo l’evento differenza e lo indichiamo con C = B - A l’insieme costituito dai punti di B che non appartengono ad A.
La probabilità
Una volta definito lo spazio degli eventi aleatori si rende necessario introdurre una misura dell’incertezza. Indicheremo la probabilità con la lettera P e indicheremo tra parentesi l’evento a cui la probabilità si riferisce. In tal modo P(x) = 1 indicherà che l’evento x è sicuro (certo) e P(x) = 0 che l’evento x è impossibile.
Concezioni della probabilità
La concezione classica interpreta la probabilità come un semplice rapporto. Indicando con n il numero dei possibili risultati a priori con uno dei quali un gioco di sorte deve necessariamente terminare, e con m il numero di quelli favorevoli all’evento prefissato, la probabilità che questo si verifichi trova il suo significato nel rapporto m/n nell’ipotesi che gli n risultati siano fra loro equi possibili.
La concezione frequentista interpreta la probabilità sulla base dell’esperienza che si acquisisce con l’osservazione della frequenza relativa osservata. È un concetto applicabile a esperimenti e osservazioni che possono essere replicati un gran numero di volte in condizioni uniformi. I possibili risultati sono caratterizzati da frequenze relative che, tendono a stabilizzarsi ad una costante p che non potrebbe essere un valore dell’intervallo [0,1].
La concezione soggettivista identifica la probabilità nel grado di fiducia che un individuo ha nel verificarsi di un evento. Questa concezione ha nel soggetto il punto di riferimento. Naturalmente il soggettivismo non ammette che le valutazioni siano arbitrarie o irragionevoli: esse devono tenere conto di tutte le circostanze note.
Tutte le possibili impostazioni delle probabilità possono essere riassunte in un’unica teoria delle probabilità proposta da Kolmogorov detta impostazione assiomatica, dove la teoria della probabilità viene formulata sulla base di alcuni assiomi.
Assiomi di Kolmogorov
- Assioma 1: Gli eventi dello spazio formano un’algebra di Boole completa.
- Assioma 2: La misura delle probabilità di un evento è unica.
- Assioma 3: Principio della misura: la misura della probabilità di un evento è sempre non negativa P(A) ≥ 0.
- Assioma 4: La probabilità dell’evento certo è uguale a 1.
- Assioma 5: Principio delle probabilità totali per eventi incompatibili: siano A e B due eventi incompatibili nello spazio Ω, nel senso che A ∩ B = 0 allora P(A ∪ B) = P(A) + P(B). Il principio delle probabilità totali per eventi incompatibili può essere esteso a più di due eventi.
La probabilità condizionata
Uno dei concetti più importanti è la probabilità condizionata. Parliamo di quest’ultima quando siamo interessati alla probabilità di un evento il cui risultato è influenzato da un altro evento detto condizionante. Con P(A ∩ B) = P(A)P(B) indichiamo il principio delle probabilità composte per eventi indipendenti. Diremo che due eventi A e B entrambi appartenenti allo spazio Ω sono stocasticamente indipendenti se per essi vale il principio delle probabilità composte per eventi indipendenti.
Il teorema di Bayes
Il teorema di Bayes (conosciuto anche come formula di Bayes o teorema della probabilità delle cause), proposto da Thomas Bayes, deriva da due teoremi fondamentali delle probabilità: il teorema della probabilità composta e il teorema della probabilità assoluta. Viene impiegato per calcolare la probabilità di una causa che ha scatenato l'evento verificato. Un evento A di Ω si può esprimere come: A = A ∩ Ω = A ∩ (U U U U, …, UU) e la formula di Bayes sarà i P(A|Ui)P(U|A).
Le variabili casuali
Il concetto di probabilità può essere schematizzato nella terna (Ω, B, P, A) dove con Ω = (w1, w2, ...) il concetto di variabile casuale è una variabile quantitativa che associa a ogni elemento w dello spazio Ω un numero reale. Le variabili sono classificate in due grosse categorie: Discreta cioè costituite da un numero finito o infinità numerabile di valori e Continua ovvero costituite da un numero infinito di valori compresi in un intervallo di ampiezza finita o infinita.
Le variabili casuali discrete
I valori di una variabile casuale sono numeri reali legati al risultato di un esperimento aleatorio; una variabile casuale X è sempre accompagnata dalla sua funzione di probabilità P(x). Questa corrispondenza tra valori di X e probabilità definisce la distribuzione di probabilità di X.
Le variabili casuali continue
Una variabile casuale X è continua se esiste una funzione f(x) tale che: f(x) = P(x ≤ X ≤ x+dx per ogni x. La funzione f viene chiamata funzione di densità di probabilità di X.
Variabili casuali bi-dimensionali
La coppia di fenomeno trova la sua interpretazione nella funzione reale misurabile (X, Y) definita a partire dallo spazio probabilistico. Tale funzione per ogni w in Ω identifica nel piano reale R un punto di coordinate (x, y). Una coppia di variabili casuali semplici definisce una variabile casuale doppia. Tale v.c. è discreta se X e Y sono discrete, continua se X e Y sono continue, mista se una v.c. è di tipo discreto e l’altra è di tipo continuo.
Momenti delle variabili casuali
Si rende necessario disporre di uno strumento operativo per lo studio di dette distribuzioni di probabilità. A tal proposito introduciamo il calcolo dei momenti. Questi ultimi hanno la capacità di caratterizzare ogni singola distribuzione di probabilità negli aspetti più essenziali. I momenti ci permettono di definire dei parametri o delle grandezze caratteristiche di una distribuzione di probabilità, i quali hanno la capacità di riassumere in modo immediato e sintetico l’informazione relativa alla distribuzione.
Mentre per una v.c. discreta si definisce momento centrato di ordine r un’origine arbitraria a l’espressione: E[(X – a)r] = μr(a). Quale origine arbitraria viene assunto il momento primo dall’origine ossia la media μ o anche alla mediana o la moda. L’asimmetria è la valutazione del comportamento che ha una distribuzione di probabilità rispetto a un punto di simmetria che spesso è identificato con μ. La curtosi è la valutazione...
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Riassunto statistica
-
Statistica riassunto
-
Riassunto esame Statistica, prof. Di Battista
-
Riassunto Statistica medica