vuoi
o PayPal
tutte le volte che vuoi
TEORIA STATISTICA
- Unità statistica, singola unità elementare su cui vengono osservati i caratteri.
- Collettivo o popolazione, insieme di riferimento del fenomeno, è costituito da tutte le unità statistiche. Si dice empirico se le unità sono osservabili, altrimenti si dice teorico.
Distinguiamo tra: collettività di casi singoli, fenomeni relativi a singole osservazioni di insiemi di elementi; collettività di osservazioni, fenomeni relativi a più osservazioni di uno stesso elemento; collettivi di stato, fenomeni individuabili in maniera esatta solo se si fissa un preciso istante di tempo(nascite.); collettivi di movimento, fenomeni individuabili con riferimento ad un periodo di tempo.
Carattere o variabile, ogni caratteristica elementare oggetto di rilevazione. Può essere classificato in base alla natura che può assumere come:
- Carattere qualitativo, si manifesta nel caso di modalità espresse tramite espressioni verbali e si può suddividere come: retinilineo (se esiste un ordine naturale delle modalità) e sconnesso (non esiste un ordine).
- Carattere quantitativo, nel caso in cui le modalità sono espresse con numeri, si suddividono come: discreto (le modalità possono essere messe in corrispondenza biunivoca con i sottinsieme nei numeri interi)tipicamente conteggi, continuo (corrispondenza biunivoca con l'insieme dei numeri reali)tipicamente grandezza fisiche (può inoltre essere racchiuso in classi), e trasferibile, nel caso in cui la sua intensità può essere trasferita da un collettivo all'altro.
Modalità, diversi modi in cui si manifesta un carattere:
- Rilevazione statistica, insieme delle operazioni richieste per la raccolta di dati necessari all'indagine, a seconda del metodo si divide come: sperimentale(possibilità di controllare le condizioni in cui si svolge l'esperimento e le sue variazioni), osservazionale (si osserva la realtà indirettamente), rilevazione totale (si ricavano i caratteri di tutte le unità del collettivo) e parziale (si osserva un campione estratto casualmente o randomizzazione).
- L'informazione raccolta attraverso la rilevazione statistica può essere sintetizzata in una matrice dati, ogni colonna della matrice costituisce una distribuzione disaggregata o unitaria secondo un singolo carattere, ovvero un elenco unità per per unità. Nel caso si considerino più caratteri insieme avremo una distribuzione multipla.
- Per sintetizzare l'informazione della distribuzione aggregata si utilizza una distribuzione per frequenza, costruita associando a ciascuna delle modalità la relativa frequenza assoluta (N).
L'operazione di suddivisione in classi di un carattere quantitativo consiste nel suddividere l'insieme dei possibili valori in intervalli tra loro disgiunti.
Le classi devono essere: esaustive(comprendere tutte le modalità), esclusive (devono essere fra loro disgiunte in modo che ogni modalità possa essere attribuita ad una sola classe), devono avere un'ampiezza adeguata che può essere uguale o diversa tra loro.
Le classi reali si hanno nel caso in cui l'estremo sia chiuso a dx e quindi coincida con quello successivo. Nel caso di estremi non coincidenti si effettua una correzione per continuità.
Nel caso di distribuzione di frequenza di un carattere qualitativo si utilizzano i grafici a barre e torta. Nel caso invece di un carattere quantitativo si utilizzano i diagrammi a barre e i diagrammi a linee. Infine nel caso di un carattere quantitativo suddiviso in classi si utilizza l'istogramma (l'area di ogni rettangolo corrisponde alla frequenza della classe).
Le medie permettono di sintetizzare una distribuzione sulla base di un valore. Si suddividono come:
- Medie analitiche, calcolate tramite operazioni algebriche sulle modalità della distribuzione, si riferiscono solo a caratteri quantitativi e sono media aritmetica, geometrica e quadratica.
- Medie di posizione, non richiedono operazioni algebriche sulle modalità e si riferiscono sia a caratteri quantitativi sia a caratteri qualitativi retinilinei. Sono identificate in moda, (modalità del carattere che si presenta con la massima frequenza o densità), mediana(identificata come quella modalità del carattere che divide il collettivo in due gruppi).
di uguale numerosità) e percentili (identificati come quei valori che suddividono la distribuzione in 100 parti di uguale numerosità).
- L'operazione di suddivisione in classi comporta una perdita di informazioni in quanto non si conosce più con esattezza la modalità di ogni unità statistica.
- La variabilità di una distribuzione esprime la tendenza delle unità di un collettivo ad assumere diverse modalità del carattere.
- Un indice di variabilità deve assumere il valore minimo(0) se e solo se tutte le unità della distribuzione presentano la stessa modalità, inoltre deve aumentare in maniera proporzionale alla diversità delle modalità del carattere.
- Gli indici di variabilità possono essere basati su:
- Scostamenti da una media, vi rientrano varianza (è la media degli scarti al quadrato della media aritmetica), deviazione standard (è la media quadratica delle quantità e quindi è interpretabile come distanza media dei termini dalla media aritmetica) e coefficienti di variazione (non risente dell'unità di misura del carattere)
- Differenze tra statistiche d'ordine, vi rientrano campo di variazione e differenza interquartile
- La concentrazione sussiste nel caso di carattere quantitativo trasferibile, questo si dice equidistribuito se ognuna delle unità possiede una delle quote del carattere, nel caso ciò non si verifichi allora sussiste un certo grado di concentrazione. La massima concentrazione si ha nel caso in cui solo una unità del collettivo possieda tutte le quote del carattere.
- Indice di concentrazione di Gini, l’indice R cresce in maniera proporzionale al crescere del livello di concentrazione ed è sempre compreso tra 0 ( equidistribuzione) e 1 (massima concentrazione).
- La rappresentazione grafica della concentrazione si ottiene dalla Curva di Lorenz in cui maggiore è l’area tra la curva e la bisettrice maggiore , maggiore è la concentrazione.
- Una distribuzione di frequenza è simmetrica se la media aritmetica è uguale alla mediana; è asimmetrica positiva se (graficamente sono più frequenti le modalità più piccole) la media aritmetica è maggiore della mediana; infine è asimmetrica negativa se (graficamente sono più presenti le modalità più grandi ) la media aritmetica è minore della mediana.
- L’indice di frequenza più utilizzato è l’indice di Fisher il quale assume valori positivi in caso di asimmetria positiva e valori negativi in caso di asimmetria negativa; nel caso di perfetta asimmetria assume valore = 0.
- La standardizzazione è un processo di trasformazione dei dati che induce qualunque variabile ad avere media nulla e varianza unitaria
- I rapporti statistici costituiscono la forma più elementare di elaborazione dei dati statistici e hanno l’obiettivo di agevolare l’interpretazione e agevolare le grandezze. Si dividono in:
- Rapporti di composizione, servono a studiare come l’ammontare di un carattere si distribuisce tra le varie classi o modalità del carattere.
- Rapporti di coesistenza, mettono a rapporto le quantità di due diverse modalità di uno stesso fenomeno.
- Rapporti di derivazione, rapporti tra l’ammontare di un fenomeno di movimento relativo ad un intervallo di tempo e la consistenza di un fenomeno di stato da cui deriva.
- Rapporti di densità, sono rapporti tra la frequenza di un certo fenomeno rispetto alla dimensione del campo in cui viene osservata.
- si definiscono serie storiche una successione temporale di dati statistici omogenei; per studiarle più approfonditamente le variazioni che subisce un fenomeno tra un periodo e l’altro si utilizzano i numeri indici
- Numeri indici complessi , consentono di affrontare il problema della misurazione della variazione media di un insieme di grandezze dal tempo t al tempo b ; i principali sono : indice prezzi al consumo , indice armonizzato e indice dei prezzi alla produzione .