La statistica si divide in:
● Tradizionale
○ Descrittiva
○ Inferenziale
● Moderna
La statistica descrittiva descrive la realtà dei fenomeni collettivi
(fenomeni demografici, andamento delle temperature,...), definisce
indicatori di sintesi e metodi complessi di analisi.
La statistica inferenziale consente di riferire all’intera popolazione le
sintesi quantitative dei dati osservati su un campione.
In entrambi i casi: i dati sono gli ingredienti, i metodi matematici sono gli
strumenti.
La statistica si occupa di predisporre adeguati metodi quantitativi per
● raccogliere e organizzare
● elaborare e sintetizzare
● analizzare e interpretare
dati e informazioni utili per esaminare i fenomeni reali.
La statistica 4.0 è un insieme di metodi e sistemi di aggregazione e
visualizzazione che trasformano dati in informazioni.
I metodi statistici sono proposti e studiati per l’analisi dei fenomeni che si
manifestano in una collettività.
Con le analisi statistiche ci si propone di individuare, descrivere,
interpretare e prevedere, pur nella varietà delle singole manifestazioni, le
regolarità che sono alla base dei fenomeni.
Per conoscere e/o comprendere un fenomeno, è necessaria
l’osservazione intenzionale di una molteplicità di casi individuali.
● Unità statistica: unità elementare su cui si osservano i caratteri
oggetto di studio
● Popolazione o collettivo statistico: insieme di unità statistiche
● Campione: sottoinsieme della popolazione
● Carattere: caratteristica di interesse
● Modalità: manifestazione del carattere.
Le modalità di un carattere devono essere:
● incompatibili (no sovrapposte): la stessa unità statistica non può
essere messa in relazione (classificata) con più modalità;
● esaustive: le modalità elencate debbono rappresentare tutti i
possibili modi d'essere del carattere, così che tutte le unità
statistiche del collettivo possano essere classificate.
La statistica è divisa in:
● statistica univariata: analizza un carattere alla volta
● statistica bivariata: analizza congiuntamente due caratteri
● statistica multivariata: analizza congiuntamente più caratteri.
Una matrice di dati mostra le modalità di manifestazione dei caratteri di
ogni unità statistica.
Le operazioni di classificazione delle unità permette di ottenere tabelle e
grafici.
Una tabella di distribuzione di frequenze permette di osservare quante
volte un certo carattere si manifesta in una certa modalità. La
distribuzione di frequenze può essere rappresentata anche con un
grafico a nastri.
Le distribuzioni doppie (di frequenze) mostrano come le unità statistiche
assumano le modalità di due caratteri.
Le distribuzioni di quantità dividono una quantità di un carattere sulle
unità statistiche. Essa è rappresentabile attraverso grafici a torta.
Una serie storica mostra come un carattere abbia assunto modalità
diverse nel corso del tempo.
I caratteri possono essere:
● qualitativi (le modalità sono categorie, attributi,...)
● quantitativi (numeri)
○ discreti (numeri interi)
○ continui.
Si ottiene una scala di misura quando si fissano le modalità di un
carattere ed i criteri di appartenenza alle stesse. La scala non è parte del
carattere ma scaturisce dalla sua definizione operativa.
Una scala qualitativa può essere:
● Nominale (le modalità sono non ordinabili; confrontandole si può
dire solamente se sono uguali o diverse);
● Ordinale (le modalità sono in sequenza logica, pertanto si può dire
se una precede, è nello stesso posto o segue un’altra).
Una scala quantitativa può essere:
● ad intervalli (le modalità sono numeri riferiti ad uno zero arbitrario,
pertanto non possono essere confrontate tramite rapporto ma
solamente tramite differenza);
● di rapporti (le modalità sono numeri riferiti ad uno zero assoluto,
quindi possono essere confrontate anche tramite rapporto).
Le scale sono in un rapporto gerarchico per cui le scale ordinali hanno le
proprietà della scale nominali e sono ordinabili; le scale ad intervalli
hanno le proprietà delle scale ordinale e sono numerate; le scale ad
intervalli hanno le proprietà delle scale ad intervalli e sono rapportabili
grazie allo zero assoluto. Gli strumenti validi per le scale inferiori valgono
per quelle superiori, ma non viceversa.
Quando i dati statistici non ammettono un confronto diretto sensato è
necessario fare ricorso ad opportune elaborazioni degli stessi.
I rapporti statistici sono il rapporto tra due dati, cui almeno uno di natura
statistica.
Indicano quanta parte del numeratore spetta idealmente ad un unità del
denominatore. Servono per rendere confrontabili dati che non lo
sarebbero perché rilevati in tempi o circostanza diverse.
I rapporti di composizione, o di parte al tutto, si calcolano rapportando
l'intensità, o frequenza, parziale all'intensità, o frequenza, totale. Questi
rapporti servono a fare confronti tra fenomeni perché il rapporto
consente di eliminare influenze di circostanze.
I rapporti di densità si calcolano rapportando una circostanza
quantitativa di un fenomeno alla dimensione del campo di osservazione.
Questi rapporti servono a fare confronti tra fenomeni perché il rapporto
consente di eliminare influenze di circostanze.
I rapporti di derivazione si calcolano rapportando l’intensità, o frequenza,
di un fenomeno con l’intensità, o frequenza, di un altro fenomeno
ritenuto causa del verificarsi del primo. Questi rapporti servono a fare
confronti tra fenomeni perché il rapporto consente di eliminare influenze
di circostanze.
I rapporti statistici di coesistenza si calcolano quando interessa lo studio
relativo di fenomeni antitetici che coesistono. Si calcolano rapportando
l'intensità, o frequenza, di un fenomeno all’intensità, o frequenza, di un
fenomeno antitetico. Il rapporto di coesistenza possiede sempre un
livello critico. Se il rapporto è maggiore del livello critico, l’intensità, o
frequenza, del primo fenomeno è maggiore dell’intensità, o frequenza,
del secondo. Se il rapporto è minore del livello critico, l’intensità, o
frequenza, del primo fenomeno è minore dell’intensità, o frequenza, del
secondo. I rapporti di coesistenza informano non solo sul segno dello
squilibrio, ma anche sull’entità della differenza relativa tra i fenomeni.
I rapporti di durata e di ripetizione si calcolano in presenza di un
fenomeno che possiede un flusso in entrata e un flusso in uscita. I
rapporti di durata e di ripetizione trovano interessanti applicazione nello
studio del movimento delle merci in magazzino. In questo caso, il
rapporto di durata si calcola ponendo la consistenza media al flusso
medio mentre il rapporto di ripetizione si calcola ponendo il flusso medio
alla consistenza media. I rapporti di durata e di ripetizione hanno senso
solo se riguardano dati stazionari, ovvero che non oscillano
eccessivamente nel tempo.
I numeri indici sono un particolare tipo di rapporto statistico. Si dividono
in: ● Rapporti indici semplici (che confrontano le intensità, o frequenze,
di un unico fenomeno in tempi e luoghi diversi);
● Rapporti indici composti (che confrontano in tempi e luoghi diversi
un fenomeno che risulta dal concorso di più componenti).
I numeri indice a bassa fissa (NIbf) sono numeri indice semplici ottenuti
eseguendo il rapporto tra ogni singola osservazione xt con un termine
della serie storica xb che viene mantenuto fisso (base fissa).
Essendo numeri puri, consentono di confrontare fenomeni con diversi
ordini di grandezza.
Data una serie di indici con una base vb, è possibile passare a una
nuova base (nb) dividendo ogni numero indice per il numero indice della
nuova base rispetto alla vecchia.
L'interpretazione dei NIbf avviene attraverso la variazione relativa
tendenziale, a cui è collegato dalla relazione:
Con i numeri indice a base fissa, le intensità del fenomeno vengono
raffrontate tutte con l’intensità del tempo assunto come base. In alcune
situazioni risulta più appropriato, o più conveniente, mettere a confronto
la singola intensità con l'intensità del tempo immediatamente
precedente.
I numeri indice a base mobile (NIbm) sono ottenuti eseguendo un il
rapporto tra ogni singola osservazione xt con il termine xt-1 del periodo
immediatamente precedente, che quindi cambia ogni volta (base
mobile).
Essendo numeri puri, consentono di confrontare fenomeni con diversi
ordini di grandezza. Dati i numeri indice a base fissa, è possibile
calcolare i numeri indice a base mobile dividendo un numero indice a
base fissa al numero indice a base fissa che lo precede.
L’interpretazione dei NIbm avviene attraverso la variazione relativa
congiunturale a cui è collegato attraverso la funzione:
I numeri indice sono sempre positive, mentre le variazioni relative
possono essere positive o negative.
Spesso non è possibile utilizzare i dati originali, ma si ha a disposizione
solo i numeri indice o le variazioni relative.
Per trasformare un numero indice a base mobile in un numero indice a
base fissa bisogna moltiplicare il numero indice desiderato per tutti i
numeri indice che lo precedono.
Si chiama distribuzione statistica semplice disaggregata, o unitaria,
secondo il carattere X l’insieme delle osservazioni relative alle N unità
del collettivo.
La distribuzione di frequenze di un carattere è una tabella che mostra in
modo efficace, sintetico e in gruppi omogenei di uno o più caratteri la
distribuzione disaggregata della popolazione. Ciò richiede che si
individuino preliminarmente le modalità rispetto cui effettuare il
raggruppamento. L'aggregazione comporta sempre una perdita di
informazione: occorre operare in modo che ciò che si guadagna in
termini di efficacia della rappresentazione compensi ciò che che si perde
in termini di informazione.
La mutabile statistica nominale è una rappresentazione dei caratteri
qualitativi nominali.
Le frequenze assolute mostrano quante volte la determinata modalità si
presenta nella popolazione. Le frequenze assolute possono essere
trasformate in frequenze relative (o in frequenze relative percentuali),
per mettere in evidenza il “peso” della singola modalità sul totale.
Le frequenze relative sono rapporti di composizione (o parte al tutto),
permettono di valutare l’importanza di ogni modalità e permettono di
effettuare confronti tra popolazioni di diverse numerosità. La
distribuzione delle frequenze può essere rappresentata tramite un
grafico a torta (o a settori circolari) oppure attraverso pictogrammi (dove
le modalità sono in ordine arbitrario).
La mutabile statistica ordinale è una rappresentazione dei caratteri
qualitativi ordinali. Poiché i caratteri di riferimento sono ordinali, è
possibile calcolare delle frequenze cumulate e retrocumulate.
Le distribuzioni di frequenza di caratteri ordinale può essere
rappresentata attraverso pictogrammi ordinati secondo l’ordine naturale.
La distribuzione di frequenze può essere effettuata anche con caratteri
discreti.
Il diagramma a bastoncini, o diagramma ad aste, è un grafico dove il
punto nel piano cartesiano corrispondente alla generica coppia (xᵢ;ni) è
proiettato sull’asse delle ascisse e l’altezza del bastoncini corrisponde
alla frequenza assoluta o relativa.
Il diagramma a gradini (del cumulo) che traccia dal punto che
rappresenta la generica coppia (xᵢ;Ni) un segmento verso destra di
lunghezza pari a 1 e l’altezza del gradino corrisponde alla frequenza
assoluta o relativa cumulata.
Il diagramma a gradini (del retrocumulo) che traccia dal punto che
rappresenta la generica coppia (xᵢ;Ñi) un segmento verso sinistra di
lunghezza pari a 1 e l’altezza del gradino corrisponde alla frequenza
assoluta o relativa retrocumulata.
Quando un carattere presenta un numero elevato di modalità, è
preferibile raggruppare in classi (intervalli) incompatibile ed esaustive.
L'ampiezza (a) di una classe discreta si misura facendo la differenza fra
l’estremo superiore e quello inferiore +1.
Dato che l’operazione di raggruppamento ha compresso la tabella di
partenza, non è possibile la frequenza di ogni singola modalità.
Introducendo un'ipotesi di equidistribuzione, la frequenza di una classe
viene ripartita equamente tra le sue modalità.
La frequenza specifica è una frequenza ipotetica: rappresenta la
frequenza attribuita a ciascuna modalità della classe nell’ipotesi di
equadistribuzione; di conseguenza nsi può essere non intera. LA
frequenza specifica è un rapporto di densità, ovvero un rapporto fra la
frequenza di una classe e la dimensione della stessa.
Se il carattere è continuo (variabile statistica continua), la corrispondente
rappresentazione di frequenze deve essere rappresentata per classi di
uguale ampiezza o ampiezza diversa. L’ampiezza è uguale alla
differenza tra l’estremo superiore e l’estremo inferiore.
L’istogramma è un grafico dove è possibile leggere l’ampiezza della
classe sulle ascisse, la frequenza specifica sulle ordinate e la frequenza
assoluta della classe moltiplicando l’ampiezza per la frequenza specifica
(nell’area).
Se le classi sono di uguale ampiezza, le frequenze specifiche risultano
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.