vuoi
o PayPal
tutte le volte che vuoi
STATISTICA
La statistica analizza in termini quantitativi i fenomeni collettivi, ossia i
fenomeni il cui studio richiede l’osservazione di un insieme di manifestazioni
individuali.
Unità statistica = l’unità elementare su cui vengono osservati i caratteri
oggetto di studio, ad esempio la famiglia.
Popolazione o collettivo statistico = insieme di unità statistiche omogenee
rispetto ad una o più caratteristiche. Esiste la popolazione con lista, ad esempio
la popolazione di una città, e quella senza lista, ad esempio i cinghiali in
Maremma.
Collettivo di Stato = popolazione residente a Siena, in quanto è individuabile
in maniera esatta solo se si fissa un preciso istante di tempo.
Collettivo di empirico e teorico = se tutte le unità che costituiscono la
popolazione sono effettivamente osservabili, il collettivo è detto empirico,
altrimenti è detto teorico.
Statistica descrittiva = insieme di metodi per la raccolta, sintesi e
rappresentazione delle osservazioni.
Statistica inferenziale = studiare le caratteristiche, trarre conclusioni sulla
popolazione, osservandone solo un campione.
Rilevazione totale = se osservo il fenomeno su tutte le unità della
popolazione.
Rilevazione parziale = se osservo un sottoinsieme, un campione, di unità
della popolazione.
Variabile o carattere:
Definita come un particolare aspetto dell’unità, che è l’oggetto dell’indagine,
cioè ciò che voglio osservare, l’aspetto che mi interessa dell’unità. Le variabili
possono essere quantitative o qualitative. Un carattere può assumere modalità,
valori, differenti in corrispondenza delle diverse unità statistiche del collettivo;
le modalità devono essere esaustive, cioè le modalità elencate devono
rappresentare tutti i possibili modi di manifestarsi del carattere, e devono
essere incompatibili, se ad ogni unità si può associare una sola modalità.
Variabili qualitative:
Modalità espressa tramite attributi, possono essere sparse o sconnesse, dove
non esiste relazione d’ordine tra le modalità, oppure ordinate o ordinabili, se
c’è una relazione d’ordine tra le modalità.
Variabili quantitative:
Modalità espresse tramite numeri, possono essere discrete se assumono un
numero finito o numerabile di valori, oppure continue, se assumono infinità non
numerabili di valori, come il peso o l’altezza. Se il carattere è quantitativo,
definisce suddivisione in classi del carattere l’operazione consistente nel
suddividere l’insieme dei possibili valori in intervalli tra loro disgiunti. E’
opportuno definire le classi in modo tale che:
Il loro numero sia abbastanza piccolo da fornire una sintesi adeguata, ma
sufficientemente grande da mantenere l’informazione con un livello
accettabile di dettaglio.
Siano tra loro disgiunte.
Comprendano tutte le possibili modalità del carattere.
Abbiano, se possibile, la stessa ampiezza.
Frequenze e distribuzioni di frequenza:
Frequenza assoluta: rappresentata con nj, è il numero di volte che viene
osservata una determinata modalità cj.
Frequenza relativa: rappresentata con fj, è la proporzione di unità in cui ho
osservato cj.
Distribuzione di frequenza: è la distribuzione di frequenza assoluta.
Frequenza assoluta cumulata: numero di osservazioni inferiori o uguali a cj.
Frequenza relativa cumulata: somma di frequenze relative.
Moda, mediana, media ed altri concetti:
Moda: è la modalità, o valore, a cui è associata la frequenza più alta.
Mediana: la mediana è il valore centrale, quello che si trova nel mezzo, tra i
dati numerici.
Media: è pari alla somma dei valori osservati divisa per il loro numero.
Campo di variazione: intervallo i cui estremi sono il valore più piccolo e più
grande, dove si verificano le nostre osservazioni.
Media ponderata: è una media in cui tengo conto del peso dei valori.
Proprietà della media:
1. La media è un valore interno al campo di variazioni.
2. La somma degli scarti dalla media è uguale a 0.
3. La somma dei quadrati degli scarti dalla media è minore uguale alla somma
degli scarti al quadrato dei valori xi da una costante c.
4. La media aritmetica di un carattere y, ottenuto attraverso una
trasformazione lineare y=a+bx di un carattere x, con una determinata
media X, è uguale a Y=a+bX.
5. Se un collettivo di n unità statistiche viene suddiviso in L sottoinsiemi, la
media aritmetica generale si può ottenere con la media ponderata delle
medie dei sottoinsiemi con pesi uguali alle loro numerosità.
Variabilità:
Quando ci sono osservazioni diverse, dipende dal numero dei valori distinti e
dalla frequenza. Tendenza delle unità ad assumere valori diversi dalla variabile.
Vale 0 quando tutte le osservazioni sono uguali, mentre aumenta all’aumentare
della diversità dei valori assunti dalla variabile.
Varianza:
E’ la media dei quadrati degli scarti dalla media; è uguale a 0 quando tutte le
osservazioni sono uguali ed aumenta quando aumenta la variabilità. Dipende
dall’unità, e l’unità di misura in questione è il quadrato delle unità di misura
originali; è espressa nell’unità di misura al quadrato.
Varianza within: media delle varianze dei gruppi, è l’indice della variabilità
all’interno dei gruppi.
Varianza between: varianza delle medie di gruppo, è l’indice di variabilità tra
i gruppi. Indici a più variabili
Dipendenza:
Y dipende perfettamente da X se per ogni modalità o valore della X corrisponde
una sola modalità o valore della Y.
X dipende perfettamente da Y se ad ogni valore della Y corrisponde una sola
modalità della X.
Indipendenza:
Qualunque sia la modalità con cui si manifesta Y la distribuzione relativa
condizionata di X non cambia. Se X è indipendente da Y, allora è vero
viceversa.
Indipendenza in media:
Y è indipendente in media da X, se tutte le medie condizionate da Y sono fra
loro uguali ed uguali quindi alla media marginale.
Interdipendenza:
Si ha interdipendenza quando Y dipende perfettamente da X, ed X dipende
perfettamente da Y contemporaneamente. Se ad ogni modalità di uno dei due
caratteri corrisponde una ed una sola modalità dell’altro carattere e viceversa.