vuoi
o PayPal
tutte le volte che vuoi
RISPOSTE DOMANDE ORALI STATISTICA
1. Tipi di campionamento
Attraverso i vari tipi di campionamento si va a selezionare il campione, ossia un
insieme di unità statistiche appartenenti alla popolazione.
Ogni qualvolta che si compie un’indagine statistica è importante selezionare un
campione che possa rappresentare un’immagine fedele della popolazione da cui
deriva.
La costruzione di un campione può avvenire in modo:
Non causale, se alcuni gruppi o individui hanno una maggiore probabilità di
essere selezionati rispetto agli altri. È un tipo di campionamento che si basa
sulla conoscenza del fenomeno da parte di chi pianifica l’indagine.
Casuale, se tutte le unità statistiche hanno la stessa probabilità nota e non
nulla di essere selezionate (è garantita la rappresentatività).
Casuale semplice, se tutti gli individui hanno la stessa probabilità di
o essere inseriti nel campione, probabilità che è 1/n dove n è la dimensione
della popolazione.
Sistematico, se data la lista dell’intera popolazione i soggetti sono scelti
o mediante l’uso di un “passo” k. 1/k è detto passo del campionamento,
ossia ogni quanti soggetti ne scelgo uno.
Opportunistico, campione formato da volontari, non ho la certezza che
o rispecchi la popolazione, vi è una distorsione.
Probabilistico, se i soggetti non hanno la stessa probabilità di essere
o scelti ma tale probabilità è nota.
Stratificato, campionamento utilizzato per mantenere fissa una certa
o variabile. Selezioni i soggetti avendo come prerequisito la variabile che
voglio mantenere.
A cluster, se non campiono soggetti ma gruppi in cui i soggetti sono
o divisi.
~ A uno stadio, se campiono i gruppi
~ A due stadi, se campiono ulteriormente i soggetti all’interno dei
gruppi.
2. Tipi di variabili
La variabile è un particolare aspetto dell’unità statistica oggetto di osservazione.
Le variabili sono distinte in:
Qualitative, espresse da attributi o espressioni verbali, non rappresentabili da
numeri aventi effettivo significato numerico.
~ Ordinabili, se è possibile ordinarle in sequenza (es. grado di istruzione).
~ Nominali, se non è possibile individuare un ordine di successione (es.
professione).
˞ Dicotomiche, se vi sono solo due possibili aspetti della variabile
(es. sesso)
Quantitative, esprimibili attraverso numeri con vero significato di numero, sono
dunque misurabili.
~ Discrete, sono variabili che non ammettono l’uso della virgola (es.
numero di figli).
~ Continue, sono variabili che ammettono l’uso della virgola (es. altezza di
una persona).
3. Tipi di grafici
Il grafico è uno strumento usato per rappresentare i dati statistici in modo immediato
e semplificato.
˞ Grafico a Torta – qualitative nominali
Si ha un cerchio che può essere bidimensionale o tridimensionale in cui vengono
rappresentante mediante l’uso di spicchi colorati: l’ampiezza dello spicchio è
proporzionale al dato rappresentato e il colore distingue i due dati. Nella legenda viene
associato il colore alla variabile.
˞ Diagramma a colonne staccate – qualitative ordinali (o quantitative discrete)
Fissato un sistema di riferimento cartesiano sull’asse delle X si hanno le diverse
categorie mentre sull’asse delle Y la frequenza ASSOLUTA. Si costruiscono poi
rettangoli di base fissa e altezza relativa alla frequenza. Permette di ordinare
direttamente sull’asse delle X le variabili.
˞ Diagramma a barre verticali – quantitative discrete
Fissato un sistema di riferimento cartesiano si pongono sull’asse delle X le modalità
della variabile considerata mentre sull’asse delle Y la frequenza Assoluta. Si traccia poi
in corrispondenza della modalità la relativa frequenza.
˞ Istogramma – quantitative continue (Nb classi)
Fissato un sistema di riferimento cartesiano di pongono sull’asse delle X ho i valori,
sull’asse delle Y la frequenza RELATIVA. L’area di ogni barra deve essere proporzionale
alla numerosità dei soggetti.
˞ Piramide dell’età
Deriva dall’unione di due istogrammi verticali uniti. Sull’asse delle X si pongono le
frequenze percentuali mentre sull’asse delle Y si pongono le fasce di età. Inoltre a
metà dell’asse delle X vi è una retta i corrispondenza proprio dello zero che divide i
soggetti maschi dai soggetti femmine. È molto utile quando si studiano le popolazioni.
˞ Serie storiche
Grafico per la misurazione di una stessa variabile (espressa come media, percentuale
ecc.) misurata in momenti diversi.
˞ Diagramma cartesiano
Espressione grafica della serie storica: si pone sull’asse delle X gli anni, sull’asse delle
y i valori. Si segnano i punti corrispondenti per ogni anno e si uniscono.
˞ Serie territoriali
Permettono la misurazione di una stessa variabile allo stesso tempo in luoghi differenti
mettendo in correlazione il luogo e il valore.
˞ Cartogramma
Rappresentazione grafica della serie territoriale. Su una cartina della zona di interesse
vengono rappresentate con lo stesso colore le zone che appartengono alla stessa
categoria (di solito si usano diverse tonalità di uno stesso colore; si usa il colore più
pallido per la categoria minore e quello più scuro per la categoria maggiore. È
importante chiarire la legenda associando a ogni grado di colore la classe o il valore
corrispondente.
˞ Diagramma a dispersione
Rappresentazione contemporanea di due variabili QUANTITATIVE, ci spiega come si
comportano le due variabili nello stesso momento: sui due assi si pongono le due unità
statistiche e si legge il grafico nei due sensi.
˞ Grafico a scatole e baf
Grafico che illustra come funziona la distribuzione: formato da un asse e una scatola.
La scatola è delimitata inferiormente dal primo quartile e superiormente dal terzo
quartile, la metà è definita dalla media; le dimensioni della scatola mi danno l’idea
della distribuzione dei valori, più la scatola è piccola più i valori saranno concentrati in
un certo punto. La barra è delimitata da due baf che sono due cancelli che mi danno
il valore massimo e quello minimo. Il cancello superiore è dato dal terzo quartile più
una volta e mezzo ____; il cancello inferiore è dato dalla differenza tra il primo quartile
e una volta e mezza il range interquartile (terzo quartile – primo quartile).
Se tutti i valori stanno entro i due cancelli disegno il grafico con il massimo e il
minimo. Se invece vi sono alcuni valori che vanno al di fuori di questi cancelli mi trovo
in presenza di outliers, ossia di valori che non fanno parte della normale distribuzione,
se mi trovo in presenza di outliers i baf vengono messi ai penultimi valori e gli
outliers rappresentati come pallini oltre i baf. Devo sempre considerare se ha senso
che questi outliers ci siano e se devo considerarli; è anche un modo per individuare
eventuali errori.
˞ Screen Plot?
4. Definizione di media analitica
La media analitica è un indice di posizione che mi permette di sintetizzare in modo
opportuno i miei dati, mi permette di effettuare confronti immediati tra distribuzioni.
Questa è una funzione che se applicata ai miei valori me ne restituisci uno
rappresentativo dell’insieme.
5. Proprietà fondamentali della media aritmetica
Le proprietà fondamentali della media aritmetica sono 5 (le prime due valgono SOLO
per la media aritmetica):
Somma degli scarti, la somma algebrica degli scarti vale sempre 0.
*Scarto = differenza tra il singolo valore e la media.
Somma dei quadrati degli scarti, la somma del quadrato degli scarti rispetto alla
media è il valore minore che posso ottenere; ripetendo lo stesso calcolo con
qualsiasi altro valore otterrei un risultato maggiore di quello ottenuto calcolando
lo scarto rispetto alla media.
Traslativa, se sommo a ogni valore osservato un certo numero “b” e calcolo la
media con i nuovi valori, otterrò come media un valore pari alla media ottenuta
con i valori osservati più un certo valore b.
Omogeneità, se moltiplico ogni valore per un certo numero “a” e calcolo la
media con i valori ottenuti dalla moltiplicazione, otterrò una media M che non è
altro che la media che avrei avuto considerando i singoli valori moltiplicata per il
numero “a”.
Per queste due proprietà posso definire la media come operatore lineare.
Associativa, se considero un gruppo di diversi insiemi, ognuno formato da n
elementi e voglio conoscere la media del gruppo, per questa proprietà la media
generale sarà la somma delle medie di ogni gruppo, moltiplicate ognuna per la
propria numerosità, e divisa per il numero dei gruppi.
6. Motivi di scelta dei vari valori di tendenza centrale
I valori di tendenza centrale (o indici di posizione) sono valori rappresentativi di una
distribuzione; sintetizzano i dati quantitativi rilevati con un unico valore e possono
essere utilizzati per confronti immediati tra distribuzioni. La scelta del valore viene
fatta in base alla tipologia del problema e in base all’informazione dei dati. Gli indici si
dividono in due categorie medie analitiche e medie lasche.
Tra le medie analitiche si hanno:
- Media aritmetica - lascia invariata la somma dei termini.
Si usa la media aritmetica per determinare un valore che esprima un concetto di equi
distribuzione quando, per esempio, si vuole determinare una media delle spese, dei
consumi, dei redditi, delle temperature. Si applica pure la media aritmetica, per le
proprietà dei suoi scarti, per determinare il valore più preciso di una serie di misure,
purché gli errori di misurazione siano accidentali e non sistematici (in pratica dovuti
agli strumenti); inoltre si applica la media aritmetica se i dati si succedono circa in
progressione aritmetica.
- Media geometrica – lascia invariato il prodotto
La media geometrica è utilizzata per determinare il tasso medio di accrescimento (o di
decremento) di un fenomeno, i tasso d'interesse medio di più tassi nella
capitalizzazione composta, oppure per determinare una media nei cambi monetari. La
media geometrica si utilizza pure quando i dati si susseguono in progressione
geometrica.
- Media armonica – lascia invariata la somma dei reciproci dei termini
La media armonica è applicata quando si vuole conoscere un valore medio utilizzando
i valori reciproci di un altro carattere, come nel caso del potere di acquisto della
moneta.
- Media di potenze (la quadratica lascia invariata la somma dei quadrati dei
termini).
La media quadratica