Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
STATISTICA
Cos'è?
E' l'insieme delle procedure operative e delle metodologie quantitative che sono necessarie per raccogliere ed elaborare i dati sul fenomeno di interesse, al fine di produrre informazione statistica utile per prendere decisioni.
Informazioni espresse numericamente che rappresentano la sintesi dell'osservazione di un certo numero di dati.
CONCETTI CHIAVE
- UNITÀ STATISTICA - E' l'entità o soggetto su cui si presenta il fenomeno di interesse. (A chi mi rivolgo?)
- VARIABILE/CARATTERE - E' una caratteristica o aspetto che si può osservare su l'unità statistica. (Assegno un valore)
- MODALITÀ - E' un particolare valore di una variabile (risposta dell'individuo alla domanda)
Esempio: Unità statistica ➔ individuo Variabile ➔ sesso Modalità ➔ maschio/femmina
- CONFRONTO TRA UNITÀ STATISTICHE RISPETTO A UNA O PIÙ VARIABILI - Due unità statistiche sono uguali se presentano la stessa combinazione di modalità rispetto a una o più variabili.
- POPOLAZIONE O COLLETTIVO STATISTICO - E' un insieme di unità statistiche che sono uguali rispetto a 1 o + caratteri. Può essere empirica, osservabile nella realtà, oppure teorica, rispetto a un'instanza, insieme di possibili misure.
- NUMEROSITÀ DI UNA POPOLAZIONE - E' il numero di unità statistiche che compongono la popolazione. (N)
- INDAGINE STATISTICA - E' un processo di raccolta dei dati sul fenomeno di interesse.
- CAMPIONE - Sottinsieme della popolazione.
TOTALE - Riguarda tutta la popolazione. (Censimento)
Parziale - Riguarda solo una parte della popolazione. - minor costo - minor tempo - raggiunte le medesime risposte
numero di unità che fanno parte del campione
- Ammontare totale di una variabile quantitativa trasferibile
la somma delle quantità di quel carattere che sono possedute
dalle unità della popolazione A
Classificazioni dei caratteri
Si classificano secondo la natura:
- Qualitativi: hanno per modalità nomi, oggetti, numeri convenzionali,
- nomi convenzionali, per cui non si effettuano operazioni.
Quantitativi: hanno per modalità numeri convenzionali che
esprimono una misura di una quantità
Quando si opera con essi, oltre che un'ordinata è possibile
di effettuare operazioni aritmetiche per confrontarle.
Quando è possibile calcolare (solo la differenza si parla di
scala a intervalli) qualsiasi è possibile calcolare anche
il rapporto tra modalità => scale di rapporti
Caratteri qualitativi
- Ordinati
Hanno per modalità determinata.
gruppi qualitativi per cui
esiste un ordinamento naturale
(es. titolo studio, ceto sociale,
grado soddisfazione, anno di università)
questo tipo di carattere costituisce una scala ordinata.
Si propone perché è possibile dare
un ordine alle modalità in modo
da affermare che una modalità
precede un'altra
- Sconnessi
Hanno per modalità determinate qualificate
ve per le quali non esiste un ordinamento
(esesso, religione, luogo di nascita, reddito ecc)
Ad es., non si può dire che il sesso maschile ha
una precedenza su quello femminile.
Unico confronto tra le modalità è uguaglianza
o diversità.
Questa caratteristica costituisce una scala nominale
perché per le sue modalità è possibile differenziare
se sono uguali o diverse
Caratteri quantitativi
- Discreti
Le modalità sono effettuabili,
numerabili, sono numeri
interi (es. n' addetti, componenti
famigliare, ecc) Sono dei contabili.
- Continui
Le modalità sono tutti i numeri compresi in
un intervallo (altezza, peso, reddito ecc)
i valori si succedono sopra scala continua.
- Trasferibili
Quando un'unità perde parte
del carattere che era posseduto
da un'altra unità (es. reddito
n' di addetti)
- Statistica inferenziale
- Schematizzazione (progettata)
- Selezione campione
- Raccolta dei dati
- Applico indici statistica per la
- descrizione del campione
- Inferenza statistica verifica
- se proposte su campioni
- sono utilizzabili all'intera
popolazione
Secondo il numero di variabili utilizzate:
- statistica univariata ⇒ distribuzione semplice (1 variabile)
- statistica bivariata ⇒ distribuzione doppia (2 variabili)
- statistica multivariata ⇒ distribuzione con 3 o + variabili
N.B. I coefficienti rimangono invariati.
Nella statistica descrittiva vediamo l'ELABORAZIONE DEI DATI.
- INDICI DI POSIZIONE / MEDIE
- INDICI DI DIVERSITA’ (INDICI DI DISPERSIONE O DI VARIABILITA’)
- INDICI DI FORMA
L'elaborazione segue la raccolta dei dati sotto elle o grafici:
- Calcolo delle medie per individuare le modalità o i valori tipici;
- caratteristiche che servono per descrivere l’ordine di grandezza del fenomeno sul collettivo osservato.
Il tipo specifico di elaborazione dipende dal tipo di variabile, distinguiamo una gerarchia delle variabili:
- VARIABILI QUANTITATIVE (espressione modelli equivalenti attraverso le esperienze aritmetiche)
- VARIABILI QUALITATIVE ORDINATE (indiciano ordine e livello di diversità)
- VARIABILI QUALITATIVE SCONNESSE (individuano sesso e tra diversità)
CASO: VARIABILE QUALITATIVA SCONNESSA
- MODA ⇒ di una distribuzione è la modalità prevalente, più importante, più frequente. Nel caso di distribuzione a “giustizia”, la moda è la modalità con quanti più eletti.
CASO: VARIABILE QUALITATIVA ORDINATA ⇒ modalità ordinabili
- MODA
- MEDIANA ⇒ è la modalità che divide la distribuzione ordinata in due parti; ovvero a metà.
ITER: DISTRIBUZIONE PER UNITÀ
- ordinare i dati in modo non decrescente
- posto centrale della distribuzione
caso N pari: ho due posti centrali N/2 e N/2 + 1
caso N dispari: unico posto centrale (N+1)/2
RED CENTILE distribuzione in ordine
- trovo 9 posto ordinario composto da 9
- blocca N/9
- (N*9 ≤ h ≤ N*9+1)
SECONDA PROPRIETÀ
Affermiamo che:
- la media aritmetica è il baricentro di ordine 2 della distribuzione;
- è quel valore che rende minima la distanza complessiva di ordine 2 tra le N osservazioni e il valore rappresentativo.
La somma degli scarti al quadrato dei valori x1, x2, ..., xN da una costante "c" è minima quando "c" è uguale alla media aritmetica.
Dati x1, x2, ..., xN e xmin, cN ≤ x ≤ xmax
per ciascuna delle N osservazioni calcolo il valore intermedio:
(x1 - x)2 (x2 - x)2 (xN - x)2
calcolo che il quadrato degli scarti (x1 - x)2 + (x2 - x)2 + ... + (xN - x)2
affinché U è quel valore che minimizza l'espressione
∑i=1N(xi - x)2
Qual è il senso e l'utilità?
Lo scopo è quello di rissumere le N osservazioni con un valore che è compresso tra il valore più piccolo e più grande osservato
xmin ≤ x ≤ xmax
Se come valore rappresentativo scelgo il valore centrale, è quello che federe quanto questo valore dista dalle N osservazioni delle N distanze tra quel valore e la distanza complessiva è la somma degli scarti.
Cerco il valore x per il quale è minima la distanza tra le N osservazioni
Distorta → xi - x = si dice d'ordine due perché (xi - x)2 è elevata al quadrato in modo da dare peso ai termini più fortunati
Individua minima la distanza complessiva di ordine 2 tra le N osserv. e il valore rappresentativo
es.
x1 = 1 x2 = 4 x3 = 10
Calcolo il valore centrale come valore rappresentativo
x = 4 + 10 = 5,5
2
calcolo la media
μ = 1 + 4 + 10 = 5
Calcolo gli "scarti" rispetto a il valore centrale
(xi - x)2
1 - 5,5 = - 4,5
4 - 5,5 = - 1,5
10 - 5,5 = 4,5
Calcola (xi - μ)2
1 - 5 = -4
4 - 5 = -1
10 - 5 = 5
New form:
Finale:
20,25
2,25
20,25
(42,75)
16
1
25
42
Notiamo che la media aritmetica ha un valore più piccola dei termini rispetto al quesù valore è più rappresentativo del valore centrale
Quando l'utlittà del sistema è più adatto per riassumere le N osservazioni
- x = tdistortibile
- x = misura con errore (1o proprietà)
- ero quei valori rappresentativi (2o proprietà)
Il Metodo mi rimanda a tutto il numero