vuoi
o PayPal
tutte le volte che vuoi
FASI DELL’INDAGINE STATISTICA
- Rilevazione dati: Il modo in cui si riesce a raccogliere i dati di un’indagine:
* direttamente: se utilizzo sondaggi telefonici, questionari ecc. che facilitano la raccolta dati ed è il
pilastro della ricerca quantitativa.
Le fasi sono : gli obbiettivi della ricerca (cosa si vuole conoscere), ordine delle domande (primarie,
secondarie, complesse ecc.), tipi di domande (chiuse, semichiuse, aperte ecc.), comprensibilità
domande (domande univoche e durate media per non perdere l’attenzione), test su campione.
* indirettamente: se utilizzo fonti o banche dati già presenti: Istat (famiglia, salute) , Isae (analisi
economica) , Siae (spettacolo). Essi producono dati in maniera periodica e si classificano in base a
natura e scopo dell’ente.
- Elaborazione dati: Il modo in cui i dati diventano utilizzabili attraverso operazioni e l’utilizzo di
excel, vengono codificati, per poi applicare tecniche statistiche per avere tabelle o grafici.
Le tabelle possono essere:
* di continenza: se le variabili x e y sono entrambe qualitative, oppure una qualitativa e una
quantitativa
* di correlazione: se le variabili sono entrambe quantitative.
I grafici possono essere:
* Istogramma: è un grafico costituito da barre non distanziate
* Diagramma cartesiano: sull’asse delle ascisse x sono rappresentate le modalità xi, sull’asse delle
ordinate y sono rappresentate le frequenze corrispondenti ni
- Interpretazione dati: E’ la spiegazione dei dati ottenuti dai grafici o tabelle
- Presentazione dei dati: Esposizione dei dati in maniera ufficiale e comprensibile a tutti
IL CAMPIONAMENTO STATISTICO -> ved. metodologia
Estratto numerico di una quantità in quanto troppo vasta (es. popolazione, n<N) .
Anche se può sembrare strano, anche la scelta casuale (ad esempio l’estrazione,tipica del
campionamento) deve seguire regole ben precise.
Un campionamento infatti può essere definito come: “un procedimento attraverso il quale si
estrae, da un insieme di unità (popolazione) costituenti l’oggetto di studio, un numero ridotto di casi
(campione) scelti con criteri tali da consentire la generalizzazione dell’intera popolazione”.
I campioni statistici possono essere:
- Casuale semplice: Il caso più semplicein cui ogni individuo della popolazione ha uguali possibilità
di essere scelto per il campione.
Ad esempio non possiamo ottenere un campione probabilistico se prendiamo un campione di
studenti universitari estraendo un certo numero di essi a caso, un qualsiasi giorno, perché i non
frequentanti ad esempio non rientrerebbero.
La dimensione della popolazione non ha grande importanza per determinare l’ampiezza del
campione, infatti ad esempio un campione di 1.000 casi può essere sufficiente per arrivare a stime
della stessa precisione per popolazioni di 10.000 o 100.000 elementi.
* con reimissione: viene estratto il campione, viene inserito e può essere estratto di nuovo.
Probabilità 1/N
* senza reimissione: una volta estratto il campione non può essere più inserito. Probabilità 1/N-1
- Stratificato: La procedura consiste nel suddividere le popolazioni in sottopopolazioni (strati) il più
possibile omogenee , estrarre da ogni strato un campione e unire tutti i campioni per avere un
campione globale.
- Sistematico: è simile al casuale semplice, ma con diversa tecnica di estrazione.
I soggetti non vengono più scelti secondo un sorteggio ma secondo un intervallo stabilito.
Bisogna quindi che tutte le unità abbiano la stessa probabilità di essere incluse nel campione, per
cui tutte le unità devono avere le stesse probabilità di essere incluse nel campione (es: se si fa una
ricerca di mercato, si intervista un cliente ogni tot che escono dal negozio a spesa conclusa, fino
alla fine della giornata senza interrompere prima, altrimenti alcuni clienti potrebbero non rientrare
nel campione).
Inoltre deve essere evitata ogni forma di scelta diversa da quella predeterminata dall’intervallo di
campionamento (es. se l’intervallo scelto degli intervistati è ogni 10, è il decimo che va intervistato
e non il nono o l’undicesimo, effettuando una scelta diversa)-
- Accidentale: Il campione viene estratto a caso e si intervistano le persone in maniera casuale. Il
risultato non è affidabile ma si risparmia tempo e denaro.
- Per quote : si divide la popolazione in strati e il ricercatore sceglie a sua discrezione i soggetti
all’interno degli strati rispettando la proporzione (non c’è casualità).
Ad esempio si decide di studiare 420 persone (ampiezza campione) e si fa una proporzione dei
soggetti da studiare (es. 13 soggetti maschi ovvero il 3% di 420 e così via per gli altri soggetti
scelti) ma i soggetti da intervistare vengono scelti non casualmente ma secondo le preferenze
dell’intervistatore, che quindi non perderà tempo con coloro che potrebbero rifiutare l’intervista.
- A valanga: prima si intervistano le persone che hanno le giuste caratteristiche per il caso studiato
e da queste poi si ricevono indicazioni per rintracciare altre persone con le stesse caratteristiche.
Questo metodo è particolarmente utile in caso di popolazioni clandestine, ma il limite di esso è
che si potrebbero scegliere persone che magari indicano “colleghi” che hanno vissuto la stessa
esperienza e non quelli che ne hanno vissuta una differente.
- Testimoni privilegiati: ricorrere a persone che sappiano fornire informazioni su ciò che si vuole
studiare (es. parroco che da info sui fedeli).
Rappresentazioni grafiche
- Grafici a barre: per caratteri qualitativi non ordinati
- Grafici a nastri: per caratteri qualitativi ordinati
- Grafici ad aree: per caratteri qualitativi continui nel tempo
- Grafici a radar: per caratteri ciclici
- Grafici a cartogrammi: per serie territoriali
- Grafici a torta: per caratteri qualitativi non ordinati o ciclici ordinati
- Diagramma cartesiano: per serie storiche ( asse x-> modalità, asse y -> frequenze)
- Istogramma: per caratteri quantitativi continui suddivisi in classi
LA MEDIA
La media è il rapporto tra la somma del prodotto tra le singole modalità e le rispettive frequenze,
ed il numero complessivo della popolazione.
Media aritmetica semplice (senza frequenze)
N
∑ x i
µ
= = =
i 1
X N
Es. esercizio:
xi
20
21
22
23
24
20 + 21 + 22 + 23 + 24 + 25= 135 (somma modalità)
135 : 6 (numero modalità) = 22.5
Media aritmetica semplice ponderata (con frequenze)
S
∑ ′
x n
i i
µ
= = =
i 1
X N
Es. esercizio:
xi Ni
20 10
21 13
22 18
23 20
Legenda:
- Σ : sigma
- xi: modalità
- ni: frequenze
- N: numero complessivo popolazione, se ci sono le frequenze corrisponde alla somma di tutte le
frequenze. Se non ci sono le frequenze, corrisponde al numero totale delle modalità (no somma)
10 + 13 + 18 + 20 = 61 N (somma frequenze)
20*10= 200 (xi * ni)
21*13= 273
22*18= 396
23*20= 460
200 + 273 + 396 + 460= 1359 (xi * ni della formula)
µ
1359: 61 = 877, 033 (media)
Proprietà della media
- La somma degli scarti è uguale 0
- La somma degli scarti al quadrato è il minimo risultato
- La media è interna se è maggiore del più piccolo,e minore del più grande
- Ha una proprietà associativa: suddividendo in due o più gruppi i valori della x, la media della
variabile è uguale alla media delle medie parziali dei vari gruppi ponderati con il numero di ciascun
elemento
- Ha una proprietà traslativa: se aggiungo N ad un valore, la media aumenta di N
- Ha una proprietà omogenea: se moltiplico un valore per N, la media aumenta di N
- Se ci sono dei numeri dispari, la media è al centro (importante per gli esercizi)
Media geometrica: i dati sono in progressione geometrica
Senza frequenze:
N
π
= =
X M x
N
g i
=
i 1
Con le frequenze: N
π n
= =
X M x
N i
g i
=
i 1
Media quadratica: quando ci sono valori positivi o negativi per eliminare i segni (es. -1, +1 ecc.)
Senza frequenze:
N
∑ 2
x
i
= =
i 1
M q N
Con le frequenze:
s
∑ 2
x n
i i
= =
i 1
M q N
Media armonica: quando i reciproci dei termini sono in progressione aritmetica
Senza frequenze:
N
=
M ar N 1
∑ x
=
i 1 i
Con frequenze:
N
=
Marm s n
∑ i
x
=
i 1 i
MEDIE LASCHE (VALORE CENTRALE, MEDIANA, MODA)
VALORE CENTRALE (Media con classi modali)
+
x x
( ) ( )
1 N
=
V .
C . 2
Es. esercizio:
(Intervallo da-a)
xi ni
10-20 10
21-30 20
31-40 30
41-50 10
10+20= 30 : 2 = 15 (V.c. che nei successivi calcoli diventerà xi)
21+30= 51 ( siccome è disparI si approssima a 50) -> 50: 2= 25 (//)
31+40= 71 (//) -> 70:2= 35 (//)
41+50=91 (//) -> 90:2= 45 (//)
Dopo aver calcolato il V.C si applica la formula della media con frequenze
10*15= 150
20*25=500
30*35=1050
45*10= 450
10+20+30+10 = 70 ( N somma frequenze)
150+500+1050+450= 2150 (xi*ni)
2150:70= 30,7
MODA: Modalità con frequenza massima
Moda con caratteri discreti
Es. esercizio:
xi ni
25 3
26 2
27 8
28 1
La moda in questo caso è 27 in quanto è la modalità con la massima frequenza
Moda con caratteri continui (classi modali)
Es. esercizio (con ampiezze uguali) :
xi ni
18-20 3
21-23 5
24-26 10
27-29 4
- Con ampiezze uguali, significa che l’intervallo è sempre identico (es. in questo caso è sempre 2
-> 18 – 20, 21-2)
- Il procedimento è lo stesso della moda con caratteri discreti, quindi si prende la modalità con
massima frequenza (24-26)
Es. esercizio (con ampiezze diverse) :
xi ni
18-21 5
21-23 4
24-28 6
29-30 3
- Si calcola la densità di frequenza -> di= xi (2) – xi (1) con ogni modalità in successione.
21–18=3
23-21=2
28-24=4
30-29=1
- Dopo si fa il rapporto tra ni e di:
5:3= 1.6
4:2= 2
6:4= 1.5
3:1= 3
La moda in questo caso è il valore maggiore ovvero 3.
MEDIANA ( con dati discreti)
E’ quel valore che assume la posizione centrale della distribuzione e la divide in 2
Es. Esercizio con mediana con N= dispari
=
Me x +
N 1
2
xi
20
21
- Risolvere un problema di matematica
- Riassumere un testo
- Tradurre una frase
- E molto altro ancora...
Per termini, condizioni e privacy, visita la relativa pagina.