vuoi
o PayPal
tutte le volte che vuoi
NUMEROSITA’ CAMPIONARIA
Ma che numerosità deve avere il campione???
Partendo da in’ipotesi di ricerca si potrebbe studiare ogni singolo componente dell’universo per giungere
così a un risultato. Questa strada però è molto lunga e spesse volte impossibile. Bisogna dunque fare una
stima, cioè calcolare un parametro per via induttiva, osservando una porzione di realtà e trasferire il
particolare al generale.
Quando si hanno a disposizione tutti i dati si fa una media ottenendo così un valore ben preciso. Quando si fa
una stima invece il valore è contenuto in un intervallo, non è preciso. Per cui si dirà che “con un certo grado
di fiducia” il valore è compreso tra x ed y.
Il rischio di errore ci sarà sempre.
Ciò che rende la ricerca di qualità e quindi ciò che fa giungere ad una buona stima è il raggiungimento di un
valore che riesce a tenere assieme due cose:
- Un alto grado di fiducia
- Uno stretto intervallo intorno al valore;
L’ERRORE
L’intervallo che si costruisce sarà dato dal valore che si trova tramite il campione, tale valore potrà essere
più o meno affetto da errore.
Vi sono due tipi di errori:
ERRORE CAMPIONARIO: questo tipo di errore è il più importante e si compie per il solo fatto di
lavorare sul campione, che non permette di rappresentare esattamente l’universo ma dà una stima,
che potrà essere una sovrastima o una sottostima. Questo tipo di errore si sa che c’è, è e calcolabile e
minimizzare.
ERRORE NON CAMPIONARIO: tali errori si possono commettere anche quando si lavora
sull’universo oltre che sul campionario. Rappresentano quegli errore che si possono fare quando si
lavora durante il processo di ricerca. Questo tipo di errori sono i più pericolosi perché difficili da
rilevare, si sa che c’è la possibilità che ci siano ma non si sa dove né l’entità
Paradossalmente quando si lavora sull’universo il risultato potrebbe essere più sbagliato della stima fatta sul
campione, perché l’errore non campionario è sicuramente molto più alto lavorando su numeri più elevati
mentre il risultato del campione potrebbe avvicinarsi di più alla realtà in quanto l’errore non campionario
potrebbe non esserci.
Il dato di realtà vero, il valore che ci interessa è dato dalla stima + o – l’errore campionario e non.
Poiché l’errore non campionario non è rintracciabile si può lavorare solo sull’errore campionario il quale
dipende da tre cose:
• NUMEROSITA’ DEL CAMPIONE (n): quanto più elevata è la numerosità del campione tanto la
stima migliora. Quando la numerosità dell’universo e quella del campione coincidono l’errore
campionario si azzera.
( δ )
• VARIABILITA’ : quanta più variabilità c’è più ciò influirà sull’errore, se non c’è variabilità
non c’è errore, l’errore campionario ha a che fare con la natura stessa dell’oggetto di studio. Per
questo motivo è meglio usare il campione a strato, in modo da lavorare quanto più possibile in una
situazione omogenea. Per sicurezza si inserisce il maggior grado di variabilità che equivale a 0,25
• ANDAMENTO DELLA DISTRIBUZIONE NORMALE o GAUSSIANA ( K): la probabilità di
commettere un errore ha un andamento che rappresenta la tendenza dell’errore ad essere più
probabile nella sua quantificazione bassa e meno nella sua quantificazione alta. Se il grado di fiducia
è del 99% K=2,57 se invece è del 95% K=1.96
Alla stima bisogna dunque aggiungere l’errore campionario:
δ
∙
K √ n
α
Errore Campionario =
L’estremo inferiore dell’intervallo si troverà sottraendo al valore della stima trovata l’errore campionario,
mentre l’estremo superiore aggiungendo alla stima l’errore campionario.
Per stimare di quanto è diverso il valore ottenuto rispetto al valore reale bisogna quantificare l’errore di cui è
certamente affetta la stima.
A parità di numerosità del campionario (n) si potrà ottenere un intervallo più o meno ampio a seconda del
grado di fiducia (K). Potremo quindi avere meno sicurezza ma un minore intervallo o maggior sicurezza ma
1. scelta del
con un intervallo più grande. problema e
Ma è possibile un intervallo inferiore ma con un maggior grado di fiducia?
Una volta trovato il valore della stima, poiché la variabilità (δ) è costante, si può ottenere un intervallo
definizione
minore con un grado di fiducia del 99% aumentando la numerosità del campione (n) e poiché n è sotto radice
delle ipotesi
per dimezzare l’intervallo sarà necessario quadruplicare il valore di n, con ciò che ne consegue visto che ogni
rivelazione ha un costo unitario. La scelta tra K, δ, n dipendono dai costi che si possono sostenere e dal tipo
di ricerca che si affronta. 5. 2.
Infine quando si ragiona con universi poco numerosi è sufficiente il 5% della popolazione, ma in questi casi
formulazio
interpre
comunque conviene utilizzare metodi qualitativi come interviste. ne del
tazione disegno di
dei ricerca
Quando si raccolgono informazioni mediante questionari si possono avere diversi livelli di interesse.
risultati
Quando si fa la stima della variabile ottenuta si lavora con analisi di tipo uni variato e descriviamo
l’andamento di UNA situazione. Ciò che interessa però più che descrivere è SPIEGARE. Per fare ciò bisogna
capire se la variabile in questione dipende da qualcos’altro.
Una singola variabile può essere messa in relazione con una moltitudine di aspetti che spiegano il fenomeno
e possiamo spiegare il fenomeno quando saremo in grado di individuare ogni fattore da cui dipende la
variabile. Questo modello di spiegazione e detto multivariato.
4. 3.
codifica racco
Si possono mettere in relazione le singole coppie di variabili composte da una dipendente e una
e analisi lta
indipendente. Tali analisi vengono dette bivariate e mettono in relazione due variabili per volta in moda
dei dati dei
vedere se vi è una relazione tra le due. dati
Le relazioni tra le variabili si studiano a seconda della natura delle variabili stesse, a seconda cioè che siano
quantitative o qualitative.
RELAZIONE FRA VARIABILI QUANTITATIVE
δ δ
Es. reddito ( ) / anzianità di servizio ( )
x y
A livello uni variato la variabile è misurabile attraverso la varianza. Nel bivariato la variabile si misura con
la covarianza , che è una misura di variabilità congiunta.
Singolarmente le due variabili hanno una loro variabilità. Al ricercatore interessa la loro covarianza, cioè
quanto varia una variabile quando varia l’altra. Se al variare di una l’altra non varia significa che le due
variabili non hanno covarianza, e quindi non sono correlate fra loro.
Si prospettano tre possibilità:
• Al variare di una variabile l’altra non varia. E allora avremo un esito nullo, le variabili sono
indipendenti;
• All’aumentare di una variabile l’altra aumenta a sua volta. E allora avremo un esito positivo, le
variabili hanno una dipendenza diretta;
• All’aumentare di una variabile l’altra diminuisce. E allora avremo un esito negativo, le variabili
hanno una dipendenza indiretta. r
Si calcola dunque il coefficiente di correlazione ( ), che è un INDICE NORMALIZZATO della
covarianza. * normalizzare significa rendere la scala di variabilità con un indice che va da 0 a 1, non
esistono coefficienti di correlazione più grandi di 1.
cov
r = δxδy
r
Il coefficiente di correlazione ( ) è detto di interdipendenza, poiché una variabile dipende dall’altra e
viceversa.
Una volta scoperto se c’è dipendenza, se questa è diretta o meno, si calcola quanto una variabile influenza
l’altra grazie al coefficiente di determinazione ( R) che è dato dal coefficiente di correlazione elevato al
quadrato, e rappresenta la percentuale di variabilità di ciascuna variabile.
= R
2
r
RICERCA CON VARIABILI QUALITATIVE
Le variabili qualitative restituiscono delle qualità e permettono di distinguere la categoria di appartenenza dei
soggetti di studio. Nell’analisi qualitativa non si ha a che fare con numeri, ma si può rilevare generi,
atteggiamenti, comportamenti, giudizi e se tali elementi sono influenzati da altri.
Lavorare con dati qualitativi è più complesso rispetto allo studio di dati quantitativi poichè vi sono meno
strumenti ed è più facile sbagliare.
Uno dei modi possibili per analizzare dati qualitativi è sistematizzarli in una tabella a doppia entrata ( che è
un conteggio delle frequenze dette congiunte). Si prendono tutte le risposte date dall’incrocio fra le due
variabili si hanno 4 possibili risposte:
ad es. n F-sì; n M-sì; n F-no; n M-no. In ciascuna cella ci sarà il valore della frequenza congiunta della
ricerca che abbiamo effettuato.
A
G SI NO
M 320
100 420
125 455
F 580
225 775 1000 Totale marginale
Totale
marginale
C’è una relazione tra essere maschi o femmine e rispondere sì o no?
L’esistenza di una relazione tra due variabili qualitative si può verificare con il test di verifica delle ipotesi ,
strumento che permette di verificare un’ipotesi scientifica. (H )
Un test parte sempre stabilendo un’ipotesi di partenza che è detta anche ipotesi nulla 0
Totale
intervistati
2
x
TEST DEL CHI QUADRATO
Questo test parte sempre dalla ipotesi di indipendenza
H : G e A indipendenti
0 H H
In tutti test alla si contrappone l’ipotesi alternativa che afferma il contrario
0 1
H : G e A dipendenti
1
Il percorso di un test in generale si parte dall’ipotesi, si sceglie lo strumento più adeguato, si applica il test e
H H
si ottiene un risultato. La conclusione del test sarà la conferma di o
0 1.
Bisogna comunque tener presente che siccome stiamo lavorando su di un campione e non sull’universo c’è
sempre la possibilità di errore, seppur con un buon grado di fiducia; se la relazione c’è questa si percepirà in
ogni campione preso dall’universo.
Il test del chi quadrato confronta la relazione di ricerca con una situazione teorica di perfetta indipendenza.
- Risolvere un problema di matematica
- Riassumere un testo
- Tradurre una frase
- E molto altro ancora...
Per termini, condizioni e privacy, visita la relativa pagina.