vuoi
o PayPal
tutte le volte che vuoi
Su excel:
- Nel grafico a dispersione selezionare la serie dei dati, premere il tasto destro
del mouse e selezionare il comando “Aggiungi linea di tendenza”
- Nella scheda Progettazione – Layout Grafici si può scegliere di visualizzare
sul grafico l’equazione della retta e il valore dell’indice di adattamento
- Le funzioni di excel per calcolare i valori dei parametri della retta e l’indice di
adattamento del modello ai dati.
a=“intercetta(y_nota;x_nota)”
o b=“pendenza(y_nota;x_nota)”
o R2=“RQ(y_nota;x_nota)”
o
Anche qui posso utilizzare lo strumento “Analisi dati”
Output:
a è l’intercetta
b è sulla stessa riga della variabile indipendente
esplico l’equazione della retta
Commento dell’output:
riconoscere il tipo di analisi effettuata
- ovviamente scrivo che sono due variabili quantitative (sennò non sarebbe
possibile questo tipo di analisi)
- regressione? Correlazione?
- individuare il totale dei soggetti
- individuare ciò che la ricerca vuole indagare:
- quanto vale r multiplo?
cosa indica?
- positiva o negativa la relazione?
quanto vale r quadro? •è un buon modello?
quali sono i valori di a e b?
- esplico l’equazione della retta
traggo una conclusione
- esiste una buona relazione (correlazione/causa-effetto) tra le due variabili?
Commento Output:
R multiplo:
- coefficiente di correlazione lineare r
- indica relazione lineare tra le due variabili
- es: 0,894 c’è una relazione lineare positiva (perché > 0) molto molto forte
(perché è 0.894) tra le due variabili
R2:
- indice determinazione, adattamento della retta di regressione
- è un buon modello o no la retta di regressione?
- quello corretto non va commentato •es: 0,800 è un ottimo modello, è quasi
1, quasi linearità perfetta (LETTURA DESCRITTIVA)
Osservazioni:
- devono avere qualche decina di dimensione, non ha senso fare su poche
osservazioni
Tabella analisi varianza: (non centra con Anova) significatività f (LETTURA
INFERENZIALE)
- il fatto che viene esplicitato che c’è significatività significa che c’è un test
questo:
- H0: R2 = 0 / H1: R2 > 0 se accetto H0 non è un buon modello, non è
significativamente valido / se accetto H1 è significativamente ≠ da 0
- poi dopo aver accettato H1 dato il segno e il valore determiniamo quanto e
come
- significatività = pvalue se > 0,05 accetto H0 / se < 0,05 rifiuto H0
- deve essere il più piccolo possibile di 0,05 più è piccolo, più il modello è un
buon modello
Coefficienti:
- a è intercetta
- b è l’altra
Valore di significatività: (pvalue dei coefficenti)
- per entrambi i valori dei coefficienti
- se è < di 0.05 rifiuto H0 e accetto H1
- quindi sono variabili importanti per il modello
Laboratorio 3
Il tipo di relazione tra caratteri quantitativi che studiamo è di tipo lineare: quindi le
coppie di punti definite da due variabili tendono a disporsi lungo una linea retta.
Grafico a dispersione:
= nuvola di punti su un piano cartesiano che corrispondono ad una coppia di punteggi
appartenenti all’unità statistica e facendo riferimento ai caratteri studiati
rappresenta la relazione e ci informa su forma, intensità e direzione della
relazione
Come costruire un grafico a dispersione:
1. creo foglio di lavoro in cui copio e incollo i dati
2. da inserisci prendiamo il grafico a dispersione tra i grafici
3. poi si può modificare in base alle preferenze, si può cambiare stile, colori o altro
- su layout rapido possiamo cambiare il layout sarà utile ad interpretare le
relazioni tra variabili
- aggiungi elemento grafico: da qui possiamo personalizzare grafico
aggiungendo o eliminando elementi a nostra scelta
interpretare un grafico a dispersione:
relazione lineare positiva: linea interpolante crescente dei dati legame tra
variabili diretto e positivo
relazione lineare negativa: punti disposti in linea decrescente dei dati
relazione inversa
punti in maniera disordinata, questo significa che non vi è relazione li
lineare tra le due variabili
il grafico a dispersione ci dà rappresentazione visiva, ma per avere una misura si deve
ricorrere a indici numerici:
la relazione lineare tra due variabili può essere espressa con il valore di
covarianza, che esprime la media dei prodotti degli scarti di ogni variabile dalla
propria media:
- >0 : variabili con tendenza a linearità positiva
- <0 : tendenza a linearità negativa
- = 0 : incorrelazione
La covarianza può essere indicata con tutti i numeri reali
Funzione di excel: covarianza ()
Strumento: covarianza
Coefficiente di Pearson
Per misurare l’intensità della correlazione si normalizza il tutto tramite il coefficiente di
correlazione lineare di Pearson
Su excel:
Cerco correlazione in funzioni
Su analisi dati
Laboratorio 4
Il modello di regressione lineare
La regressione lineare ci dice se tra due variabili esiste una relazione lineare e se i
valori della dipendente dipendono dai valori della seconda variabile, chiamata
indipendente.
Richiama quindi il concetto di previsione: quando c’è un’alta correlazione tra due
variabili è possibile prevedibile
il valore della variabile
dipendente a seconda dei
valori dell’indipendente. Per
fare questa previsione si
utilizza la stessa formula della
retta classica:
Intercetta o costante =
valore predetto di Y nel
momento in cui X=0
Coefficiente di pendenza: incremento prodotta da Y per un incremento unitario
di X
La stima avviene secondo il criterio dei minimi quadrati, che consiste nello scegliere
una retta tra le infinite possibili che rende minima la somma delle distanze al quadrato
tra le Y osservate e le Y stimate.
Una volta stimati i parametri si deve stabilire un indice di adattamento per vedere se 2
la retta trovata sia adatta a descrivere la relazioen coefficiente di determinazione r
= quadrato del coefficiente di correlazione lineare ed indica la quota di varianza della
variabile Y in relazione alla variabile X.
Il suo valore oscilla da 0 a 1, più è vicino ad 1 più la retta è utile a spiegare la
relazione
Su excel:
1. Creo grafico a dispersione
2. Vado su progettazione, layout grafico e scelgo il numero 9
Oppure tramite le formule di excel
1. Cerco funzione intercetta, inserisco in Y note l’intervallo della variabile
dipendente e in X note l’intervallo della variabile indipendente.
2. Per la pendenza il procedimento è lo stesso ma la fx si chiama pendenza
3. Per RQ stesso ragionamento ma con funzione RQ
Con analisi dati:
1. Si parte sempre da valori continui, quindi copio le due variabili su un nuovo
excel
2. Vado su analisi dati e cerco regressione
3. Spunto voce tracciati delle approssimazioni
4. Il valore noto come significatività F indica se il risultato delle correlazioni può
essere o meno dovuto al caso, se è 0 non è assolutamente dovuto al caso (se
non compare questo valore bisogna cambiare il formato da generale a numero)
Commento dell’output:
riconoscere il tipo di analisi effettuata
- ovviamente scrivo che sono due variabili quantitative (sennò non sarebbe
possibile questo tipo di analisi)
- regressione? Correlazione?
individuare il totale dei soggetti
individuare ciò che la ricerca vuole indagare:
- quanto vale r multiplo?
cosa indica?
positiva o negativa la relazione?
- quanto vale r quadro?
è un buon modello?
- quali sono i valori di a e b?
esplico l’equazione della retta
traggo una conclusione
- esiste una buona relazione (correlazione/causa-effetto) tra le due variabili?
Inferenza statistica:
= insieme di metodi che sulla base della teoria della probabilità ci permettono di trarre
delle conclusioni plausibili su una caratteristica di una popolazione sulla base della
osservazioni effettuate su un campione.
= sulla base di considerazioni statistiche effettuate su un campione cerchiamo di
attribuire un valore a un parametro reale della popolazione di riferimento stabilendo
anche il margine di errore insito in tale attribuzione.
L’inferenza si serve di due approcci:
1. la stima dei parametri:
2. la verifica delle ipotesi
la stima dei parametri
= utilizzando i dati campionari si vogliono trarre delle conclusioni sulla media della
popolazione.
parametro: valore che indica una caratteristica relativamente costante di una
funzione o di una popolazione (come la media) stima intervallare)
la stima può avvenire o tramite un intervallo di valori ( o
(stima puntuale)
tramite il calcolo di un singolo valore
stima puntuale sulla popolazione: su excel:
trovo media e
deviazione standard
nel modo classico
tramite le funzioni
di excel, per l’errore
standard scrivo
manualmente la
formula
=selezionacasellads/ RADQ (N-1) Caso molto raro e questi
impossibile in psicologia
Su Excel
1. inserisci funzione confidenza
2. alfa, d.s., dimensione del
campione
3. otteniamo ampiezza
4. limite inferiore sarà uguale al
valore della media meno
l’ampiezza, mentre il limite
superiore sarà uguale alla
media più il valore
dell’ampiezza
5. questi due saranno i limii del nostro intervallo
con campione superiore a 30 il caso è diverso: 1. calcolo media, ds,
errore standard
2. Calcolo T da
1-alfa
inserisci funzione
cercando INV.T (in
probabilità metto alfa e
in grado di libertà metto
dimensione del campione
-1)
3. Il valore ottenuto deve
essere moltiplicato per
errore standard per
ottenere ampiezza
dell’intervallo
4. Sottrarre e sommare il valore dell’ampiezza a quello della media per trovare i
limiti sup e inf
Inferenza sulla proporzione:
= data una certa proporzione nel campione dei soggetti con una determinata
caratteristica vogliamo stimare la proporzione di quella stessa caratteristica all’interno
della popolazione.
Avremo anche qui una stima intervallare ed una puntale:
su excel:
1. Trovo frequenza tramite
CONTA.SE
2. In intervallo metto l’intervallo
della variabile mentre in
criterio seleziono etichetta
molto interessante
3.