Anteprima
Vedrai una selezione di 4 pagine su 13
Appunti dei laboratori obbligatori di statistica Pag. 1 Appunti dei laboratori obbligatori di statistica Pag. 2
Anteprima di 4 pagg. su 13.
Scarica il documento per vederlo tutto.
Appunti dei laboratori obbligatori di statistica Pag. 6
Anteprima di 4 pagg. su 13.
Scarica il documento per vederlo tutto.
Appunti dei laboratori obbligatori di statistica Pag. 11
1 su 13
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Su excel:

- Nel grafico a dispersione selezionare la serie dei dati, premere il tasto destro

del mouse e selezionare il comando “Aggiungi linea di tendenza”

- Nella scheda Progettazione – Layout Grafici si può scegliere di visualizzare

sul grafico l’equazione della retta e il valore dell’indice di adattamento

- Le funzioni di excel per calcolare i valori dei parametri della retta e l’indice di

adattamento del modello ai dati.

a=“intercetta(y_nota;x_nota)”

o b=“pendenza(y_nota;x_nota)”

o R2=“RQ(y_nota;x_nota)”

o

Anche qui posso utilizzare lo strumento “Analisi dati”

Output:

a è l’intercetta

 b è sulla stessa riga della variabile indipendente

 esplico l’equazione della retta

Commento dell’output:

riconoscere il tipo di analisi effettuata

 - ovviamente scrivo che sono due variabili quantitative (sennò non sarebbe

possibile questo tipo di analisi)

- regressione? Correlazione?

- individuare il totale dei soggetti

- individuare ciò che la ricerca vuole indagare:

- quanto vale r multiplo?

cosa indica?

- positiva o negativa la relazione?

quanto vale r quadro? •è un buon modello?

quali sono i valori di a e b?

- esplico l’equazione della retta

traggo una conclusione

- esiste una buona relazione (correlazione/causa-effetto) tra le due variabili?

Commento Output:

R multiplo:

 - coefficiente di correlazione lineare r

- indica relazione lineare tra le due variabili

- es: 0,894 c’è una relazione lineare positiva (perché > 0) molto molto forte

(perché è 0.894) tra le due variabili

R2:

 - indice determinazione, adattamento della retta di regressione

- è un buon modello o no la retta di regressione?

- quello corretto non va commentato •es: 0,800 è un ottimo modello, è quasi

1, quasi linearità perfetta (LETTURA DESCRITTIVA)

Osservazioni:

 - devono avere qualche decina di dimensione, non ha senso fare su poche

osservazioni

Tabella analisi varianza: (non centra con Anova) significatività f (LETTURA

 

INFERENZIALE)

- il fatto che viene esplicitato che c’è significatività significa che c’è un test

questo:

- H0: R2 = 0 / H1: R2 > 0 se accetto H0 non è un buon modello, non è

significativamente valido / se accetto H1 è significativamente ≠ da 0

- poi dopo aver accettato H1 dato il segno e il valore determiniamo quanto e

come

- significatività = pvalue se > 0,05 accetto H0 / se < 0,05 rifiuto H0

- deve essere il più piccolo possibile di 0,05 più è piccolo, più il modello è un

buon modello

Coefficienti:

 - a è intercetta

- b è l’altra

Valore di significatività: (pvalue dei coefficenti)

 - per entrambi i valori dei coefficienti

- se è < di 0.05 rifiuto H0 e accetto H1

- quindi sono variabili importanti per il modello

Laboratorio 3

Il tipo di relazione tra caratteri quantitativi che studiamo è di tipo lineare: quindi le

coppie di punti definite da due variabili tendono a disporsi lungo una linea retta.

Grafico a dispersione:

= nuvola di punti su un piano cartesiano che corrispondono ad una coppia di punteggi

appartenenti all’unità statistica e facendo riferimento ai caratteri studiati

rappresenta la relazione e ci informa su forma, intensità e direzione della

 relazione

Come costruire un grafico a dispersione:

1. creo foglio di lavoro in cui copio e incollo i dati

2. da inserisci prendiamo il grafico a dispersione tra i grafici

3. poi si può modificare in base alle preferenze, si può cambiare stile, colori o altro

- su layout rapido possiamo cambiare il layout sarà utile ad interpretare le

relazioni tra variabili

- aggiungi elemento grafico: da qui possiamo personalizzare grafico

aggiungendo o eliminando elementi a nostra scelta

interpretare un grafico a dispersione:

relazione lineare positiva: linea interpolante crescente dei dati legame tra

 

variabili diretto e positivo

relazione lineare negativa: punti disposti in linea decrescente dei dati

 

relazione inversa

punti in maniera disordinata, questo significa che non vi è relazione li

 lineare tra le due variabili

il grafico a dispersione ci dà rappresentazione visiva, ma per avere una misura si deve

ricorrere a indici numerici:

la relazione lineare tra due variabili può essere espressa con il valore di

 covarianza, che esprime la media dei prodotti degli scarti di ogni variabile dalla

propria media:

- >0 : variabili con tendenza a linearità positiva

- <0 : tendenza a linearità negativa

- = 0 : incorrelazione

La covarianza può essere indicata con tutti i numeri reali

Funzione di excel: covarianza ()

 Strumento: covarianza

Coefficiente di Pearson

Per misurare l’intensità della correlazione si normalizza il tutto tramite il coefficiente di

correlazione lineare di Pearson

Su excel:

Cerco correlazione in funzioni

 Su analisi dati

Laboratorio 4

Il modello di regressione lineare

La regressione lineare ci dice se tra due variabili esiste una relazione lineare e se i

valori della dipendente dipendono dai valori della seconda variabile, chiamata

indipendente.

Richiama quindi il concetto di previsione: quando c’è un’alta correlazione tra due

variabili è possibile prevedibile

il valore della variabile

dipendente a seconda dei

valori dell’indipendente. Per

fare questa previsione si

utilizza la stessa formula della

retta classica:

Intercetta o costante =

 valore predetto di Y nel

momento in cui X=0

Coefficiente di pendenza: incremento prodotta da Y per un incremento unitario

 di X

La stima avviene secondo il criterio dei minimi quadrati, che consiste nello scegliere

una retta tra le infinite possibili che rende minima la somma delle distanze al quadrato

tra le Y osservate e le Y stimate.

Una volta stimati i parametri si deve stabilire un indice di adattamento per vedere se 2

la retta trovata sia adatta a descrivere la relazioen coefficiente di determinazione r

= quadrato del coefficiente di correlazione lineare ed indica la quota di varianza della

variabile Y in relazione alla variabile X.

Il suo valore oscilla da 0 a 1, più è vicino ad 1 più la retta è utile a spiegare la

 relazione

Su excel:

1. Creo grafico a dispersione

2. Vado su progettazione, layout grafico e scelgo il numero 9

Oppure tramite le formule di excel

1. Cerco funzione intercetta, inserisco in Y note l’intervallo della variabile

dipendente e in X note l’intervallo della variabile indipendente.

2. Per la pendenza il procedimento è lo stesso ma la fx si chiama pendenza

3. Per RQ stesso ragionamento ma con funzione RQ

Con analisi dati:

1. Si parte sempre da valori continui, quindi copio le due variabili su un nuovo

excel

2. Vado su analisi dati e cerco regressione

3. Spunto voce tracciati delle approssimazioni

4. Il valore noto come significatività F indica se il risultato delle correlazioni può

essere o meno dovuto al caso, se è 0 non è assolutamente dovuto al caso (se

non compare questo valore bisogna cambiare il formato da generale a numero)

Commento dell’output:

riconoscere il tipo di analisi effettuata

 - ovviamente scrivo che sono due variabili quantitative (sennò non sarebbe

possibile questo tipo di analisi)

- regressione? Correlazione?

individuare il totale dei soggetti

 individuare ciò che la ricerca vuole indagare:

 - quanto vale r multiplo?

cosa indica?

positiva o negativa la relazione?

- quanto vale r quadro?

è un buon modello?

- quali sono i valori di a e b?

esplico l’equazione della retta

 traggo una conclusione

 - esiste una buona relazione (correlazione/causa-effetto) tra le due variabili?

Inferenza statistica:

= insieme di metodi che sulla base della teoria della probabilità ci permettono di trarre

delle conclusioni plausibili su una caratteristica di una popolazione sulla base della

osservazioni effettuate su un campione.

= sulla base di considerazioni statistiche effettuate su un campione cerchiamo di

attribuire un valore a un parametro reale della popolazione di riferimento stabilendo

anche il margine di errore insito in tale attribuzione.

L’inferenza si serve di due approcci:

1. la stima dei parametri:

2. la verifica delle ipotesi

la stima dei parametri

= utilizzando i dati campionari si vogliono trarre delle conclusioni sulla media della

popolazione.

parametro: valore che indica una caratteristica relativamente costante di una

 funzione o di una popolazione (come la media) stima intervallare)

la stima può avvenire o tramite un intervallo di valori ( o

 (stima puntuale)

tramite il calcolo di un singolo valore

stima puntuale sulla popolazione: su excel:

trovo media e

deviazione standard

nel modo classico

tramite le funzioni

di excel, per l’errore

standard scrivo

manualmente la

formula

=selezionacasellads/ RADQ (N-1) Caso molto raro e questi

impossibile in psicologia

Su Excel

1. inserisci funzione confidenza

2. alfa, d.s., dimensione del

campione

3. otteniamo ampiezza

4. limite inferiore sarà uguale al

valore della media meno

l’ampiezza, mentre il limite

superiore sarà uguale alla

media più il valore

dell’ampiezza

5. questi due saranno i limii del nostro intervallo

con campione superiore a 30 il caso è diverso: 1. calcolo media, ds,

errore standard

2. Calcolo T da

1-alfa

inserisci funzione

cercando INV.T (in

probabilità metto alfa e

in grado di libertà metto

dimensione del campione

-1)

3. Il valore ottenuto deve

essere moltiplicato per

errore standard per

ottenere ampiezza

dell’intervallo

4. Sottrarre e sommare il valore dell’ampiezza a quello della media per trovare i

limiti sup e inf

Inferenza sulla proporzione:

= data una certa proporzione nel campione dei soggetti con una determinata

caratteristica vogliamo stimare la proporzione di quella stessa caratteristica all’interno

della popolazione.

Avremo anche qui una stima intervallare ed una puntale:

su excel:

1. Trovo frequenza tramite

CONTA.SE

2. In intervallo metto l’intervallo

della variabile mentre in

criterio seleziono etichetta

molto interessante

3.

Dettagli
Publisher
A.A. 2023-2024
13 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher alixboh di informazioni apprese con la frequenza delle lezioni di Statistica psicometrica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università Cattolica del "Sacro Cuore" o del prof Bonanomi Andrea.