Che materia stai cercando?

SPSS Tecniche di Analisi e Raccolta dati Appunti + Esercitazioni

Appunti di Tecniche di Analisi e Raccolta Dati M2 basati su appunti personali del publisher presi alle lezioni della prof. Martini dell’università degli Studi di Modena e Reggio Emilia - Unimore, facoltà di Scienze della comunicazione e dell'economia. Scarica il file in formato PDF!

Esame di Tecniche di Analisi e Raccolta Dati M2 docente Prof. C. Martini

Anteprima

ESTRATTO DOCUMENTO

2

Esiste un indice, detto coefficiente di determinazione R , che ci dice quanto è buono l’adattamento della

retta di regressione ai dati in esame.

Questo coefficiente è il quadrato del coefficiente di

correlazione r.

Questo coefficiente varia tra e 1, e si interpreta come

la proporzione di variabilità di Y che viene spiegata da

X.

Esiste un test per determinare se il coefficiente di

determinazione è significativamente diverso da zero.

In SPSS

Analizza>Regressione>Lineare: bisogna scegliere la variabile dipendente e quella esplicativa. Dalla finestra

principale si possono selezionare alcuni casi e non tutti.

Fra le tabelle prodotte in output, le più interessanti sono:

2

– Quella che riporta il coefficiente di determinazione R

– Quella che riporta le stime dei coefficienti con le relative significatività

Le altre tabelle riportano un riepilogo del modello (inutile per la regressione semplice) e una tabella Anova

che pone a confronto la variabilità spiegata dal modello con la variabilità residua (cioè quella non spiegata

dal modello); se il valore F non è significativo, il modello non è in grado di spiegare la variabile dipendente

Y.

Prima si legge ANOVA per vedere la significatività della relazione.

ANALISI MULTIVARIATA

Esempio

“Nei villaggi dove le cicogne nidificano si osserva un tasso di natalità maggiore: ciò conferma la “teoria” che

le cicogne portano i bambini? In realtà esiste una terza variabile che influenza entrambe: le caratteristiche

di ruralità di alcune zone” Quindi si hanno tre variabili che spiegano il fenomeno della natalità.

Altro esempio:

“Immaginiamo di scoprire una relazione positiva tra l’orientamento politico di un campione della

popolazione (es. il conservatorismo) e la loro età; a parte l’impossibilità di determinare con certezza una

relazione causale, siamo sicuri che la relazione interessi proprio e solo queste variabili? Potrebbe, invece,

riguardare una o più altre variabili a loro volta collegate con l’età: ad esempio il livello di istruzione, oppure

il reddito, o la religiosità, o altro ancora.”

Nelle scienze sociali è impossibile condurre esperimenti controllati come in altre scienze, quindi non siamo

mai sicuri se le relazioni in esame coinvolgano (anche) altre variabili. Poiché spesso tutte, o molte delle

variabili che potrebbero entrare nel processo, covariano (variano insieme), è impossibile isolare l’effetto di

una sola variabile.

analisi multivariata

L’ , considerando diverse variabili contemporaneamente, permette di controllare

l’influenza di una o più variabili supplementare, evidenziando l’effetto netto di una variabile.

Le relazioni multivariate possono coinvolgere anche moltissime variabili; individuare le variabili importanti

è una decisione che deriva prevalentemente dalla teoria sostantiva. È sempre presente il rischio di

escludere o dimenticare variabili che sarebbero state importanti nell’analisi.

I modi in cui le variabili possono essere in relazione sono molti; si vedranno:

- Relazioni spurie

- Relazioni interpretabili

- Causazione multipla

- Interazione

Quando trattiamo le relazioni fra tre variabili, sono possibili diverse configurazioni, a seconda dell’esistenza

e della direzione delle relazioni fra le tre possibili coppie di variabili.

Relazioni spurie

Tra due variabili esiste una relazione spuria quando l’unica ragione della

loro correlazione è che entrambe sono correlate a una terza variabile (è il

caso delle cicogne)

Relazioni interpretabili

Talvolta l’introduzione di una terza variabile ci aiuta ad interpretare la

relazione tra le altre due. (Es. Le neo-laureate faticano più dei colleghi

maschi a trovar lavoro, ma ciò dipende (almeno in parte) alle diverse scelte

formative che compiono.

Causazione multipla

Ormai è diffusa la consapevolezza che le cause di un fenomeno siano

molteplici; considerarle simultaneamente permette di studiare l’importanza

relativa di ciascun fattore nel determinare la variabile di interesse (Per es.

un’opinione politica può dipendere contemporaneamente dall’età

dell’intervistato, dalla sua condizione socio-eco).

Interazione

Si parla di interazione tra due variabili quando l’associazione tra le due varia secondo il valore della variabile

di controllo. Per esempio, l’effetto del background familiare sulla probabilità di cominciare a fumare

potrebbe essere molto forte per i ragazzini più giovani, ma debole (o nullo, o pensiero negativo) per

adolescenti attorno ai 15-17 anni. [ATTENZIONE: INTERAZIONE NON è INTERRELAZIONE].

RAPPRESENTAZIONI GRAFICHE

Si andranno a delineare le rappresentazioni grafiche per:

- Effetto nullo della variabile di controllo

- Effetto parziale della variabile di controllo

- Spiegazione completa della variabile di controllo

- Effetto di interazione positiva della variabile di controllo

- Effetto di interazione negativa della variabile di controllo

QUANTIFICARE LE RELAZIONI FRA TRE VARIABILI

Le relazioni fra variabili in un sistema multivariata possono essere calcolate al

netto delle relazioni con le alte variabili prese in considerazione.

Un indice di questo tipo (r si legge “correlazione parziale tra A e C che

ACB

tiene sotto controllo B) rappresenta la correlazione tra due variabili tenendo

costante la terza. Esiste un test per verificare se è diverso da zero.

Se consideriamo tre qualsiasi variabili X,Y, Z, il coefficiente di correlazione parziale tra X e Y al netto di Z ha

questa forma:

Essendo una correlazione, varia tra -1 e 1. Se Z non è correlata con X e

Y:R =r

xy.z XY

Il coefficiente di correlazione parziale al quadrato indica la parte di

variabilità di Y spiegata dal X “al netto” di Z.

Se abbiamo più di 3 variabili, le formule si complicano ma il concetto resta lo

stesso: le relazioni fra ciascuna coppia di variabili si possono calcolare al

netto di una o più delle altre.

IN SPSS

Analizza>Correlazione>Parziale

In “variabili”: inserire le variabili (quantitative) fra cui voglio calcolare la correlazione.

In “controllo per”: inserire quella variabile alla quale voglio togliere l’effetto.

In “opzioni”: richiedere le “correlazioni di ordine zero”.

Spuntare sempre “visualizza il livello di significatività effettiva”

L’output consiste in una tabella divisa in due:

“Variabili di controllo nessuno” = correlazioni di ordine zero

“Variabili di controllo (variabile)” = correlazione al netto

Questo serve per vedere se varia qualcosa quando tengo sotto controllo una variabile.

REGRESSIONE MULTIPLA

Esempio:

Si conduce un’indagine per capire quali caratteristiche di un individuo possano contribuire a spiegare il suo

livello di conservatorismo. In particolare, ci aspettiamo che:

1) Le persone più giovani siano meno conservatrici, perché la giovane età spesso si associa ad

atteggiamenti di ribellione.

2) Le persone religiose siano più conservatrici, dato che il conservatorismo esprime principi legati alla

morale tradizionale e religiosa.

Poiché sappiamo che in generale le persone anziane sono anche più religiose, come facciamo a distinguere

l’effetto dell’età dall’effetto della religiosità?

Ci torna utile il modello di regressione multipla, che è un modello di analisi asimmetrica che permette di

studiare la relazione lineare tra una variabile dipendente e un insieme di predittori. Si tratta di

un’estensione del modello di regressione analizzato nel caso di un solo predittore; in questo caso, però, la

relazione tra la variabile dipendente e ciascun predittore è calcolata al netto di tutte le altre.

Il modello di regressione multipla è anche il modello per l’analisi dei dati più diffusamente utilizzato

nell’analisi statistica di dati provenienti da diversi fonti e ambiti di analisi.

Si parte dall’ipotesi che esista tra le variabili di interesse una relazione del tipo:


PAGINE

52

PESO

3.16 MB

PUBBLICATO

6 mesi fa


DETTAGLI
Corso di laurea: Corso di laurea magistrale in pubblicità, comunicazione digitale e creatività d'impresa
SSD:
A.A.: 2018-2019

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher thebest_kia di informazioni apprese con la frequenza delle lezioni di Tecniche di Analisi e Raccolta Dati M2 e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Modena e Reggio Emilia - Unimore o del prof Martini Cristiana.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!