Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
SAV
ACQUISIZIONE .XLS Acquisire da file .xls FILE ApriDati
Comparirà una finestra in cui specificare
se la prima riga del file contiene i nomi
delle variabili, il foglio in cui si trovano i
dati (se il file ha fogli multipli) e
l’intervallo di celle da
importare se non si vuole importare tutto
il file.
CONTROLLARE PRIMA FILE E CHIUDERLO,
POI ACQUISIRE DATI.
ACQUISIZIONE DATI Acquisizione da file .txt o FILE ApriDati oppure
ASCII (.TXT O .DAT) .dat ApriLeggi dati di testo
La prima finestra richiede se si tratti di
un formato predefinito; se è la prima
volta che si importa quel file, la
Risposta sarà “No”
TRASPONI Ribaltare foglio dati DATI Trasponi
Primo riquadro inserire quelle che
diverranno le unità, nel secondo la
colonna con il nome delle variabili
SALVA VARIABILI Salvare solo alcune variabili FILE Salva/Salva con nome...
Pulsante “variabili”
SELEZIONA CASI Permette di lavorare solo su DATI Seleziona casi
alcuni casi (CAMPIONI) Selezionare i casi e operare, quando si
vuole tornare a tutto il dataset
disinserire seleziona casi.
CALCOLA VARIABILE Operare con i dati TRASFORMA Calcola variabile
(Da reddito famigliare a (Vedi descrizione per operazioni)
reddito pro-capite) | = or
& = e
ABS = valore assoluto
Se si utilizzano valori stringa usare le
virgolette o l’apice
DISTINGUI Permette di operare su casi DATI Dividi o distingui
distinti (m/f)
ORDINA CASI Ordinare i casi in base a DATI Ordina casi…
determinati criteri
CONTA VALORI Conteggio dei valori indicati TRASFORMA Conta valori all’interno dei
ALL’INTERNO DEI CASI (p.e. quanti hanno 2 figli?) casi/Conteggia
RICODIFICA Trasforma dati esistenti in TRASFORMA Ricodifica
dati nuovi
(Da stringa a valori, per
categorizzare)
CATEGORIZZA DATI Categorizza i dati dandoti TRASFORMA Categorizzazione visuale
Inserisci variabile nell’altra finestra;
prima una visione “continua”; segmenta a piacere
d’insieme delle unità personale “crea punti di divisione”
FREQUENZE Permette di sintetizzare i ANALIZZA Statistiche descrittive>Frequenze
dati
INDICATORI SINTETICI Permette di sintetizzare i ANALIZZA Statistiche descrittive>Descrittive
dati senza tabelle di
frequenze
INTERVALLI DI Per verificare l’attendibilità ANALIZZA Statistiche descrittive>Esplora
CONFIDENZA dei miei dati
CONFERMARE UNA TEST a campione unico (per ANALIZZA Confronta medie>Test T: campione
NOSTRA TEORIA (con un un solo valore) unico
solo valore) Inserire valore che sarà il nostro H0
CONFERMARE UNA Confrontare gruppi simili ANALIZZA Confronta medie>Test T: campioni
TEORIA TRA DUE GRUPPI (mariti/mogli) per verificare appaiati
SIMILI una nostra teoria
CONFERMARE UNA Confrontare gruppi di due ANALIZZA Confronta medie> Test T: campioni
TEORIA TRA DUE GRUPPI popolazioni differenti indipendenti
DIFFERENTI PRIMA VALUTARE IL TEST DI LEVENE
CONFRONTO TRA Più DI Confrontare fra più di due ANALIZZA Confronta medie>ANOVA
DUE GRUPPI gruppi (ANALISI DELLA La Y deve essere quantitativa, il
VARIANZA A UNA VIA) fattore deve essere sconnesso
(QUINDI NEL CASO RICODIFICARLO).
(Descrittive, Test Omogeneità della
varianza, Brown-Forsythe e Welch)
Se non viene a causa di un valore
controllare il valore e metterlo come
missing.
La varianza si vede da Sign. 000.
RELAZIONE TRA Trovare relazione fra le ANALIZZA Statistiche descrittive>Tavole di
DICOTOMICHE dicotomiche contingenza
Indice di rischio. Se nella stima del
rischio l’intervallo di confidenza non
contiene l’1 allora è significativo.
Poi si guarda il “valore”.
RELAZIONE TRA Trovare relazione fra ANALIZZA Statistiche descrittive>Tavole di
QUALITATIVE ORDINALI qualitative ordinali con contingenza
tavole di contingenza Richiedere Gamma e valutare la
significatività e la relazione positiva o
negativa.
REGRESSIONE LINEARE Relazione bivariata ANALIZZA Lineare
Descrivere la relazione
tra due variabili per
poter prevedere i valori
dell’altra.
REGRESSIONE MULTIPLA Permette di studiare la ANALIZZA Lineare
relazione lineare tra una A differenza di quella prima
variabile dipendente e tanti aggiungiamo più variabili (valutare
predittori. variabile per variabile e inserirle o
modificarle – per dicotomiche o
qualitative sconnesse)
Valutare bontà modello guardando r-
quadrato.
Valutare coefficienti e la loro
significatività.
Dopodiché si deve valutare quali
variabili sono in interazione tra loro.
VARIABILE A RESIDUO Pre-regressione: per TRASFORMA Calcola variabile:
trasformare variabile Una ad una le modalità di risposta
qualitativa sconnessa in più vengono convertite in diverse variabili
variabili dicotomiche con dicotomiche, tralasciando la variabile
una a residuo che si vuole lasciare a residuo.
ANALISI DI CRONBACH Per analizzare se possiamo ANALIZZA Scala>Analisi di affidabilità
fare un’analisi fattoriale Valutare in statistiche di affidabilità
(valore soglia 0,7) l’Alpha (deve esser superiore a 0,7)
SINTETIZZARE Analisi fattoriale: sintetizzare ANALIZZA Riduzione dati>Fattoriale
DETERMINATE VARIABILI i dati.
(ES. SODDISFAZIONI)
ESERCIZI
Generali
“Se laureato o diplomato metti 1” : usare | (or) e non “If”
“Media fra valori”: Mean
“Costruire una variabile che riporta il numero di beni posseduti dalla lista proposta”: NO SOMMA,
ma CONTA VALORI se + una variabile con (1=si, 2=no)
“Costruire variabile-contatore” utilizzare “Conta valori all’interno dei casi”
“non inferiore ai 50”= >=50
“superiore ai 50” >50
“Fai una sintesi estrema del fenomeno X”: MODA
“Verificare se la percentuale di coloro che possiedono internet (variabile 1=si, 2=no) è
significativamente diversa dal 25%” = modificare variabile (0/1) e test T campione unico con valore
soglia 0,25
ESERCIZIO 1- Sintesi frequenze 1. Acquisire file
o Visualizzare le due variabili singolarmente: Tabelle di frequenza
o Distinti per sesso: dividi per variabili di sesso e poi procedere con
tabelle di frequenza.
o Per sintetizzare le altre variabili, togliere l’input “dividi”
o Per il reddito: le tabelle di frequenza non è ideale. È una variabile
QUANTITATIVA perciò ha senso richiedere media e mediana.
Inoltre è utili valutarle con le misure di dispersione. E in più grafici:
come istogramma. [TUTTO NELL’INPUT STATISTICHE>FREQUENZE]
o Per livelli vari: sono variabili ORDINALI (CATEGORIE) perciò bisogna
impostare l’analisi (sempre stratistiche>frequenze) cosi: le tabelle
di frequenze sono utili, le medie no, la mediana si, la moda, le
misure dispersione NO, per i grafici possiamo scegliere quelli a
barre o a torta.
ESERCIZIO 2 – Distingui casi o Acquisire file
o Dividere dataset per sesso
o Statistiche>frequenze>livello di istruzione e stato civile : tabelle di
frequenza e grafici a barre
o Togliere il dividi e impostarlo sul livello di istruzione
o Tabella di frequenza per categoria di reddito (con possibilità di
moda, mediana e grafici a barre)
o Togliere dividi e impostarlo su sesso e livello di istruzione
o Nella tabella frequenze indicare tutti i beni tecnologici e impostare
tutte le impostazioni per le qualitative poiché non si può avere un
bene e mezzo, ma solo uno o due.
ESERCIZIO 3 – Rappresentazione grafica
o Acquisire il file
o Per l’indice di asimmetria: non chiedere le tabelle di
frequenza (perché si sta parlando di reddito), ma chiedere
comunque l’istogramma; si può chiedere media e mediana
(sono modi diversi di vedere l’asimmetria) perché la media è
molto più grande della mediana perciò vuol dire che c’è una
coda a destra che trascina la media verso più alti.
o Calcolare reddito medio e mediano f e m: dividere dataset
o Definire qual è il reddito che solo una famiglia su dieci riesce
a superare: non è il 10° percentile, perché il 90% supera quel
reddito, mentre è il 90° percentile che serve.
o Rappresentazioni grafiche:
o Livello di istruzione: ordinale perciò con barre
o Autovetture/pensionati: box plot
o Distribuzione redditi per livello di istruzione e sesso: box plot
o Categoria di reddito e istruzione: asse x istruzione, cluster reddito (ordinale)
o Numero anni di permanenza e reddito: dispersione x (anni), y (reddito)
o Livello di soddisfazione per il lavoro diviso per sesso: a barre
ESERCIZIO 4 – Dividi, percentili e intervallo di confidenza
1. Acquisire file
2. (Mod1) Dividi sposati e non
a. Analizza>Statistiche>Frequenze
2bis.(Mod2) Analisi>Statistiche>Esplora
a. Inserire in fattori: stato civile
b. Variabili dipendenti: costo mezzo
c. Statistiche..>Descrittive
3. Impostare tutto tramite menù precedente togliendo però il
fattore.
4. Impostare menù precedente con fattore “sesso” e “costo” come
dipendente.
5. Analisi>Statistiche>Esplora>Reimposta + “reddito” e in
Statistiche… prima mettere 95 e poi 99.
ESERCIZIO 5 – Test T a campione singolo
1. Acquisire file
2. Trasforma>Calcola variabile> reddito familiare/numero
membri
2a. Analizza>Confronta medie>Test T a campione singolo>
“reddito pro capite” “44”
3. Dati>Dividi>Grado di istruzione
3a. Analizza>Statistiche>Frequenza>Media
3bis. Analizza>Confronta medie> indipendenti “età”,
dipendenti “grado di istruzione”.
4. (se fatto con il modo 3) Togliere dividi
4a. Analizza>Confronta medie>Test T a campione singolo>
“Costo del mezzo di trasporto” “30”
H0 quindi è 30. T ci dice che siamo 0,468, cioè molto
vicino ad H0. Il p-value indica che vi è il 64% di
probabilità di allontanarsi dal valore di H0, perciò non di
molto. Quindi accettiamo l’ipotesi che H0 sia 30.
5. Dati>Dividi>Pensione
5a. Analizza> Confronta medie>Test T a campione unico>
“Costo del mezzo di trasporto” “30”.
Il p-value è molto basso: non ci sono molte probabilità che
trovi gli stessi valori. Rifiutiamo H0.
6. Togliere dividi
6a. Trasforma>Calcola variabile “Internet =1”
6b. Analizza>Confronta medie>Test T a campione singolo>
“Internet” “0,25”
Avevamo 4 possibilità