vuoi
o PayPal
tutte le volte che vuoi
Formattazione del testo
TAB + NOME VARIABILE 1 + NOME VARIABILE 2 + COLUMN + NOFREQ (la prima variabile che si scrive è quella che va in riga → deve essere quella indipendente)
TROVARE LA SIGNIFICATIVITÀ:
Si valuta osservando la PROB (deve essere inferiore a 0.05 → se è 0 vuol dire che è forte se si allontana da 0 è debole)
TROVA LA FORZA:
variabili nominali (VCRAMER) → TAB + VARIABILE1 + VARIABILE 2, + COLUMN + NOFREQ + V + CHI2 → 0 relazione debole – 1 relazione forte
variabili ordinali (GAMMA) → TAB + VARIABILE1 + VARIABILE2, + COLUMN + NOFREQ + GAMMA + CHI2 → 0 relazione debole – +1 relazione forte diretta - -1 relazione forte inversa
KEEP DROP IF
KEEP → tieni una o più variabili
DROP → cancella una o più variabili
IF → unito a keep o drop cancella o tiene solo alcune cose
KEEP IF VARIABILE1 == NOME DI COSA TENERE
DROP IF VARIBILE1 == NOME DI COSA CANCELLARE
DROP IF VARIABILE 1== NOME DI COSA CANCELLARE &
VARIABILE2== NOMEDI COSA CANCELLARETOGLIERE VALORI NON SO/NON RISPONDOMVDECODE + VARIABILE1, MV(-1=. \ -2=.)
REGRESSIONE LINEARE:esplorare le variabili (tab/fre/mvdecode)
SUMMARIZE → vedere la media e la deviazione standard
GRAPHBAR → vedere la distribuzione di frequenza (come si dispgono icasi nella var)
REGRESS + VARIABILE DIPENDENTE + VARIABILE INDIPENDENTE(osservare i valori di var.ind – beta – cons – alfa- r-squared – strettezza –p>t – significatività)
DISEGNARE LA RETTA SUL PIANO CARTESIANO
TWOWAY LFIT + VAR DIPENDENTE + VAR INDIPENDENTE(asse vert.) (asse orizz.)
TROVARE LA NUVOLA DI PUNTI (diagramma di dispersione)
TWOWAY (LFIT VAR, DIP + VAR. INDIP) (SCATTER VAR DIP + VAR IND)
R-SQUARED “spiega il …. % della varianza poiché il valore di r-squared è di ….”
REGRESSIONE CON VARIABILI DUMMYda usare quando la variabile dipendente è cardinale e quella indipendente ècategoriale
- (ordinale/nominale): fre var dipendentemvdecode var. Dipendente, mv (valori da togliere)
- tab var dipendentedrop if var indipendente == valori da eliminare → con la var. Categoria
- lesi deve usare droptab var. Indipendente
- GEN CATEGORIA1= VARIABILE INDIPENDENTE == 1
- GEN CATEGORIA2= VARIABILE INDIPENDENTE == 2
- GEN CATEGORIA3= VARIABILE INDIPENDENTE == 3
- TAB1 CATEGORIA1 CATEGORIA2 CATEGORIA3-> tabulation of primary
- primary Freq. Percent Cum.
- 0 1,389 61.35 61.35
- 1 875 38.65 100.00
- Total 2,264 100.00
- → tabulation of secondary
- secondary Freq. Percent Cum.
- 0 1,256 55.48 55.48
- 1 1,008 44.52 100.00
- Total 2,264 100.00
- → tabulation of high
- high Freq. Percent Cum.
- 0 1,883 83.17 83.17
- 1 381 16.83 100.00
- Total 2,264 100.00
- PRIMARY0 → persone che hanno high/secondary → 13891 → persone che hanno primary → 875(uguale con secondary e high)
- REGRESS VARIABILE DIPENDENTE CATEGORIA2 CATEGORIA3. regress v153 secondary high
- Source SS df MS Number of obs = 2,138
- F(2, 2135) = 109.45
- Model 1913.20012 2
956.600059 Prob > F = 0.0000
Residual 18659.9 2,135 8.73999999
R-squared = 0.0930
Adj R-squared = 0.0921
Total 20573.1001 2,137 9.6270941
Root MSE = 2.9563
v153 Coef. Std. Err. t P>|t| [95% Conf. Interval]
secondary 1.548646 .1406913 11.01 0.000 1.27274 1.824553
high 2.517327 .1864839 13.50 0.000 2.151618 2.883036
_cons 5.148418 .1031145 49.93 0.000 4.946203 5.350634
cons → primary → 5.14 → giustificabilità per chi ha la scuola primaria
secondary → 1.54 → giust. Aumenta di 1.54 per chi ha la scuola secondaria
high → 2.51 → giust. Aumenta di 2.51 per chi ha la laurea
differenza tra high e secondary: 2.51 – 1.54
misura della strettezza della relazione (quanto il modello è buono)
R-squared → Spiega il … % della varianza della variabile dipendente, rispetto al modello
basato sulla sola media riduce gli errori del … %
INDICI E TIPOLOGIE
- INDICI
FRE + TUTTE LE VARIABILI DI INTERESSE
CODE VAR1 *operazioni di ricodifica*, GEN
(NUOVA VAR) → ricodificare i valori invertendoli in base alle esigenze
GENERATE MEDIA (*VARIABILE OBIETTIVO) = VAR1 + VAR2 + VAR3 + VAR4 → creazione dell'indice sommando tutte le variabili utilizzate
TAB MEDIA → osservare il risultato
GRAPH BAR, OVER (MEDIA) → vedere la distribuzione
- VERSIONE DICOTOMICA DELL'INDICE
RECODE VAR1 *operazioni di ricodifica*, GEN (NUOVA VAR) → ricodifica della variabile VAR1 con le operazioni specificate, generando la nuova variabile NUOVA VAR
- TIPOLOGIA
TAB VARDIC1 VARDIC2
GENERATE PART=- → bisogna togliere i missing: creare una variabile di soli missing
REPLACE PART=1 IF VARDIC2==? & VARDIC==? → riassegnare i valori ai casi non mancanti (fare lo stesso con tutti gli altri valori)
TAB PART
LABEL DEFINE PART_LB *nomi* → assegnare un'etichetta per capire meglio i numeri
LABEL VALUES PART PART_LB
TAB PART
TAB VAR PART, ROW V CHI2 → tavola di contingenza (vedere le differenze tra variabili)
REGRESS VAR1 VAR2 → vedere se ci sono relazioni tra le variabili