Anteprima
Vedrai una selezione di 1 pagina su 5
Comandi stata Pag. 1
1 su 5
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Formattazione del testo

TAB + NOME VARIABILE 1 + NOME VARIABILE 2 + COLUMN + NOFREQ (la prima variabile che si scrive è quella che va in riga → deve essere quella indipendente)

TROVARE LA SIGNIFICATIVITÀ:

Si valuta osservando la PROB (deve essere inferiore a 0.05 → se è 0 vuol dire che è forte se si allontana da 0 è debole)

TROVA LA FORZA:

variabili nominali (VCRAMER) → TAB + VARIABILE1 + VARIABILE 2, + COLUMN + NOFREQ + V + CHI2 → 0 relazione debole – 1 relazione forte

variabili ordinali (GAMMA) → TAB + VARIABILE1 + VARIABILE2, + COLUMN + NOFREQ + GAMMA + CHI2 → 0 relazione debole – +1 relazione forte diretta - -1 relazione forte inversa

KEEP DROP IF

KEEP → tieni una o più variabili

DROP → cancella una o più variabili

IF → unito a keep o drop cancella o tiene solo alcune cose

KEEP IF VARIABILE1 == NOME DI COSA TENERE

DROP IF VARIBILE1 == NOME DI COSA CANCELLARE

DROP IF VARIABILE 1== NOME DI COSA CANCELLARE &

VARIABILE2== NOMEDI COSA CANCELLARETOGLIERE VALORI NON SO/NON RISPONDOMVDECODE + VARIABILE1, MV(-1=. \ -2=.)

REGRESSIONE LINEARE:esplorare le variabili (tab/fre/mvdecode)

SUMMARIZE → vedere la media e la deviazione standard

GRAPHBAR → vedere la distribuzione di frequenza (come si dispgono icasi nella var)

REGRESS + VARIABILE DIPENDENTE + VARIABILE INDIPENDENTE(osservare i valori di var.ind – beta – cons – alfa- r-squared – strettezza –p>t – significatività)

DISEGNARE LA RETTA SUL PIANO CARTESIANO

TWOWAY LFIT + VAR DIPENDENTE + VAR INDIPENDENTE(asse vert.) (asse orizz.)

TROVARE LA NUVOLA DI PUNTI (diagramma di dispersione)

TWOWAY (LFIT VAR, DIP + VAR. INDIP) (SCATTER VAR DIP + VAR IND)

R-SQUARED “spiega il …. % della varianza poiché il valore di r-squared è di ….”

REGRESSIONE CON VARIABILI DUMMYda usare quando la variabile dipendente è cardinale e quella indipendente ècategoriale

  1. (ordinale/nominale): fre var dipendentemvdecode var. Dipendente, mv (valori da togliere)
  2. tab var dipendentedrop if var indipendente == valori da eliminare → con la var. Categoria
  3. lesi deve usare droptab var. Indipendente
  4. GEN CATEGORIA1= VARIABILE INDIPENDENTE == 1
  5. GEN CATEGORIA2= VARIABILE INDIPENDENTE == 2
  6. GEN CATEGORIA3= VARIABILE INDIPENDENTE == 3
  7. TAB1 CATEGORIA1 CATEGORIA2 CATEGORIA3-> tabulation of primary
  8. primary Freq. Percent Cum.
  9. 0 1,389 61.35 61.35
  10. 1 875 38.65 100.00
  11. Total 2,264 100.00
  12. → tabulation of secondary
  13. secondary Freq. Percent Cum.
  14. 0 1,256 55.48 55.48
  15. 1 1,008 44.52 100.00
  16. Total 2,264 100.00
  17. → tabulation of high
  18. high Freq. Percent Cum.
  19. 0 1,883 83.17 83.17
  20. 1 381 16.83 100.00
  21. Total 2,264 100.00
  22. PRIMARY0 → persone che hanno high/secondary → 13891 → persone che hanno primary → 875(uguale con secondary e high)
  23. REGRESS VARIABILE DIPENDENTE CATEGORIA2 CATEGORIA3. regress v153 secondary high
  24. Source SS df MS Number of obs = 2,138
  25. F(2, 2135) = 109.45
  26. Model 1913.20012 2

956.600059 Prob > F = 0.0000

Residual 18659.9 2,135 8.73999999

R-squared = 0.0930

Adj R-squared = 0.0921

Total 20573.1001 2,137 9.6270941

Root MSE = 2.9563

v153 Coef. Std. Err. t P>|t| [95% Conf. Interval]

secondary 1.548646 .1406913 11.01 0.000 1.27274 1.824553

high 2.517327 .1864839 13.50 0.000 2.151618 2.883036

_cons 5.148418 .1031145 49.93 0.000 4.946203 5.350634

cons → primary → 5.14 → giustificabilità per chi ha la scuola primaria

secondary → 1.54 → giust. Aumenta di 1.54 per chi ha la scuola secondaria

high → 2.51 → giust. Aumenta di 2.51 per chi ha la laurea

differenza tra high e secondary: 2.51 – 1.54

misura della strettezza della relazione (quanto il modello è buono)

R-squared → Spiega il … % della varianza della variabile dipendente, rispetto al modello

basato sulla sola media riduce gli errori del … %

INDICI E TIPOLOGIE

- INDICI

FRE + TUTTE LE VARIABILI DI INTERESSE

CODE VAR1 *operazioni di ricodifica*, GEN

(NUOVA VAR) → ricodificare i valori invertendoli in base alle esigenze

GENERATE MEDIA (*VARIABILE OBIETTIVO) = VAR1 + VAR2 + VAR3 + VAR4 → creazione dell'indice sommando tutte le variabili utilizzate

TAB MEDIA → osservare il risultato

GRAPH BAR, OVER (MEDIA) → vedere la distribuzione

- VERSIONE DICOTOMICA DELL'INDICE

RECODE VAR1 *operazioni di ricodifica*, GEN (NUOVA VAR) → ricodifica della variabile VAR1 con le operazioni specificate, generando la nuova variabile NUOVA VAR

- TIPOLOGIA

TAB VARDIC1 VARDIC2

GENERATE PART=- → bisogna togliere i missing: creare una variabile di soli missing

REPLACE PART=1 IF VARDIC2==? & VARDIC==? → riassegnare i valori ai casi non mancanti (fare lo stesso con tutti gli altri valori)

TAB PART

LABEL DEFINE PART_LB *nomi* → assegnare un'etichetta per capire meglio i numeri

LABEL VALUES PART PART_LB

TAB PART

TAB VAR PART, ROW V CHI2 → tavola di contingenza (vedere le differenze tra variabili)

REGRESS VAR1 VAR2 → vedere se ci sono relazioni tra le variabili

Dettagli
Publisher
A.A. 2020-2021
5 pagine
1 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher carolaam di informazioni apprese con la frequenza delle lezioni di Analisi dei dati e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano o del prof Biolcati Rinaldi Ferruccio.