Comandi Stata
Describe
Describe → Descrizione di tutte le variabili
Describe + nome variabile/i → Descrive solo quelle variabili
Summarize
Summarize → Informazioni aggiuntive sulle variabili
Tab e opzioni
Tab + nome variabile → Tabella di frequenza
Obs → Numero di individui
Mean → Media (non vale per le variabili nominali e ordinali perché non si possono quantificare)
Cum → Percentuale cumulativa → somma delle percentuali precedenti (non ha senso per dati che non si possono quantificare)
Tab1 + nomi variabili → Per vedere tutte le tabelle insieme
Tab + due variabili → Tavola di contingenza (le celle sono le frequenze)
Tab + variabile + row → Vedere le righe della tabella (con frequenza)
Tab + variabile + column → Vedere le colonne della tabella (con frequenza)
Tab + variabile + column + nofreq → Per non vedere la frequenza
Grafici
Graph bar, over (nome variabile) → Creazione di un grafico a barre
Graph pie, over (nome variabile) → Creazione di un grafico a torta
Generare una nuova variabile
Esempio: Voglio sapere la data di nascita delle persone per anno di ricerca:
Generate year_birth = year survey – age (si realizza sottraendo l’anno della ricerca all’età)
1. Aprire un nuovo dataset es. Use EVS_gen, clear
2. Analizzare le variabili → Summarize + nomi variabili e poi tab1 + nomi variabili
3. Generare la nuova variabile → Generate + nome nuova variabile
4. Analizzare la nuova variabile → Summarize + nuova variabile e poi tab + nuova variabile
Ricodificare una variabile esistente
Esempio: Voglio creare una nuova variabile con la versione ricodificata di health
1. Aprire un nuovo dataset → Use + nome dataset + , + clear (es. Use EVS_recode, clear)
2. Analizzare la variabile → Summarize e poi tab
3. Creare una nuova variabile con la versione ricodificata di health ad esempio: Recode + nome vecchia variabile
Confronto tra medie
Da usare quando la variabile dipendente è cardinale (ovvero si tratta di numeri)
Table + variabile indipendente + , + content (mean variabile dipendente)
Anova + variabile dipendente + variabile indipendente → Grado di sicurezza della ricerca → Significatività (deve essere inferiore a 0.05 per essere una relazione significativa e quindi per poter commentare con sicurezza → Riga con nome della variabile)
Estat esize
Estat esize → Valore di eta-squared → Forza della relazione:
< 0.1 → Debole
< 0.3 → Media
> 0.3 → Forte
Grafici avanzati
Graph bar, over (variabile indipendente, label (alternate)) → Avere un grafico a barre più chiaro
Tavole di contingenza
Da usare quando le due variabili sono categoriali.