Domande teoria statistica
Errore standard dello stimatore
L'errore standard dello stimatore è una misura di precisione che fa riferimento alla variabilità dello stimatore campionario. Cresce con la varianza della popolazione più grande.
Analisi della varianza
Come è la variabile target e come è la dipendente?
Indichiamo l'attribuzione di una variazione nella variabile target metrica alla variazione di una o più variabili esplicative (fattore).
Regressione multipla
Cosa è e cosa misura la collinearità?
La collinearità esiste quando due variabili esplicative sono correlate, c'è perfetta collinearità con 1 e -1 e questo renderebbe impossibile la stima.
Indicatori di tolleranza e VIF
Come devono essere?
Valori di tolleranza vicini a 1 e bassa VIF indicano che la multicollinearità non è un problema. Un VIF = 1 significa che quella variabile non è coinvolta in nessuna situazione di multicollinearità.
Metodi di rotazione dei fattori
Quali sono?
- Varimax: Massimizza la varianza dei loading su ogni fattore
- Quartimax: Massimizza la varianza dei loading su ogni variabile
- Orthomax: Compromesso tra i due dove il ricercatore decide il peso della componente Varimax e Quartimax
- Promax: Mira a portare a zero i pesi fattoriali che sono più piccoli
Cos'è la comunalità?
Le comunalità relative sono comprese tra zero e uno e ci dicono, per ogni variabile, quale percentuale della variabilità originale è spiegata dai fattori estratti.
Analisi discriminante
Il lambda di Wilks deve essere alto o basso?
Il Lambda di Wilks testa la discriminazione fra gruppi. Più è basso e più è alto il potere discriminante della funzione. È legato all'analisi della varianza, calcola il rapporto tra la somma dei quadrati dentro i gruppi e la somma dei quadrati totale.
Individuale: Misura la significatività delle medie dei predittori
Complessivo: Misura la significatività della distribuzione Chi-quadro
Cluster analysis
Quando e come?
Insieme di tecniche usate per classificare i casi in gruppi che sono omogenei al loro interno ed eterogenei tra di loro, misurati sulla base di un insieme definito di variabili, con procedure gerarchiche o non gerarchiche (k-medie). Viene usata in molti campi: segmentazione del mercato, caratteristiche del prodotto, riduzione dei dati, mappe percettive.
Regressione logistica
Quando la utilizzo?
La uso quando la variabile che voglio predire è binaria (0 e 1) e almeno una delle variabili esplicative è metrica e continua.
Test di Kolmogorov-Smirnov
Quando utilizzo il test?
L'ipotesi nulla è che un campione casuale sia tratto da una distribuzione data, il test confronta la distribuzione cumulata empirica con quella teorica e verifica se esse differiscono significativamente. È un test che non fa nessuna assunzione a priori sulla distribuzione.
Significatività
Cos'è la significatività? (con un esempio numerico)
Il livello di significatività è la probabilità che la differenza relativa fra la media campionaria stimata e la media vera nella popolazione sia più grande di un dato livello di accuratezza relativa r.
Test d'ipotesi
Cos'è l'errore del primo tipo?
L'errore del primo tipo è la probabilità di rifiutare H0 (ipotesi nulla) quando è vera.
Regressione multipla
Differenze tra stepwise e forward
Lo stepwise esplora ogni singola variabile esplicativa prima di inserirla nel modello e ad ogni step la procedura può eliminare una delle variabili già incluse nel modello se non c'è una diminuzione significativa del valore F; la regressione forward lavora come la stepwise ma le variabili vengono solo inserite e non eliminate; la regressione backward inizia includendo tutte le variabili eliminando ad ogni step la variabile che provoca il minor decremento nel valore F.
Funzioni discriminanti
Quanti tipi di funzione discriminante posso stimare?
Il numero esatto di funzioni discriminanti è uguale al minore tra (g-1) dove g è il numero di categorie nella classificazione e k che è il numero di variabili dipendenti.
Dati primari e secondari
Differenze tra dati primari e secondari
I dati primari sono i dati raccolti specificatamente per un dato test, mentre i dati secondari sono dati raccolti per un altro test che vengono adattati a quello che vogliamo fare ora.
Metodo del centroide
Cosa misura, la distanza tra elementi o cluster?
Definisce la distanza fra due cluster come la distanza fra i due centroidi dei cluster.
Inerzia totale
Cos'è l'inerzia totale?
È una misura dell'associazione complessiva fra X e Y, uguale alla somma degli autovalori, corrisponde al valore del Chi-quadro diviso per il numero di osservazioni. Per una adeguata rappresentazione ci si aspetta un'inerzia totale superiore a 0,20.
Analisi delle corrispondenze
Cos'è l'analisi delle corrispondenze?
Tecnica statistica multivariata che guarda all'associazione di due o più variabili categoria e le visualizza congiuntamente su un grafico bivariato.
Precisione, validità e affidabilità
Precisione (precision): Quanto dettagliate sono le misure? Se si prendono misure ripetute, qual è la variabilità intorno alla misurazione media?
Affidabilità (reliability): Quando
-
domande esame
-
Domande teoria esame Biomateriali
-
Domande teoria esame automatica
-
Domande esame Microeconomia