Estratto del documento

Domande teoria statistica

Errore standard dello stimatore

L'errore standard dello stimatore è una misura di precisione che fa riferimento alla variabilità dello stimatore campionario. Cresce con la varianza della popolazione più grande.

Analisi della varianza

Come è la variabile target e come è la dipendente?

Indichiamo l'attribuzione di una variazione nella variabile target metrica alla variazione di una o più variabili esplicative (fattore).

Regressione multipla

Cosa è e cosa misura la collinearità?

La collinearità esiste quando due variabili esplicative sono correlate, c'è perfetta collinearità con 1 e -1 e questo renderebbe impossibile la stima.

Indicatori di tolleranza e VIF

Come devono essere?

Valori di tolleranza vicini a 1 e bassa VIF indicano che la multicollinearità non è un problema. Un VIF = 1 significa che quella variabile non è coinvolta in nessuna situazione di multicollinearità.

Metodi di rotazione dei fattori

Quali sono?

  • Varimax: Massimizza la varianza dei loading su ogni fattore
  • Quartimax: Massimizza la varianza dei loading su ogni variabile
  • Orthomax: Compromesso tra i due dove il ricercatore decide il peso della componente Varimax e Quartimax
  • Promax: Mira a portare a zero i pesi fattoriali che sono più piccoli

Cos'è la comunalità?

Le comunalità relative sono comprese tra zero e uno e ci dicono, per ogni variabile, quale percentuale della variabilità originale è spiegata dai fattori estratti.

Analisi discriminante

Il lambda di Wilks deve essere alto o basso?

Il Lambda di Wilks testa la discriminazione fra gruppi. Più è basso e più è alto il potere discriminante della funzione. È legato all'analisi della varianza, calcola il rapporto tra la somma dei quadrati dentro i gruppi e la somma dei quadrati totale.

Individuale: Misura la significatività delle medie dei predittori

Complessivo: Misura la significatività della distribuzione Chi-quadro

Cluster analysis

Quando e come?

Insieme di tecniche usate per classificare i casi in gruppi che sono omogenei al loro interno ed eterogenei tra di loro, misurati sulla base di un insieme definito di variabili, con procedure gerarchiche o non gerarchiche (k-medie). Viene usata in molti campi: segmentazione del mercato, caratteristiche del prodotto, riduzione dei dati, mappe percettive.

Regressione logistica

Quando la utilizzo?

La uso quando la variabile che voglio predire è binaria (0 e 1) e almeno una delle variabili esplicative è metrica e continua.

Test di Kolmogorov-Smirnov

Quando utilizzo il test?

L'ipotesi nulla è che un campione casuale sia tratto da una distribuzione data, il test confronta la distribuzione cumulata empirica con quella teorica e verifica se esse differiscono significativamente. È un test che non fa nessuna assunzione a priori sulla distribuzione.

Significatività

Cos'è la significatività? (con un esempio numerico)

Il livello di significatività è la probabilità che la differenza relativa fra la media campionaria stimata e la media vera nella popolazione sia più grande di un dato livello di accuratezza relativa r.

Test d'ipotesi

Cos'è l'errore del primo tipo?

L'errore del primo tipo è la probabilità di rifiutare H0 (ipotesi nulla) quando è vera.

Regressione multipla

Differenze tra stepwise e forward

Lo stepwise esplora ogni singola variabile esplicativa prima di inserirla nel modello e ad ogni step la procedura può eliminare una delle variabili già incluse nel modello se non c'è una diminuzione significativa del valore F; la regressione forward lavora come la stepwise ma le variabili vengono solo inserite e non eliminate; la regressione backward inizia includendo tutte le variabili eliminando ad ogni step la variabile che provoca il minor decremento nel valore F.

Funzioni discriminanti

Quanti tipi di funzione discriminante posso stimare?

Il numero esatto di funzioni discriminanti è uguale al minore tra (g-1) dove g è il numero di categorie nella classificazione e k che è il numero di variabili dipendenti.

Dati primari e secondari

Differenze tra dati primari e secondari

I dati primari sono i dati raccolti specificatamente per un dato test, mentre i dati secondari sono dati raccolti per un altro test che vengono adattati a quello che vogliamo fare ora.

Metodo del centroide

Cosa misura, la distanza tra elementi o cluster?

Definisce la distanza fra due cluster come la distanza fra i due centroidi dei cluster.

Inerzia totale

Cos'è l'inerzia totale?

È una misura dell'associazione complessiva fra X e Y, uguale alla somma degli autovalori, corrisponde al valore del Chi-quadro diviso per il numero di osservazioni. Per una adeguata rappresentazione ci si aspetta un'inerzia totale superiore a 0,20.

Analisi delle corrispondenze

Cos'è l'analisi delle corrispondenze?

Tecnica statistica multivariata che guarda all'associazione di due o più variabili categoria e le visualizza congiuntamente su un grafico bivariato.

Precisione, validità e affidabilità

Precisione (precision): Quanto dettagliate sono le misure? Se si prendono misure ripetute, qual è la variabilità intorno alla misurazione media?

Affidabilità (reliability): Quando

Anteprima
Vedrai una selezione di 3 pagine su 9
Domande Esame Teoria Pag. 1 Domande Esame Teoria Pag. 2
Anteprima di 3 pagg. su 9.
Scarica il documento per vederlo tutto.
Domande Esame Teoria Pag. 6
1 su 9
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher sumo993 di informazioni apprese con la frequenza delle lezioni di Strumenti quantitativi per le previsioni di mercato e per l'analisi avanzata dei dati e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano o del prof De Battisti Francesca.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community