Che materia stai cercando?

Anteprima

ESTRATTO DOCUMENTO

No perché la Prob. > F =0, quindi il modello è significativo

La somma delle correlazioni al quadrato tra le componenti principali e la j-ma variabile osservata è:

La comunalità della j-ma variabile (sempre minore o uguale a 1)

La specificity:

Dipende in maniera diretta dal valore di cut-off

Quali sono gli indici utilizzati per la scelta del numero di gruppi?

Sono la pseudo-F e la pseudo-T²

In riferimento all’output 2 e sapendo che sex indica la dummy UOMO, cosa possiamo concludere?

Gli uomini hanno maggiori probabilità di non essere assunti rispetto alle donne

In riferimento all’output 2 possiamo accettare l’ipotesi nulla che tutti i coefficienti di regressione

siano zero?

No

La somma degli autovalori di tutte le componenti principali è:

Uguale alla somma delle varianze di tutte le variabili originali.

La probabilità di un evento è un numero:

Compreso tra 0 e 1

La probabilità dell’unione di due eventi incompatibili P(AUB) è:

P(A)+P(B)

La probabilità dell’intersezione di due eventi indipendenti P(A∩B) è:

P(A)P(B)

La varianza di una variabile aleatoria è definita come:

Il valore atteso degli scarti dalla media al quadrato

Uno stimatore è:

Una variabile aleatoria funzione dei dati campionari

Nei test l’errore di primo tipo è:

Rifiutare l’ipotesi nulla quando è vera

Data la variabile aleatoria:

X -1 0 1

P(x) 0,3 0,4 ?

Completare la funzione di probabilità e calcolare il valore atteso:

0,3

Nel modello di regressione lineare omoschedastico il termine di errore:

Ha distribuzione normale con media zero e varianza costante

Quale relazione lega le tre quantità SSM, SSR E SST?

SST=SSM+SSR

La funzione logistica è:

Non lineare ma monotona

A cosa serve il coefficiente di determinazione R²?

è una misura della bontà di adattamento del modello ai dati, indica quella parte di variabilità della Y

spiegata dal modello e ha sempre un valore compreso tra 0 (minimo adttamento) e 1 (massimo

adattamento)

La distanza euclidea tra due unità può essere interpretata come:

Una dissimilarità

Le componenti principali sono:

A media zero

Uno dei criteri per la scelta del numero di componenti seleziona quelle con varianza:

Maggiore di 1

La somma delle varianze delle componenti principali è:

Pari a K (numero di variabili originali)

Nel modello di regressione lineare cosa distingue il test t da quello F?

Il test t misura la significatività delle singole variabili, mentre l’F la significatività del modello nel suo

complesso

Nel modello AR1 le osservazioni sono:

Correlate

Se le osservazioni sono indipendenti, ci aspettiamo un valore del DW pari a:

Due

Il criterio di informazione AIC serve per:

Selezionare il modello

Un malore del Durbin-Watson pari a 0,63 indica:

Autocorrelazione di lag 1 dei residui positiva

In riferimento all’output 1, calcolare i valori Z mancanti:

Z=Coeff/StError

In riferimento all’output1 e sapendo che USOL indica la dummy “uso privato”, possiamo

concludere:

I prestiti per uso privato hanno minor probabilità di andare in default rispetto a quelli per altro uso

Un p-value pari a o,80:

Ci porta ad accettare l’ipotesi nulla

Con quale modello/i possiamo analizzare la dipendenza di una variabile continua Y da una

variabile categorica X?

Con la regressione lineare o il modello Anova

In riferimento all’output 2, la percentuale di corretta classificazione è:

75,70

In un modello logit o probit ha senso assumere la variabile risposta come omoschedastica?

No perché la variabile risposta è di Bernoulli e ha una varianza che dipende dalla media e quindi

non p costante.

Quali sono le ipotesi sulla distribuzione della variabile risposta nel modello logit?

La variabile risposta è una Bernoulli con osservazioni indipendenti, la cui probabilità dipende da i

Con quale modello possiamo analizzare la dipendenza di una variabile continua Y da una variabile

categorica X?

Nel caso in cui le variabili indipendenti siano categoriche si utilizza il modello ANOVA, verificando

la presenza di differenze significative tra medie condizionate

K-Medie

E’ un metodo NON GERARCHICO dove il numero di cluster è deciso a priori e l’algoritmo è:

scelgo G centri iniziali; assegno unità ai vari centri secondo la minima distanza; ricalcolo i G centri

come baricentri; continuo fino a quando i baricentri risultano non significativamente diversi dai

precedenti.

Quali sono le due assunzioni distribuzionali adottate per il termine di errore del modello lineare di

utilità?

Per il modello LOGIT la distribuzione è la logistica; per il PROBIT la distribuzione è la normale

standard

Le componenti principali sono:

A media zero, varianza decrescente, la varianza totale=somma varianza delle componenti

Le componenti principali sono incorrelate con le variabili di partenza?

No, infatti sono incorrelate

La sensitivity è:

La quota di eventi osservati che sono predetti come evento

La sensitivity

Dipende in maniera inversa dal cut-off

La specificity

E’ la quota di non eventi predetti come non eventi


ACQUISTATO

2 volte

PAGINE

7

PESO

17.40 KB

PUBBLICATO

+1 anno fa


DETTAGLI
Corso di laurea: Corso di laurea magistrale in economia e management
SSD:
A.A.: 2016-2017

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher dragan158 di informazioni apprese con la frequenza delle lezioni di Metodi statistici per il management e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Tor Vergata - Uniroma2 o del prof Rocci Roberto.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Metodi statistici per il management

Riassunti metodi statistici per il management
Appunto
Configurazioni di capitale
Dispensa
Critica di Lucas
Dispensa
Operazioni di assestamento
Dispensa