Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Slide Plot Residui
1) Mette in relazione i residui con i valori previsti, i residui si distribuiscono in modo causale attorno alla linea grigetta che rappresenta un residuo pari a zero. La curva rossa (interpola il valore medio dei residui che noi abbiamo calcolato), approssima lo zero.
2) Anche i residui standardizzati presentano una distribuzione casuale.
3) I residui seguono una distribuzione normale.
4) Il valore del leverage dei punti rappresenta una misura di importanza della singola osservazione nel determinare il risultato della regressione. Non ci sono valori di leverage elevati, sono all'interno delle curve di contorno della distanza di Cook. Gli outlier hanno una distanza inferiore a 1.
Quella quadratica si adatta meglio, coglie la curvatura evidenziata dall'andamento dei dati. Se beta2 è uguale a zero, income al quadrato non ha influenza. Guardo il p-value di beta2. Il coefficiente income alla terza non è significativamente diverso da zero. Il p-value
non è inferiore alla soglia del livello di significatività dello 0.05, quindi l'ipotesi nulla non è rifiutata. Quindi, se è zero, lo posso anche togliere.
Formula (1) vista nella slide 7. Variazione stimata dopo - prima della variazione. (il 6 è dato da 5+1, la variazione è di 1 in questo caso)
Con income = 6 il valore predetto è 628,883.4 è la differenza predetta del punteggio dei test.
Anche se è sempre una variazione unitaria di x, la variazione non è costante, l'effetto su y non è costante come invece avveniva con la regressione lineare, in cui avevamo una relazione lineare nelle covariate.
Interazione tra regressori
Relazione lineare: abbiamo visto che questo non avviene con la regressione quadratica, non è lineare nelle covariate.
Additiva: l'effetto totale su y è la somma degli effetti di ciascuna variabile.
Ma quello che abbiamo visto ad inizio lezione con le interazioni (beta3*x1*x2),
qui x1 non è indipendente da x2. Non potrebbe esserci un'interazione tra spesa in campagna e cambiamenti nella confezione per determinare la vendita? In questo modo non consideriamo più l'assunzione di additività appena vista. Abbiamo isolato x1 (lo stesso si poteva fare con x2). Beta1 tilde non è più un parametro, ma una funzione di x2, contiene anche x2. L'associazione tra y e x1 è influenzata anche da x2, mentre nel caso di additività il singolo coefficiente betaj è funzione solo della variabile xj. Dal risultato vediamo quello che dicevamo prima: variazione in x1 è influenzata anche da x2. Anche in questo caso l'effetto su y di una variazione unitaria non è costante. Come visto prima (da capire bene). Esempio: interazione tra regressori. Modello che rispetta le assunzioni di linearità e additività: una variazione della variabile y associata ad una variazione di xj è costante.indipendente dal valore assunto da xjCoefficienti significativi, R quadro è buono, avevamovisto che i residui però avevano un andamento ad "U", non compatibile con l'ipotesi del modello.
Un incremento medio di sales associato ad un incremento unitario in tv è sempre beta1, a prescindere dalla radio. Forse è un po' troppo semplice?
La relazione tra x e y non è più additiva (non è indipendente dagli altri regressori). Una variazione di radio modificherà anche l'associazione tra tv e vendite. Vediamo il comando per rendere più leggibili i coefficienti.
Interpretare beta3: l'aumento dell'efficacia della pubblicità televisiva associata ad un aumento di un'unità di pubblicità radiofonica e viceversa.
Il modello che include l'interazione è migliore del precedente, e il p-value di beta3 è molto piccolo. R quadro è passato da 0.897 a 0.967.
migliorato.Noi abbiamo visto la formula con x1 e x2, basta sostituire con le nostre variabili considerate nel modello.19 = 0.0191*1000 mentre 1.1 = 0.0011*1000(dati presi dal comando per rendere più leggibili i dati)Perché? Il coefficiente di interazione (x1*x2) è correlato alla risposta ma è anche correlato con x1 e x2.
Regressori qualitativiLa differenza è l'effetto tra lavoro verso il gruppo di riferimento che è non lavoro.Per ogni riga deve esserci un solo valore 1 per ogni dummy.La modalità I assumerà valori pari a zero in tutte e 4 le variabili dummy, ogni variabile dummy assume valore pari a 1 solo nella modalità a cui fa riferimento.Prima osservazione che ha come modalità MP presenta valore uno nella prima colonna, che si riferisce alla modalità MP.Aggiungere un'altra colonna non avrebbe senso, sarebbe un'informazione ridondante.Chi non ha indicato né MP, né P, né A,
numerose il punteggio medio è di 700.12.numerose è 657.25 (differenza di 7.17).
Esempio: regressore qualitativo (può assumere più di due modalità)
Abbiamo tre livelli: quindi ne dobbiamo inserire due (R di solito considera come riferimento la prima in ordine alfabetico, Bad)
Il modello indica una significativa differenza tra le medie delle posizioni sugli scaffali, perché? Perché vi è almeno un coefficiente che si riferisce alla posizione sugli scaffali diverso da zero (in questo caso lo sono entrambi).
Good è positivo e indica che una buona posizione è associata a vendite più alte rispetto a Bad, mantenendo costanti tutte le altre variabili. Questo aumenta il valore medio delle vendite di 4776 unità rispetto a una posizione sfavorevole.
Medium è anche positivo, ma più piccolo. Qualità media è associata a vendite più alte rispetto a quella sfavorevole, ma vendite inferiori rispetto a Good. Infatti, mantenendo le altre costanti,
una posizioneMedium aumenta il valore medio delle vendite di 1828 rispetto alla sfavorevole.Sempre riferimento quindi a Bad.
PARENTESI SPIEGAZIONI TAVOLEt-test, il suo valore lo dobbiamo confrontare con il valore che assume la t di student con i gradi di libertàcalcolati e con un livello alfa di riferimento.
Stiamo effettuando un test bidirezionale: l’errore considerato solo sulla coda destra deve essere diviso nelledue code. Abbiamo quindi due regioni di rifiuto.
Quindi 0.05/2 = 0.025 area nella coda destra
Esempio fatto con Radio 1.960
Incrocio tra 0.025 e 197 (per valori elevati la tavola approssima quella di una normale)t osservato è pari a 23.38 come visto sopra nel summary
Vedere bene ultima parte con grafici e regioni di rifiuto (anche caricate)
Confronto tra modelli
Il primo si differenza da quello normale (non corretto), in quanto tiene in considerazione il numero diparametri inclusi e il numero di osservazioni: da preferire quando si fanno confronti tra
modelli.Criteri AIC, AICc e BIC In base a cosa si decide quale modello scegliere? Comunque, prima devo sempre guardare la significatività dei coefficienti ed aver analizzato i residui. Il test F Annidato perché il modello più complesso solitamente contiene le variabili presenti nel ridotto, più qualche altra variabile aggiunta per cercare di spiegare meglio il modello. Al denominatore del denominatore: gradi di libertà del modello completo. Tutto questo si distribuisce come una F con i gradi di libertà al numeratore che rappresentano la differenza dei parametri inclusi nei due modelli e al denominatore presenta i gradi di libertà n-k2-1. Più la differenza tra valore osservato e previsto è piccola (RSS), migliore è l'adattamento del modello. Se la differenza è piccola vuol dire che noi commettiamo un errore piccolo. Oppure Sum of Sq e F più alti. Sono complementari poi: derivano dall'analisi della varianza.se la somma dei quadrati dei residui è più bassa, la somma dei quadrati di regressione è più alta. Esempio: scelta del modello migliore Modello a: analizzare il consumo di carburante come possa dipendere dalla potenza. a è annidato nel modello b, che è annidato nel modello c. Ovviamente anche a è annidato in c. Perché annidato? c comprende le precedenti + altra variabile. Ovviamente per gli altri basta cambiare la specificazione del modello. Per valutare quale dei modelli stimati si adatta meglio ai dati, dobbiamo ripetere i comandi anche per gli altri due. Solitamente i quattro metodi portano alla stessa conclusione, salvo casi particolari. Confronto modello a e b: RSS 447 in a e 291 in b. F = 15.47 e il Sum of Sq 155 Confronto modello a e c: RSS: sempre 447 in a e 176 in c. F = 21.48 e il Sum of Sq è 271 (somma della regressione) RSS più basso o F e Sum of Sq più alto è il modello c. Conferma quello detto.sopra.Errata specificazione del modello
Nel primo punto sono rilevanti per analizzare gli effetti dello studio della dipendenza
L'ultimo punto si può diagnosticare con l'analisi dei residui (quindi l'errata specificazione è anche legata alla verifica della bontà di adattamento).
1) Vediamo il primo punto: correlazione spuria
In altre parole, non c'è una vera relazione di causa-effetto tra le due variabili di interesse che sono indicate, ma sembrano essere correlate a causa di una variabile di confondimento che non è presa in considerazione o non è stata rilevata a cui entrambe sono correlate.
Vuol dire che due variabili sembrano che possano dipendere, solo perché sia la dipendente che l'indipendente che stiamo considerando sono correlate con un'altra variabile che non abbiamo preso in considerazione. Infatti, stiamo parlando di "omissione".
Cosa comporta? Risultati fuorvianti nella stima dei coefficienti.