Statistica III - Pratica (comandi di R)

Appunti sul corso di Statistica III parte di laboratorio (comandi R); corso di laurea di Scienze Statistiche ed Economiche - 3° anno.Gli appunti sono basati su appunti personali del …

Esame Statistica III

Facoltà Scienze statistiche

Dal corso del Prof. Migliorati Sonia

Università Università degli Studi di Milano - Bicocca

Publisher sararatti_

A.A. 2021-2022

11 pagine

7 download

Appunto

Vota 4,0 / 5 (1)

Scarica

Estratto del documento

DECIDERE TRA DUE MODELLI CON 2 TEST DIVERSI

nova(mod, mod2, test='Chisq') #confronto con il modello precedenteà#il p-value è quasi zero rifiutiamo il modelloprecedente in favore di quello nuovof.obs <- (dev-dev2)/(dev2/gdl2) #alternativa all'ANOVA ma è non precisa1-pf(f.obs,1,gdl2)AIC(mod2) #per il criterio AIC scegliamo il modello che ha AIC minoreAIC(mod3)

DECIDERE SE UNA VARIABILE RISPOSTA È NORMALMENTE DISTRIBUITA

shapiro.test (Y) #testqqnorm (Y) #graficamentecurve(dnorm(x, mean(Y), sd(Y), add=T)plot (density(Y)) #motivazione teorica

DECIDERE SE UNA VARIABILE RISPOSTA È DISTRIBUITA COME UNA POISSON

#distribuzione empiricatab <- xtabs(~Y, data=data)ascisse <- as.numeric(names(tab))plot(ascisse, tab)points(ascisse, tab) #dist. empirica = dist. teorica allora penso che Poisson non vada bene#distribuzione teoricateorica <- rpois(250, mean(Y))tabT<- xtabs( ~ teorica)ascisseT <- as.numeric(names(tabT))plot(ascisseT, tabT)points(ascisseT,

```html

T)ks.test(jitter(tab), "ppois", mean(Y)) #test

library(car)

qqPlot(tab, distribution="pois", lambda=mean(Y)) #motivazione teorica

CROSS PRODUCT RATIO E RISCHIO RELATIVO

tab <- xtabs(Y~X +X , data=data)

1 2

OR=tab[1,1]*tab[2,2]/(tab[1,2]*tab[2,1])

RR=tab[2,2]/tab[1,2]

SI FORNISCA MISURA RR DEL SUCCESSO (Y=1) PER UNA VARIABILE PER UNO STUDENTE CON LE ALTRE ESPLICATIVE PARI ALLA MEDIA

new <- data.frame (psi=c(0,1), tuce=c(mean(tuce),mean(tuce)), gpa=c(mean(gpa),mean(gpa)))

p <- predict (mod, newdata=new, type="response")

RR <- p[2]/p[1]

OR <- (p[2]/(1-p[2]))/(p[1]/(1-p[1])) à

COMMENTO I PLOT DI DIAGNOSTICA RESTITUITI DA R restituisce 4 grafici

par(mfrow=c(2,2)) #per vedere tutti e 4 i grafici insieme

plot(mod)

Grafico 1: per verificare la linearità del modelloà eta.hat VS residui di devianza

Grafico 2: QQplot per verificare la presenza di eventuali outlier

Grafico 3: serve a verificare la validità della funzione di varianza che

```

stiamo utilizzando che risulta appunto valida se abbiamo un andamento costante

Grafico 4: punti estremi verso destra indicano punti di leva, mentre punti estremi verso l'alto o il basso indicano potenziali outlier h.

ii VS residui di pearson standardizzati

Se valuto problemi diagnostici, come prima cosa cerco di risolvere la linearità aggiungendo le esplicative al quadrato/cubo/log in base al trend del primo grafico, es: I(var^2)

Così facendo potrei risolvere altri problemi diagnostici.

Se ad esempio riesco a correggere la linearità trovando un modello che fitta molto bene, posso non preoccuparmi se la funzione di varianza non è buona. Elimino osservazioni come ultima spiaggia.

DIAGNOSTICA PER FORMA STRUTTURALE: Linearità. Plot eta.hat (predittore lineare stimato) e e^DS (residui di devianza standardizzati)

Mi aspetto linearità: plot(mod$lin, rstandard(mod)) #se non lineare aggiungo nel modello un coeff: predict(mod)^2 e valuto se

è significativoà Link. Plot di eta.hat vs zeta.hat (stima pseudo-risposte)
Mi aspetto un andamento rettilineo, altrimenti probabilmente il link è inopportuno

library(faraway)
eta.hat <- predict(mod)
mu.hat <- ilogit(eta.hat) #Binomial regression
mu.hat <- exp(eta.hat) #Poisson regression
derivata <- 1/(mu.hat*(1-mu.hat)) #Binomial regression
derivata <- 1/(mu.hat) #Poisson regression
zeta.hat <- eta.hat + (Y-mu.hat)*derivata
plot(zeta.hat ~ eta.hat)

à Funzione di varianza. mu.hat (risposta media stimata) vs residui standardizzati (didevianza o di pearson)
Mi aspetto dispersione costante

par(mfrow=c(1,1))
mu.hat <- fitted(mod)
plot(rstandars(mod) ~ mu.hat)
plot(residuals(mod, type=”responde”) ~ mu.hat)

DATO LO Z-VALUE CALCOLO IL P-VALUE

z.value <- summary(mod)$coef[1,3]
2*(1-pnorm(abs(z.value)))

DATO IL P-VALUE CALCOLO LO Z-VALUE

p.value <- summary(mod)$coef[1,4]
qnorm(1-p.value/2)*(-1)

GRAFICO CURVA STIMATA(PLOT) SOVRAIMPOSTA AI PUNTI

OSSERVATI..range(30,85)par(mfrow=c(1,1))plot(Y~ X +X , xlim=c(30,85), ylim=c(0,1))1 2grid <- seq(30,85,by=1)eta.logit <- coef(mod)[1]+coef(mod)[2]*gridmu.logit <- ilogit(eta.logit) #Binomialmu.logit <- exp(eta.logit) #Poissonlines(grid, mu.logit, type="l")STIMA DEL PARAMETRO DI DISPERSIONEphi.hat <- sum(residuals(mod, type=”pearson”)^2)/df.residuals(mod)summary(mod, dispersion=phi.hat)TEST PER LA VERIFICA DELLA SOVRADISPERSIONEH : assenza di sovradispersione0n <- nrow(dataset)test <- sum(Y-(mean(Y))^2)/mean(Y)1-pchisq(test , (n-1))TRATTARE LA SOVRADISPERSIONE1. stimare il parametro di dispersione e chiedere un summary del modello stimatophi <- sum(residuals(mod, type="pearson")^2)/df.residual(mod)summary(mod, dispersion=phi)2. stimare il glm con family=quasi-verosimiglianzamod <- glm(Y~., family=quasipoisson, data=data)summary(mod)#le stime dei parametri non cambiano mentre vengono aggiustati gli SE e quindi la significativitàosservata.

Infatti gli SE vengono moltiplicati per sqrt(phi).NB: usando la quasi-verosimiglianza non posso più usare la devianza e tutte le quantità che la coinvolgono poiché perde di significato. PREVISIONE PER LA Y QUANDO X =a , X =b , X =mean(X ) <new - data.frame(X =a , X =b , X =mean(X )) <predict(mod, new, type="response") IC per beta: <confint(mod) #valore d’indifferenza: 0 IC per OR: <exp(confint(mod)) #valore d’indifferenza: 1 SELEZIONE BACKWARD SIA CON CRITERION-BASED CHE CON TEST-BASED <mod.back - step(mod, method="backward") #criterion-based <summary(mod.back) <summary(mod) <mod2 - update(mod,.~. -X) #test-nased <summary(mod2 ) VALUTARE OUTLIER <library(car) <res - rstandard(mod) <res.[abs(res)>2] #approssimativo <outlierTest(mod) #aggiustato secondo Bonferroni <plot(rstandard(mod)) <abline(h=c(-2,2)) VALUTARE LEVERAGE <libary(car) <soglia - 2*(k+1)/n <h.ii -

<code>hatvalues(mod)[hatvalues(mod)>soglia]</code>
<code>plot(hatvalues(mod))</code>
<code>abline(h=soglia)</code>
<code>influence.measures(mod)</code>
<code>VALUTARE OSSERVAZIONE PIU' INFLUENTE</code>
<code>library(car)</code>
<code>which.max(cooks.distance(mod))</code>
<code>influencePlot(mod)</code>
<code>influenceIndexPlot(mod)</code>
<code>TRASFORMARE UN DATASET CON RISPOSTA BINARIA IN BINOMIALE E VICEVERSA</code>
<code>Binario in binomiale: (1 riga di codice)</code>
<code>patterns=prodotto del numero di modalità di ogni esplicativa (n° combinazioni possibili)</code>
<code>sum(pclass==1 & sex=='male' & age=='Giovane' & survived==0)</code>
<code>sum(pclass==1 & sex=='male' & age=='Giovane' & survived==1)</code>
<code>sum(pclass==1 & sex=='male' & age=='Anziano' & survived==0)</code>
<code>sum(pclass==1 & sex=='male' & age=='Anziano' & survived==1)</code>
<code>sum(pclass==1 & sex=='female' & age=='Giovane' & survived==0)</code>
<code>sum(pclass==1 & sex=='female' & age=='Giovane' & survived==1)</code>
<code>sum(pclass==1
<p>&amp; sex=='female' &amp; age=='Anziano' &amp; survived==0)sum(pclass==1 &amp; sex=='female' &amp; age=='Anziano' &amp; survived==1)sum(pclass==2 &amp; sex=='male' &amp; age=='Giovane' &amp; survived==0)sum(pclass==2 &amp; sex=='male' &amp; age=='Giovane' &amp; survived==1)sum(pclass==2 &amp; sex=='male' &amp; age=='Anziano' &amp; survived==0)sum(pclass==2 &amp; sex=='male' &amp; age=='Anziano' &amp; survived==1)sum(pclass==2 &amp; sex=='female' &amp; age=='Giovane' &amp; survived==0)sum(pclass==2 &amp; sex=='female' &amp; age=='Giovane' &amp; survived==1)sum(pclass==2 &amp; sex=='female' &amp; age=='Anziano' &amp; survived==0)sum(pclass==2 &amp; sex=='female' &amp; age=='Anziano' &amp; survived==1)sum(pclass==3 &amp; sex=='male' &amp; age=='Giovane' &amp;

survived==0)sum(pclass==3 & sex=='male' & age=='Giovane' & survived==1)sum(pclass==3 & sex=='male' & age=='Anziano' & survived==0)sum(pclass==3 & sex=='male' & age=='Anziano' & survived==1)sum(pclass==3 & sex=='female' & age=='Giovane' & survived==0)sum(pclass==3 & sex=='female' & age=='Giovane' & survived==1)sum(pclass==3 & sex=='female' & age=='Anziano' & survived==0)sum(pclass==3 & sex=='female' & age=='Anziano' & survived==1)newdata=data.frame(classe=c(rep(1,4),rep(2,4),rep(3,4)),sesso=c(rep('M','M','F','F',3)),eta=rep('Giovane','Anziano',6),vivi=c(34,6,68,14,14,1,63,5,38,0,46,1),morti=c(38,23,2,1,72,12,5,1,205,10,55,0))STIMARE UN GLM FACENDO RICORSO AL LINK CANONICO (BINOMIALE)Ci sono due modiPer specificare la variabile risposta:

  Si fornisce la proporzione di successi (yi=x.i/n.i) come risposta e, tra gli argomenti della funzione glm, si specificano il numero di repliche per ogni valore delle esplicative in weights (n.i ≠ n)
  mod <- glm(y.i~X +X +…+X , family=binomial, weights =n.i, data)
  Si fornisce la risposta come array costituito da due colonne: la prima contiene il numero di successi (yitilde) e la seconda il numero degli insuccessi (ni-yitilde)
  mod <- glm(cbind(successo,ni-successo)~., family=binomial, data)


Il binary model si implementa come il binomial.
È possibile effettuare un test F basato sulla differenza delle devianze e un test Hosmer-Lemeshow.
Non è possibile effettuare un test per la bontà del modello, residui di devianza e diagnostica poiché i dati sono sparsi.
Quindi, è necessario trasformare il dataset in modo da avere per ogni riga un pattern (binomial regression).
L'equazione del modello stimato è: mu=exp(.) / 1+exp(.).
Per stimare un GLM, si fa ricorso al link canonico.
<p>(POISSON)mod1 <- glm(y~., family=poisson, data)

mod2 <- glm(y~offset(log(var1)) + var2 + … + varj, family=poisson, data)

Inserisco una variabile offset in taglia logaritmica se devo ovviare alle differenze di sizeà dell’esplicativa: n° esposizioni molto spesso me ne accorgo perché tutti i B sono mooolto piccoli.

Se non posso perché non ho la variabile n° di esposizioni ma noto valori decisamente diversi nel dataset in qualche esplicativa (non risposta!!) (es: 0.5 per una u.s. e 4000 per un’altra), provo a trasformarle es: log mod=glm(y~var.qual*var1.quant+var.qual*v)


    

            
            
    Anteprima
    Vedrai una selezione di 4 pagine su 11





    
        
                                                                                

                                            
                            
                            
                            
                        
                                                                                                                                

                                                                        
                                
                                
                                
                            
                                                                                                                                                                
                            Anteprima di 4 pagg. su 11.
 Scarica il documento per vederlo tutto.
                            
                                    

        
            Scarica
    
                            
                        
                                        

                                                                        
                                
                                
                                
                            
                                                                                                                                                                
                            Anteprima di 4 pagg. su 11.
 Scarica il documento per vederlo tutto.
                            
                                    

        
            Scarica
    
                            
                        
                                        

                                                                        
                                
                                
                                
                            
                                                                                                            

        
            
                

                

            
            
                1
                 su 11
            
            
                
                
            
        
    

        
    
    
    
        
            
                    
    
            
        
        
            
                Acquista con carta o PayPal
                
                                                        
            
            
                Scarica i documenti tutte le volte che vuoi
                            
        
    

    
            Dettagli

            
            
                
                    

                    SSD
                
                
                    Scienze economiche e statistiche
                    SECS-S/01 Statistica
                
            
        
    




    I contenuti di questa pagina costituiscono rielaborazioni personali del
    Publisher sararatti_ di informazioni
    apprese con la frequenza delle lezioni
    di Statistica III e studio autonomo di eventuali libri di riferimento in preparazione
    dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale
    dell'università Università degli Studi di Milano - Bicocca o del prof Migliorati Sonia.
    

            
            Appunti correlati


                            
        
            
                
                    
                    Statistica
                


                
                    Premium
                    Appunti esame
                    
                                            
                
            
        
                            
        
            
                
                    
                    Statistica
                


                
                    Premium
                    Appunto
                    
                                                    
                                                                
                                    3,0/5
                                     (2)
                                
                            
                                            
                
            
        
                            
        
            
                
                    
                    Statistica III - Teoria + Pratica
                


                
                    Premium
                    Appunto
                    
                                                    
                                                                
                                    4,5/5
                                     (2)
                                
                            
                                            
                
            
        
                            
        
            
                
                    
                    Analisi Statistica multivariata
                


                
                    Premium
                    Appunto
                    
                                                    
                                                                
                                    4,5/5
                                     (2)
                                
                            
                                            
                
            
        
    


    Invia appunti e guadagna



        
    
    
        

    
                                
                                                        
    




    Recensioni

    
                    
                                    
                        
                            
                                4/5
                            
                                                                                                                                            
                                                                                    
                                                                                                                                                
                                                                                    
                                                                                                                                                
                                                                                    
                                                                                                                                                
                                                                                    
                                                                                                                                                
                                                                                    
                                                                                                
                            1 recensione
                        
                    
                
                
                    

                        
                                                                                                                                                                                                
                                    5 stelle
                                
                                                                                                                                                                                                                                                                            
                                    4 stelle
                                
                                                                                                                                                                                                
                                    3 stelle
                                
                                                                                                                                                                                                
                                    2 stelle
                                
                                                                                                                                                                                                
                                    1 stella
                                
                                                    

                        
                                                                                                                                                                                                
                                    
                                        
                                    
                                
                                                                                                                                                                                                                                                                            
                                    
                                        
                                    
                                
                                                                                                                                                                                                
                                    
                                        
                                    
                                
                                                                                                                                                                                                
                                    
                                        
                                    
                                
                                                                                                                                                                                                
                                    
                                        
                                    
                                
                                                    

                        
                                                                                                                                                                                                0
                                                                                                                                                                                                                                                                            1
                                                                                                                                                                                                0
                                                                                                                                                                                                0
                                                                                                                                                                                                0
                                                    

                    
                
            
        
                

                                                                    
                        

                            
                                
                                                                            
                                                                    

                                
                                    Ti è piaciuto questo appunto?
                                    
                                        
                                    
                                
                            

                            
                                
                                
                                
                                Si è verificato un errore durante l'invio della tua recensione
                                
                                    
                                    
                                
                            

                                                            
                                                    
                    
                    
                        
                        
                    
                            
            
                
                
            
        
    
        
            
                            
                    
                        
                                                                
                                                    
                        
                            Studente Anonimo
                            
                                                                                                            
                                                                                    
                                                                                                                                                
                                                                                    
                                                                                                                                                
                                                                                    
                                                                                                                                                
                                                                                    
                                                                                                                                                
                                                                                    
                                                                                                
                        
                    
                                                                
                    
                    
                        31 Maggio 2023

                                            

                
            
                                
    

    
    Domande e risposte
    
        
            
                
                                    

                
                    Hai bisogno di aiuto?
                    Chiedi alla community
                
                
                                            Vai al forum
                                    
            
        

        
    

         
        
            
                
                    
                
                
                    
                    I migliori insegnanti
                        di Matematica
                    
                                                                                    
                                    
                                        
                                            
                                        
                                        Giovanni C.

                                        
                                                                                            
                                                    Supertutor
                                                
                                                                                                                                        
                                                    Percorsi
                                                
                                                                                                                                        
                                                    Verificato
                                                
                                                                                                                                

                                        Insegnante di Aiuto tesi, Contabilità e bilancio, Controllo di gestione, Diritto
                                        
                                            
                                                                                                    
                                                    
                                                        4.9/5
                                                    
                                                    (301)
                                                                                            

                                            
                                                                                                    
                                                    
                                                    Milano
                                                
                                                                                            
                                        
                                        
                                                                                    
                                                a partire da 
                                                20
                                                €/ora
                                            
                                                                                                                            
                                                
                                            
                                                                            
                                
                                                            
                                    
                                        
                                            
                                        
                                        Salvatore F.

                                        
                                                                                            
                                                    Supertutor
                                                
                                                                                                                                        
                                                    Percorsi
                                                
                                                                                                                                        
                                                    Verificato
                                                
                                                                                                                                        
                                                    DSA
                                                
                                                                                    

                                        Insegnante di Aiuto compiti, Aiuto tesi, Algebra, Analisi 1
                                        
                                            
                                                                                                    
                                                    
                                                        4.9/5
                                                    
                                                    (236)
                                                                                            

                                            
                                                                                                    
                                                    
                                                    Roma
                                                
                                                                                            
                                        
                                        
                                                                                    
                                                a partire da 
                                                20
                                                €/ora
                                            
                                                                                                                            
                                                
                                            
                                                                            
                                
                                                            
                                    
                                        
                                            
                                        
                                        Matteo S.

                                        
                                                                                            
                                                    Supertutor
                                                
                                                                                                                                                                                    
                                                    Verificato
                                                
                                                                                                                                

                                        Insegnante di Aiuto tesi, Algebra, Geometria, Matematica
                                        
                                            
                                                                                                    
                                                    
                                                        5/5
                                                    
                                                    (157)
                                                                                            

                                            
                                                                                                    
                                                   Online
                                                
                                                                                            
                                        
                                        
                                                                                    
                                                a partire da 
                                                20
                                                €/ora
                                            
                                                                                                                            
                                                
                                            
                                                                            
                                
                                                                        
                    
                        
                            Mostra altri
                                Tutor

DECIDERE TRA DUE MODELLI CON 2 TEST DIVERSI

DECIDERE SE UNA VARIABILE RISPOSTA È NORMALMENTE DISTRIBUITA

DECIDERE SE UNA VARIABILE RISPOSTA È DISTRIBUITA COME UNA POISSON

Recensioni

Domande e risposte

I migliori insegnanti di Matematica

Giovanni C.

Salvatore F.

Matteo S.