R – Biostatistica 2018
Esercitazione 1
Per aprire R commander da R:
library(Rcmdr)
Per importare i dati da un file presente nel computer: Dati -> Importa dati -> Da file di testo o blocco appunti, o URL…
Per creare un vettore R utilizza la funzione c. Creiamo un vettore contenente i dati delle altezze di un gruppo di 5 ragazzi. Questi dati sono gli argomenti della funzione.
c(183, 173, 172, 181, 175)
In tutte le funzioni di R si racchiudono gli oggetti all’interno delle parentesi e si separano con una virgola. Possiamo dare un nome agli oggetti racchiusi nella funzione c (i nomi non devono avere spazi o trattini, ma possono avere punti).
Altezza <- c(183, 173, 172, 181, 175)
E’ stata fatta un’assegnazione, per creare Altezza dobbiamo fare un altro passaggio:
ls()- oppure
Altezza
Otteniamo:
Per richiamare in qualsiasi momento i dati contenuti in Altezza basterà scrivere:
Altezza
Vediamo adesso le operazioni che possono essere fatte. Moltiplicare x 2 tutti i dati contenuti in Altezza:
Per calcolare la media possiamo usare due metodi:
sum(Altezza)/length(Altezza)
Abbiamo sommato tutti i dati presenti in Altezza e li abbiamo divisi per la sua lunghezza che in questo caso è data dal numero totale dei dati. Oppure:
mean(Altezza)
Per estrarre il 3° dato della sequenza:
Altezza[3]
Per estrarre il 1° e il 5° dato:
Altezza[c(1,5)]
Per estrarre i dati dal 1° al 3°:
Altezza[c(1:3)]
Per estrarre i dati dal 1° al 3° ed anche il 5°:
Altezza[c(1:3, 5)]
Posso salvare i primi 3 valori in un vettore con nome, per esempio, Altezza3:
Altezza3 <- Altezza[c(1:3)]
Per creare una matrice:
nome <- matrix(Altezza)
Nelle matrici le righe sono indicate con [1,] mentre le colonne [,1]. Per avere per esempio i dati della 3° riga scriviamo:
Per avere quelli della 1° colonna:
Per avere la media dei dati della prima colonna (che in questo caso coincide con la media di Altezza):
Si possono aggiungere commenti accanto alle righe di comando scrivendoli dopo il cancelletto #. R non considera tutto ciò che si trova dopo #. Si possono avere maggiori informazioni su una determinata funzione (per esempio mean) utilizzando la funzione help.
help(mean)
Esercitazione 2
Carichiamo il set di dati “02e5aGuppyAttractiveness” e lo chiamiamo Pesci (clicca “commas”). Per visualizzare i dati clicca in R commander su “Visualizza i dati”.
Utilizzando la funzione summary otteniamo media, mediana, 1° e 3° quartile, valore massimo e minimo per entrambe le variabili. Con la funzione numSummary invece otteniamo media, deviazione standard, intervallo interquartile e i quantili.
Su R è possibile realizzare molti tipi di grafici sia utilizzando Rcmdr: Grafici -> grafico a scatola e baffi (boxplot), grafico a dispersione (scatterplot) ecc. Che utilizzando le righe di comando. Per fare il boxplot scriviamo:
Boxplot(~father.ornament, data=Pesci)
Possiamo fare lo stesso per la variabile son.attract ed aggiungere il nome che vogliamo dare all’asse delle y.
Boxplot(~son.attract, data=Pesci, ylab="fascino del figlio")
Per fare un istogramma con i dati di father.ornament per esempio:
with(Pesci, Hist(father.ornament, scale="frequency", breaks="Sturges", col="darkgray"))
Per scale possiamo usare “frequency” o “percent”; breaks indica i bin; col indica il colore che può essere modificato con qualsiasi altro colore.
with(Pesci, Hist(father.ornament, scale="percent", breaks="Sturges", col="blue"))
Per fare uno scatterplot:
scatterplot(son.attract~father.ornament, data=Pesci, xlab="ornamentazione del padre", ylab="fascino del figlio")
Esercitazione 3
Usiamo il Dataset delle directory 3, nominalo “spider”, clicca “commas”, ti apre i documenti e lì seleziona “spider running amputation”. Vogliamo creare un boxplot con 2 variabili. Abbiamo la velocità in entrambe le colonne ma per due gruppi diversi, vogliamo metterle nello stesso grafico. Per ottenere un’unica colonna di dati:
Dati -> set dati attivo -> variabili concatenate. Nuovo nome per il set di dati: spiderS. Nome della variabile: speed. Nome del fattore: treat.
spiderS <- stack(spider[, c("speed.after", "speed.before")])
Con la funzione stack gli abbiamo detto di unire le due colonne (speed.after e speed.before) e le abbiamo rinominate “speed” e “treat”.
names(spiderS) <- c ("speed", "treat")
Fai Boxplot con questi dati.
Boxplot(speed ~ treat, data=spiderS)
Se vogliamo ordinarli in modo da avere prima il boxplot di speed.before e poi speed.after:
Dati -> Gestione variabili di un set... -> Riordina i livelli del fattore (treat -> ok)
Il comando corrispondente è:
SpiderS$Treat <- with(SpiderS, factor(Treat, levels=c('speed.before', 'speed.after')))
All’interno di spiderS voglio estrarre i dati della colonna Treat.
spiderS$Treat
Per avere quelli della colonna speed:
spiderS$speed
Per avere il ventesimo valore della colonna speed:
spiderS$speed[20]
O i primi dieci valori della colonna speed.
spiderS$speed[1:10]
Estrai i primi dieci valori da entrambe le colonne.
spiderS[c(1:10),]
Se dopo i numeri metto la virgola mi dà tutte le colonne che ci sono, ma se in particolare voglio due colonne scrivo:
spiderS[c(1:10), c(1,2)]
Nel caso del nostro esempio, siccome ho solo due colonne, questo è sinonimo di quello scritto sopra. Per richiamare una colonna posso scrivere:
spiderS$speed
Oppure:
spiderS[,2]
Vai di nuovo su Rinomina le variabili. “treat” lo chiami Treatment. Vai su Ricodifica le variabili e “variabile” lo chiami treat. Clicca su aiuto e ti dice come si possono ricodificare le variabili, quella originale e quella nuova.
Per ricodificare le due variabili, cioè cambiare i valori della variabile (per esempio vedi i colori dei capelli e poi li ricodifichi in “chiaro” “molto chiaro”) vai su ricodifica variabili, selezione Treatment, su variabile scrivi “treat” e nello spazio bianco scrivi:
- “speed.after”=”After”
- “speed.before”=”Before”
Se vai su visualizza dati ti apre la tabella. Per fare il boxplot:
Boxplot (speed ~ treat, data=spiderS, xlab="Treatment", ylab="speed (cm/s)")
Ora abbiamo ottenuto un boxplot con asse delle x “Treatment” in cui ho in ordine before e after, è importante perché R te li ordina sempre in ordine alfabetico, in questo caso avrei avuto prima after e poi before.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Biostatistica - Appunti
-
Appunti della terza lezione di Istituzioni di matematiche e fondamenti di biostatistica
-
Appunti Elementi di biostatistica
-
Appunti completi di Biostatistica - teoria