Estratto del documento

R – Biostatistica 2018

Esercitazione 1

Per aprire R commander da R:

library(Rcmdr)

Per importare i dati da un file presente nel computer: Dati -> Importa dati -> Da file di testo o blocco appunti, o URL…

Per creare un vettore R utilizza la funzione c. Creiamo un vettore contenente i dati delle altezze di un gruppo di 5 ragazzi. Questi dati sono gli argomenti della funzione.

c(183, 173, 172, 181, 175)

In tutte le funzioni di R si racchiudono gli oggetti all’interno delle parentesi e si separano con una virgola. Possiamo dare un nome agli oggetti racchiusi nella funzione c (i nomi non devono avere spazi o trattini, ma possono avere punti).

Altezza <- c(183, 173, 172, 181, 175)

E’ stata fatta un’assegnazione, per creare Altezza dobbiamo fare un altro passaggio:

  • ls()
  • oppure Altezza

Otteniamo:

Per richiamare in qualsiasi momento i dati contenuti in Altezza basterà scrivere:

Altezza

Vediamo adesso le operazioni che possono essere fatte. Moltiplicare x 2 tutti i dati contenuti in Altezza:

Per calcolare la media possiamo usare due metodi:

sum(Altezza)/length(Altezza)

Abbiamo sommato tutti i dati presenti in Altezza e li abbiamo divisi per la sua lunghezza che in questo caso è data dal numero totale dei dati. Oppure:

mean(Altezza)

Per estrarre il 3° dato della sequenza:

Altezza[3]

Per estrarre il 1° e il 5° dato:

Altezza[c(1,5)]

Per estrarre i dati dal 1° al 3°:

Altezza[c(1:3)]

Per estrarre i dati dal 1° al 3° ed anche il 5°:

Altezza[c(1:3, 5)]

Posso salvare i primi 3 valori in un vettore con nome, per esempio, Altezza3:

Altezza3 <- Altezza[c(1:3)]

Per creare una matrice:

nome <- matrix(Altezza)

Nelle matrici le righe sono indicate con [1,] mentre le colonne [,1]. Per avere per esempio i dati della 3° riga scriviamo:

Per avere quelli della 1° colonna:

Per avere la media dei dati della prima colonna (che in questo caso coincide con la media di Altezza):

Si possono aggiungere commenti accanto alle righe di comando scrivendoli dopo il cancelletto #. R non considera tutto ciò che si trova dopo #. Si possono avere maggiori informazioni su una determinata funzione (per esempio mean) utilizzando la funzione help.

help(mean)

Esercitazione 2

Carichiamo il set di dati “02e5aGuppyAttractiveness” e lo chiamiamo Pesci (clicca “commas”). Per visualizzare i dati clicca in R commander su “Visualizza i dati”.

Utilizzando la funzione summary otteniamo media, mediana, 1° e 3° quartile, valore massimo e minimo per entrambe le variabili. Con la funzione numSummary invece otteniamo media, deviazione standard, intervallo interquartile e i quantili.

Su R è possibile realizzare molti tipi di grafici sia utilizzando Rcmdr: Grafici -> grafico a scatola e baffi (boxplot), grafico a dispersione (scatterplot) ecc. Che utilizzando le righe di comando. Per fare il boxplot scriviamo:

Boxplot(~father.ornament, data=Pesci)

Possiamo fare lo stesso per la variabile son.attract ed aggiungere il nome che vogliamo dare all’asse delle y.

Boxplot(~son.attract, data=Pesci, ylab="fascino del figlio")

Per fare un istogramma con i dati di father.ornament per esempio:

with(Pesci, Hist(father.ornament, scale="frequency", breaks="Sturges", col="darkgray"))

Per scale possiamo usare “frequency” o “percent”; breaks indica i bin; col indica il colore che può essere modificato con qualsiasi altro colore.

with(Pesci, Hist(father.ornament, scale="percent", breaks="Sturges", col="blue"))

Per fare uno scatterplot:

scatterplot(son.attract~father.ornament, data=Pesci, xlab="ornamentazione del padre", ylab="fascino del figlio")

Esercitazione 3

Usiamo il Dataset delle directory 3, nominalo “spider”, clicca “commas”, ti apre i documenti e lì seleziona “spider running amputation”. Vogliamo creare un boxplot con 2 variabili. Abbiamo la velocità in entrambe le colonne ma per due gruppi diversi, vogliamo metterle nello stesso grafico. Per ottenere un’unica colonna di dati:

Dati -> set dati attivo -> variabili concatenate. Nuovo nome per il set di dati: spiderS. Nome della variabile: speed. Nome del fattore: treat.

spiderS <- stack(spider[, c("speed.after", "speed.before")])

Con la funzione stack gli abbiamo detto di unire le due colonne (speed.after e speed.before) e le abbiamo rinominate “speed” e “treat”.

names(spiderS) <- c ("speed", "treat")

Fai Boxplot con questi dati.

Boxplot(speed ~ treat, data=spiderS)

Se vogliamo ordinarli in modo da avere prima il boxplot di speed.before e poi speed.after:

Dati -> Gestione variabili di un set... -> Riordina i livelli del fattore (treat -> ok)

Il comando corrispondente è:

SpiderS$Treat <- with(SpiderS, factor(Treat, levels=c('speed.before', 'speed.after')))

All’interno di spiderS voglio estrarre i dati della colonna Treat.

spiderS$Treat

Per avere quelli della colonna speed:

spiderS$speed

Per avere il ventesimo valore della colonna speed:

spiderS$speed[20]

O i primi dieci valori della colonna speed.

spiderS$speed[1:10]

Estrai i primi dieci valori da entrambe le colonne.

spiderS[c(1:10),]

Se dopo i numeri metto la virgola mi dà tutte le colonne che ci sono, ma se in particolare voglio due colonne scrivo:

spiderS[c(1:10), c(1,2)]

Nel caso del nostro esempio, siccome ho solo due colonne, questo è sinonimo di quello scritto sopra. Per richiamare una colonna posso scrivere:

spiderS$speed

Oppure:

spiderS[,2]

Vai di nuovo su Rinomina le variabili. “treat” lo chiami Treatment. Vai su Ricodifica le variabili e “variabile” lo chiami treat. Clicca su aiuto e ti dice come si possono ricodificare le variabili, quella originale e quella nuova.

Per ricodificare le due variabili, cioè cambiare i valori della variabile (per esempio vedi i colori dei capelli e poi li ricodifichi in “chiaro” “molto chiaro”) vai su ricodifica variabili, selezione Treatment, su variabile scrivi “treat” e nello spazio bianco scrivi:

  • “speed.after”=”After”
  • “speed.before”=”Before”

Se vai su visualizza dati ti apre la tabella. Per fare il boxplot:

Boxplot (speed ~ treat, data=spiderS, xlab="Treatment", ylab="speed (cm/s)")

Ora abbiamo ottenuto un boxplot con asse delle x “Treatment” in cui ho in ordine before e after, è importante perché R te li ordina sempre in ordine alfabetico, in questo caso avrei avuto prima after e poi before.

Anteprima
Vedrai una selezione di 8 pagine su 31
Appunti di R-Biostatistica Pag. 1 Appunti di R-Biostatistica Pag. 2
Anteprima di 8 pagg. su 31.
Scarica il documento per vederlo tutto.
Appunti di R-Biostatistica Pag. 6
Anteprima di 8 pagg. su 31.
Scarica il documento per vederlo tutto.
Appunti di R-Biostatistica Pag. 11
Anteprima di 8 pagg. su 31.
Scarica il documento per vederlo tutto.
Appunti di R-Biostatistica Pag. 16
Anteprima di 8 pagg. su 31.
Scarica il documento per vederlo tutto.
Appunti di R-Biostatistica Pag. 21
Anteprima di 8 pagg. su 31.
Scarica il documento per vederlo tutto.
Appunti di R-Biostatistica Pag. 26
Anteprima di 8 pagg. su 31.
Scarica il documento per vederlo tutto.
Appunti di R-Biostatistica Pag. 31
1 su 31
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze biologiche SECS-P/01 Economia politica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Arianna-S di informazioni apprese con la frequenza delle lezioni di Biostatistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Pisa o del prof Massolo Alessandro.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community