Appunti completi ed esercitazioni - modulo R - Analisi Statistica Multivariata

Appunti di Analisi Statistica Multivariata basati su appunti personali del publisher presi alle lezioni del prof. Lunardon dell’università degli Studi di Milano Bicocca - Unimib, facoltà di scienze statistiche, Corso di laurea in scienze statistiche ed economiche. Scarica il file in formato PDF!

Esame Analisi statistica multivariata

Facoltà Scienze statistiche

Dal corso del Prof. Lunardon Nicola

Università Università degli Studi di Milano - Bicocca

Publisher aina.belloni

A.A. 2018-2019

69 pagine

7 download

Appunto

Vota 5,0 / 5 (1)

Scarica

Estratto del documento

FINESTRA EDITOR

2. Qui è possibile scrivere, modificare e salvare un insieme di comandi. Per eseguire una o più righe,

dopo averle selezionate, si prema il pulsante oppure

Run CTRL+INVIO .

3. FINESTRA ENVIRONMENT/HISTORY

Nella finestra Environment si può vedere quali oggetti (vettori, dataset,…) sono contenuti nella

memoria di R. La finestra History raccoglie la storia dei comandi eseguiti.

4. FINESTRA FILES/PLOTS/PACKAGES/HELP

Qui è possibile aprire files, visualizzare grafici, installare e caricare pacchetti o utilizzare la

funzione di help.

Sul sito del CRAN sono disponibili svariate guide di introduzione ad R ed è inoltre possibile consultare

i suggerimenti e i consigli presenti nelle FAQ (Most Frequent Asked Questions). Mentre si sta

lavorando con il programma, si possono chiamare direttamente gli aiuti. Con il comando:

appare una pagina web off–line dalla quale si accede ai manuali e ad informazioni

help.start()

generali. Cliccando, ad esempio, sulla voce Packages si trova un elenco di molti pacchetti di base o

aggiuntivi disponibili. Un altro modo semplice per chiedere informazioni consiste nell’anteporre un

punto interrogativo al comando su cui si desidera avere maggiori informazioni. Una modalità

alternativa per chiedere aiuto consiste nel ricorrere alla funzione example(nome funzione) .

Ad esempio:

R come calcolatrice

R può essere utilizzato come una calcolatrice. Basta digitare l’espressione nella finestra console e

premere invio:

Per operazioni più complicate, è consigliabile l’utilizzo delle parentesi: ad esempio

produce un risultato diverso da

Aggiungere commenti al codice

• È buona norma commentare il codice in modo tale da trovare delle annotazioni anche dopo

molto tempo dopo averlo scritto

• Il carattere per commentare una riga, o più, di codice è #

una riga commentata non viene eseguita

Gli operatori

Gli operatori aritmetici di base sono i seguenti: Gli operatori sono i seguenti:

relazionali

• •

(addizione) (uguale)

x+y x==y

• •

(sottrazione) (maggiore o uguale)

x-y x>=y

• •

(moltiplicazione) (minore o uguale)

x*y x<=y

• •

(divisione) (maggiore)

x/y x>y

• •

a potenza) (minore)

x^y x<y

(elevamento • (diverso)

x!=y

Gli operatori logici sono i seguenti:

• (AND logico)

x&y

• (OR logico)

x|y

• (NOT logico)

x!y

Funzioni matematiche

R dispone al suo interno di numerose funzioni, per ciascuna delle quali è presente un file di aiuto a

cui si può accedere digitando dal prompt Quest’ultimo chiarisce

?funzione help(funzione)

o .

tutti gli argomenti richiesti dalla funzione, il loro nome, il loro ordine, quelli necessari e quelli

opzionali, ovvero quelli per cui un valore di default è già impostato.

Tra le funzioni matematiche, di seguito un elenco (non esaustivo):

• absolute value and sign

abs() sign()

• square roots

sqrt()

• exponential function

exp()

• natural and common logarithms

log() log10()

• trigonometric functions

sin() cos() tan()

, ,

• inverse trigonometric functions

asin() acos() atan()

, ,

• factorial and binomial coefficients

factorial() choose()

• to nearest

round() signif()

, rounding

• rounding up and down

ceiling() floor()

, e

in R è una costante predefinita corrispondente al numero pi–greco; mentre il numero

di Eulero si ottiene con la funzione exp(1) .

Ad esempio

Per visualizzare gli argomenti di una funzione, basta digitare il nome della funzione nella finestra di

comando e premere TAB

Un comando con cui è bene familiarizzare è oppure Ad esempio,

help(comando) ?comando .

digitando si ottiene una descrizione della funzione, i possibili argomenti e i valori utilizzati di

?log ,

default.

Gli esempi che si trovano alla fine della finestra possono essere eseguiti tramite il comando

example(comando) :

Variabili

Spesso è opportuno associare ai numeri un nome. Così facendo, diventano delle variabili, che

possono essere utilizzate successivamente. I nomi in R possono essere lettere, cifre o punti. Non

sono ammessi però nomi che iniziano con una cifra, inoltre non è ammesso un punto iniziale

seguito da una cifra.

Per creare un oggetto è necessario utilizzare il comando o (oppure anche ), prestando

<- = ->

attenzione, nel momento in cui si decide di creare un oggetto, ad eventuali oggetti preesistenti,

che possiedono lo stesso nome, questi ultimi verranno infatti sovrascritti e quindi cancellati; è

necessario perciò evitare di creare oggetti con nomi già usati dall’ambiente R, ad esempio, tra i

nomi riservati di R, alcuni caratteri singoli: c q t C D F I T (si suggerisce di consultare l’help per

conoscere la funzione corrispondente). Nei casi di incertezza su una possibile assegnazione, si

provi a digitare nella R–console il nome che si desidera attribuire alla variabile, controllando che

non si tratti di un carattere riservato.

Ad esempio, per assegnare il valore 4 alla variabile x

Si tratta di espressioni equivalenti!

La variabile appare nella finestra Ciò significa che R ha memorizzato l’oggetto . A

environment .

x x

questo punto, digitando nella Console , R mostra nell’output il suo contenuto:

Si può usare per eseguire qualche calcolo, ad esempio per calcolare la circonferenza di un cerchio

di raggio :

Se si definisce nuovamente R dimenticherà quale valore aveva in precedenza. E’ importante

x ,

sapere che R è un linguaggio ovvero distingue le lettere maiuscole dalle minuscole.

case-sensitive,

E’ anche possibile assegnare ad un nuovo valore utilizzando quello vecchio:

E’ possibile costruire una nuova variabile che è funzione di , ad esempio:

y x

Per vedere l’elenco di tutti gli oggetti presenti nel workspace (memoria di lavoro)

Per rimuove la variabile dalla memoria di R, si può utilzzare la funzione rm(...) :

Per rimuove tutte le variabili dalla memoria di R, basta cliccare il pulsante nella finestra

Clear

Environment, oppure per cancellare tutte le variabili esistenti nell’area di lavoro, comprese le

funzioni create o aggiunte, è necessario usare il comando: rm(list=ls()) .

Vettori

Uno scalare è un numero singolo, un vettore è una riga di numeri. La variabile definita in

precedenza è uno scalare. Per creare un vettore contenente i numeri 2, 7, 4 e 1 è necessario

ricorrere alla funzione per concatenare gli elementi (separati dalla ) che vengono forniti

c(...) ,

come argomento.

Si noti che R precede l’output con per indicare a cosa corrisponde il primo elemento del

[1]

vettore . È chiaro che 7, 4, e 1 sono, rispettivamente, il secondo, il terzo e il quarto elemento di .

y y

Per determinare la lunghezza del vettore

Esempi di vettori:

Sequenze di numeri

Liste

Le liste sono oggetti di R che contengono al loro interno elementi di natura differente, ad esempio:

Come creare vettori o liste

Nominare vettori o liste

Subsetting

Ci sono diversi modi per accedere agli elementi di un vettore:

• specificando gli indici da includere: ovvero è possibile accedere all’i-esimo elemento di un

vettore attraverso oppure agli elementi con indice i, j e k attraverso

[i] [c(i,j,k)]

, .

Ad esempio, se si vuole accedere al terzo elemento

oppure al primo e al quarto elemento:

• specificando gli indici da escludere; es accedere agli elementi di escludendo alcuni indici:

• attraverso una selezione true/false

• ricorrendo alla funzione Per esempio, se vogliamo sapere quali sono gli indici

which(...) .

corrispondenti agli elementi di y maggiori di 1:

quindi per ottenere gli elementi di maggiori di 1:

La funzione richiede come argomento un vettore di tipo logico, e restituisce gli

which(...)

indici di un vettore i cui elementi contengono l’oggetto Il simbolo assieme a

TRUE TRUE

sono gli unici due risultati di una condizione logica come Si noti quanto segue

FALSE y > 1 .

restituisce un vettore di ‘vero/falso’ che passato alla funzione restituisce gli indici

which()

del vettore corrispondenti a TRUE :

È possibile considerare condizioni logiche più complicate. Ad esempio, se vogliamo sapere

quali sono gli indici corrispondenti agli elementi di compresi tra 1 incluso e 5 escluso

• per nome

Alcuni casi particolari:

E se dovessimo accedere agli elementi di una lista?

NA (NotAvailable) e NaN (NotaNumber)

Valori numerici speciali

Operazioni aritmetiche tra vettori

Addizione tra vettori conformabili:

Addizione per uno scalare

Moltiplicazione per uno scalare

Addizione tra vettori non conformabili:

Prodotto vettoriale: %*%

R esegue operazioni sia vettoriali che scalari. Se diamo il comando

otteniamo il prodotto di uno scalare per un vettore. Creiamo ora un vettore della stessa

lunghezza di , contenente i numeri 1, 2, 3 e 4.

otteniamo il prodotto scalare di e , ovvero il prodotto termine a termine degli elementi di con

y z y

gli elementi di .

Se vogliamo ottenere il prodotto vettoriale di e si deve utilizzare l’operatore opportuno. R

y z y z

interpreta i vettori come vettori colonna. Per esempio, i prodotti del tipo si scrivono

T

mentre se vogliamo ottenere T

dove il comando effettua la trasposizione di un vettore.

t(...)

Factor

La funzione crea una variabile categoriale, dove le categorie non sono ordinate, per

factor

default vengono elencate in ordine alfabetico, oppure non decrescente.

permette di definire l’ordine delle categorie:

levels

Il comando

Nel caso di variabili qualitative ordinali, dove le categorie devono essere ordinate secondo una

precisa logica, è opportuno ricorrere alla funzione ordered

Si noti l’output che rende evidente l’ordine delle

Levels: low < medium < high ,

categorie/modalità (o dei livelli) della variabile

La funzione permette di ottenere la distribuzione delle frequenze assolute di una variabile,

table

ad esempio:

Data.frame

Il è un oggetto di R che corrisponde all’accostamento di dati relativi a variabili di

data.frame

natura differente, tutte rilevate sulle stesse unità statistiche df = data.frame(var1, var2, ...) .

Un data.frame è una lista di variabili, tutte della stessa lunghezza

• Una lista “pura” creata con il

Anteprima

Vedrai una selezione di 10 pagine su 69