vuoi
o PayPal
tutte le volte che vuoi
INTRODUZIONE A R E
APPLICAZIONI DI BASE
Prima di tutto bisogna creare un progetto, ovvero la creazione di una cartellaapposita, dove all'interno ci saranno gli script, i dataset, i dati e in raccolta.
FILE -> NEW PROJECT -> NEW DIRECTORY / EXISTING DIRECTORY ->
- Le operazioni Arimethiche:
- Le operazioni binomine & logiche:
Funzioni di base e concetti principali
- Assegnare un valore a un oggetto
- q <- 2 + 2 / b <- a * 3
- Concatenazione di elementi creando un vettore
- x <- c(9, 6, 2, 1)
- Creare sequenze di valori con estremi
- y <- seq(4, 10)
- Visualizzare / rimuovere oggetti
- ls(...) / rm(a, y)
I Tipi di Dati
Le entità con cui si opera in R prendono il nome di oggetti e sono caratterizzati da alcuni attributi di base:
- Mode (Modalità o Modo) - Indica come vengono immagazzinati i dati: Numerici / character / Logical
- Length (Lunghezza): Indica numero di elementi che compongono l'oggetto
- Class (Classe): Identifica come sono rappresentati i dati
Per calcolare e creare il grafico delle correlazioni useremo il pacchetto plotrix.
Per l'interpolazione del grafico si considererà la correlazione di ciascuna variabile con l'asseche è la radice quadrata della varianza e la varianza di asse e massimo dellacorrelazione con il fattore.
RAPPRESENTAZIONE CONGIUNTA ℜn E ℜn
Per rappresentare l'angolo utilizzereno il comando biplot e otteremmo unarappresentazione congiunta individuando variabili.
IL PACCHETTO FACTOMINER
Dedicherò un'analisi multivariata dei dati per potenziare di analisi dati conriduzione della dimensionalità dei dati multivariati.
Con il comando summary possiamo vedere l'importanza della componente.
Per disegnare lo scree-plot degli autovalori utilizzeremo il comando barplot.
Una volta accertate tutte le assunzioni, si proceda con l'esecuzione dell'analisi:
2wmanova <- cov(V_dip ~ V_ind1 * V_ind2, dati = datiNorm)
In base all'analisi, gli asterischi indicano leggermente tra le medie un dei
gruppi, e altro indicatore è il p-value < 0,05.
Lì o v quando un test omnibus non riesce a dirci altro e di conseguenza
fanno i test post-hoc come il test di HSD di
TukeyHSD(2wmanova).
Si interpreta il risultato valutando in quanto intervallo intervino lo 0 come variabile
che può confermare le differenze delle medie.
Facendo il plot(hsd) si individuare l'intervallo dopo che non interessano lo 0.
Inoltre fanno il gruppo interferente (l'intervallo di confidenza delle medie
dei gruppi) servono per individuare dove vi è maggiore sovrapposizione. fanno
prima ggplot e successivamente facendo il plotmeans(varDipendenti
e tra(V_dip ~ V_ind1 * V_ind2)).