Anteprima
Vedrai una selezione di 8 pagine su 32
Modelli multidimensionali per l’analisi dei dati - Teoria e pratica in R-Studio Pag. 1 Modelli multidimensionali per l’analisi dei dati - Teoria e pratica in R-Studio Pag. 2
Anteprima di 8 pagg. su 32.
Scarica il documento per vederlo tutto.
Modelli multidimensionali per l’analisi dei dati - Teoria e pratica in R-Studio Pag. 6
Anteprima di 8 pagg. su 32.
Scarica il documento per vederlo tutto.
Modelli multidimensionali per l’analisi dei dati - Teoria e pratica in R-Studio Pag. 11
Anteprima di 8 pagg. su 32.
Scarica il documento per vederlo tutto.
Modelli multidimensionali per l’analisi dei dati - Teoria e pratica in R-Studio Pag. 16
Anteprima di 8 pagg. su 32.
Scarica il documento per vederlo tutto.
Modelli multidimensionali per l’analisi dei dati - Teoria e pratica in R-Studio Pag. 21
Anteprima di 8 pagg. su 32.
Scarica il documento per vederlo tutto.
Modelli multidimensionali per l’analisi dei dati - Teoria e pratica in R-Studio Pag. 26
Anteprima di 8 pagg. su 32.
Scarica il documento per vederlo tutto.
Modelli multidimensionali per l’analisi dei dati - Teoria e pratica in R-Studio Pag. 31
1 su 32
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Elementi Essenziali di Algebra Lineare

Matrici, vettori, scalari

x1,1 x1,2 ... x1,m x2,1 x2,2 ... x2,m ... xn,1 ... xn,m

Una matrice è un'organizzazione di oggetti disposti dentro m righe e n colonne dove m (n) è il numero delle righe e n (p) è il numero delle colonne. Gli indici i, j cadranno alla fine quando scriviamo di ordinare matrici.

Una matrice avente una sola colonna (m=1) o riga (n=1) si chiama vettore.

x1,1 x2,1 ... xm,1 oppure (x1,1 x2,1 ... xm,1)

Si chiamano rispettivamente vettore colonna oppure vettore riga.

Una terza idea di organizzazione è quella che unisce dentro di un insieme di matrici.

Una matrice avente righe e colonne uguali (m=n) si dice quadrata. Ognuno diversamente si dice rettangolare (m ≠ n).

Una matrice che ha componenti sulla diagonale principale diversi da zero e tutti zero nelle altre posizioni si dice diagonale.

Una matrice con componenti diversi da zero al di sopra o al di sopra della diagonale principale e infine = 0 si dice matrice triangolare inferiore o superiore.

La matrice con il triangolo inferiore uguale a quello superiore si dice simmetrica.

Una matrice con tutti 1 sulla diagonale maggiore e tutti 0 dopo si dice matrice identità.

Una matrice quadrata con tutti zero al suo interno si chiama matrice nulla.

A seguito sono proseguite alcune rappresentazioni di matrici diagonali, triangolari superiori, triangolari inferiori, simmetriche e la matrice d’identità.

ALCUNE OPERAZIONI CON LE MATRICI

  • LA SOMMA E DIFFERENZA

    L'operazione di somma o differenza si esegue elemento per elemento e le matrici devono avere la stessa dimensione, ossia devono essere compatibili.

È possibile eseguire questa operazione tra vettori e tra scalari (k) e matrici o vettori.

  • IL PRODOTTO

    La precondizione per un prodotto tra due matrici è che il numero delle colonne (m) della matrice che permette il prodotto deve essere uguale al numero delle righe (m) della matrice del post-moltiplicatore e il risultato sarà una matrice C che avrà il numero delle righe della matrice che permette il prodotto e il numero delle colonne della post-moltiplicatrice. Le diverse operazioni che si possono eseguire sono:

    • Prodotto tra uno scalare (k) e un vettore o una matrice:
    • Prodotto tra vettori o matrici che può restituire una matrice, un vettore o uno scalare. Ecco il più che solo le somme rispettano lo scambio.

Quindi, una matrice A con dimensioni (9,3) moltiplica per un vettore B dimensioni (3,2) dando un vettore C con dimensioni (9,1) per rispetto della precondizione.

Per la risoluzione del problema utilizziamo il moltiplicatore di Lagrange che permette di risolvere un problema di vincolato e non vincolato al costo di un numero di parametri da stimare.

La formula lagrangiana

λ = Moltiplicatore di Lagrange (scalare) U = Vettore da trovare

Calcoliamo il derivato della lagrangiana del primo ordine ponendo g = 0.

δ ℒ/δ (u)= 2 XT X u - 2 λ U + o = 0 = > X T X u = λ U

⇒ Equazione caratteristica

La disomogeneizzazione XT X U = λ U è detta equazione caratteristica di una matrice E associa ad ogni vettore M (autosistema) un valore λ (autovalore associato).

Ad ogni autovalore corrisponde l e non solo autosistema

Gli autovalori (λ) rappresentano la variabilità spiegata, e gli autovettori (u) approssimano un vettore dei pesi per il calcolo delle componenti principali.

Note U e moltiplicato per la matrice X avremo ψ (psi) perche ψ (n,p) = X û (m,p) (p,p)

Algoritmi di Clustering Gerarchici

Gli Algoritmi gerarchici realizzano fusioni o divisioni dei dati e si distinguono in:

  • Agglomerativi o Ascendenti (bottom-up): In un primo momento si hanno molti cluster e l'obiettivo è quello di raggrupparli fino ad ottenere un unico che contiene tutti.
  • Divisivi o Discendenti (top-down): Operazione opposta al bottom-up, ossia partimo da un unico cluster con l'obiettivo grande di dividere in sempre anche altri.

Utilizzando la distanza euclidea, si ottiene la matrice di dissimilarità.

Criteri Convenienza Assortimento A 3 2 B 4 5 C 4 7 D 2 7 E 6 6 F 7 7 G 6 4

Adesso formeremo gruppi mettendo insieme le unità vicine o simili.

Con il grado della nocciolatura agglomerativi partiremmo da 7 cluster ad una sola cluster diviso poco in poi dissimili.

La Regressione e l'ANOVA

La regressione è un modello che individua una relazione lineare tra 2 variabili quando la relazione è di tipo asimmetrico unidirezionale e vi induce il concetto di dipendenza tra la variabile dipendente Y e X, indipendente.

Y = B0 + B1 X + ε

B0 rappresenta l'intercetta, ossia il valore che assume la Y se X = 0.

B1 è il coefficiente di regressione ed è la variazione della Y dovuta una variazione unitaria della X.

Il coefficiente di regressione risponde quindi alla domanda: in media di quanto si modifica il valore atteso della variabile dipendente Y rispetto allo spostamento di un'unità nella variabile indipendente X.

L'Analisi della Varianza (ANOVA)

L'ANOVA è un insieme di tecniche statistiche parametriche che hanno come finalità quello di confrontare le medie di 2 o più gruppi di dati, scomponendo la devianza in devianza interna ai gruppi (within) e tra i gruppi (between). Essa è un modello di regressione in cui la variabile dipendente (Y) è qualitativa e la variabile indipendente (X) è qualitativa.

Yis = δ + αi + εis

[i ∈ livelli del fattore, s = individuo indice nel gruppo i, δ = effetto termine comune, αi = effetto comune, εis = effetto del termine livello del fattore]

Le Assunzioni (Ipotesi) dell'ANOVA:

  • La Y è la variabile qualitativa.
  • La X è la variabile qualitativa con almeno 2 gruppi di confronto.
  • Le unità statistiche sono indipendenti.
  • La distribuzione Y deve confermare dati normali.
  • La variabile qualitativa deve distribuire secondo una normale.

INTRODUZIONE A R E

APPLICAZIONI DI BASE

Prima di tutto bisogna creare un progetto, ... all'interno ci saranno gli script, i dataset, i dati e la raccolta.

FILE → NEW PROJECT → NEW DIRECTORY / EXISTING DIRECTORY → ...

- Le operazioni Aritmetiche:

  • OPERAZIONE TERMINOLOGIA
  • Somma: 12 + 8
  • Differenza: 6 - 18
  • Moltiplicazione: 22 * 3
  • Divisione: 25 / 7
  • Es. Potenza: 11^3 / 11**3

- Le operazioni binarie & logiche:

  • OPERAZIONE TERMINOLOGIA
  • Minore / Minore uguale: 2 < 5 / 2 <= 3
  • Maggiore / Maggiore uguale: 12 > 16 / 12 >= 16
  • Esclusione logica o: 16 | 4 = 32 / 8
  • Non logico a: 2 ^ 4 ! = 4 ^ 2
  • Negazione logica: ! (2 * (5 - 10) > 0)
  • Prodotto logico (AND): 3 & 2 = 12 & 8 < = 1
  • Somma logica (OR): (1 | 4) > 0 | (1 + 4 - 10) > 0
Dettagli
A.A. 2023-2024
32 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Riccardo_Montalbano di informazioni apprese con la frequenza delle lezioni di Modelli multidimensionali per l'analisi dei dati e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università del Salento o del prof Ciavolino Enrico.