Alberto Bagnai, Francesco Carlucci – Traccia per un corso di econometria
Modulo IV – Algebra delle matrici
1. Elementi di base
Indice del capitolo
- 1.1 Vettori ..................................................................................................................2
- 1.2 Matrici .................................................................................................................5
- 1.3 Operazioni tra matrici ..........................................................................................7
- Operazioni con matrici partizionate .............................................................. 10
- 1.4 La matrice inversa ............................................................................................. 11
- Il determinante di una matrice quadrata ...................................................... 11
- L’aggiunta di una matrice quadrata............................................................. 13
- L’inversa di una matrice partizionata ........................................................... 14
- Il determinante di una matrice partizionata ................................................. 14
- 1.5 Indipendenza lineare di vettori, rango di una matrice e alcune proprietà dei determinanti ................................................................................................................. 16
- Indipendenza lineare di vettori ..................................................................... 16
- Rango di una matrice ................................................................................... 16
- 1.6 Sistemi di equazioni ........................................................................................... 18
- Equazioni omogenee ..................................................................................... 18
- Equazioni non omogenee............................................................................... 19
- 1.7 Autovalori e autovettori...................................................................................... 20
- Equazione caratteristica di una matrice e sue soluzioni................................. 20
- Proprietà degli autovalori e autovettori......................................................... 21
- 1.8 Forme quadratiche e matrici definite positive e negative.................................... 24
- Matrici idempotenti ...................................................................................... 26
- 1.9 Derivazione vettoriale ........................................................................................ 27
- 1.10 Proprietà della traccia ........................................................................................ 29
- 1.11 Distribuzioni di forme quadratiche aleatorie....................................................... 31
1.1 Vettori
Se mettiamo in fila gli elementi di un campione, da a1 a an (1.1.1) otteniamo un vettore. Parimenti, costituiscono un vettore gli elementi di una serie temporale x1, x2, ..., xn (1.1.2) che si differenziano da quelli in (1.1.1) semplicemente perché sono associati a un indice temporale. In generale, un vettore è formato da una ennupla di elementi (ad esempio numeri reali) indicata con una lettera in neretto, ad esempio a. Il numero di elementi costituisce la dimensione del vettore. Un vettore reale di dimensione 1 è uno scalare, ovvero un numero reale.
Per convenzione, gli elementi sono organizzati in colonna:
a1 a2 ... an
In altri termini, in mancanza di indicazioni contrarie, i vettori che considereremo saranno tutti vettori colonna.
Dato un vettore a, si utilizza un apice per denotarne il trasposto, ovvero un vettore che contiene gli stessi elementi di a ma organizzati in riga, a' = [a1, a2, ..., an]. Trasponendo nuovamente un vettore riga, si ottiene un vettore colonna, ed è quindi possibile scrivere ad esempio a = [a1, a2, ..., an]' = a'. Il vettore 0 = [0, 0, ..., 0]' è quello i cui elementi sono tutti nulli. Due vettori della stessa dimensione a = [a1, a2, ..., an]' e b = [b1, b2, ..., bn]' sono detti uguali se ai = bi per ogni i; la loro somma è il vettore a + b = [a1 + b1, a2 + b2, ..., an + bn].
Queste definizioni si estendono immediatamente al caso di più di due vettori (di uguale dimensione). Dati tre vettori a, b, e c, si verificano facilmente le proprietà:
- a + b = b + a
- (a + b) + c = a + (b + c) = a + b + c
Il prodotto del vettore a per lo scalare d è il vettore il cui elemento i-esimo è dato dal prodotto di d per l'elemento ai posto in d · a = [d a1, d a2, ..., d an]. Dati due vettori di uguale dimensione a e b e due scalari d e f, si verificano immediatamente le proprietà:
- d(a + b) = da + db
- (d + f)a = da + fa
- (d · f)a = f(da)
- (da)' = da'
- (da + fb)' = da' + fb'
L’operazione di prodotto per uno scalare ci permette di definire la differenza tra due vettori a e b, che si ottiene moltiplicando il secondo per lo scalare -1 e sommandolo al primo: a - b = a + (-1) × b = [a1 - b1, a2 - b2, ..., ak - bk]'.
Si chiama prodotto scalare (o interno) di due vettori a e b che hanno la stessa dimensione lo scalare:
n∑ a' · b = aibi (1.1.3)
i = 1
per cui la somma dei quadrati degli elementi di un vettore a = [a1, a2, ..., an] può essere espressa mediante il prodotto scalare:
n∑ a' · a = ai2 (1.1.4)
i = 1
La devianza totale o residuale in un modello di regressione costituisce un esempio di prodotto scalare del tipo (1.1.4), dove si ponga a ≡ ut. Si noti che la (1.1.4) esprime anche il quadrato della lunghezza o modulo o norma Euclidea del vettore. Quest’ultima viene indicata con la notazione:
n∑ a' · a = ai2 (1.1.5)
i = 1
Esempio 1.1 - Dati due vettori riga a' = [1, 3, 5] e b' = [3, 2, 2], il loro vettore somma è c' = a' + b' = [4, 5, 7], mentre il loro prodotto scalare è a' · b = 1 × 3 + 3 × 2 + 5 × 2 = 19. Se, poi, consideriamo lo scalare 4, si ha 4a = [4, 12, 20]'. Infine, la lunghezza del vettore a è pari a √(1² + 3² + 5²) = √35.
Dati due vettori a e b diversi entrambi dal vettore nullo, si dimostra che il coseno dell’angolo da essi formato è dato dall’espressione:
θ = a' · b / (||a|| ||b||) (1.1.6)
La (1.1.6) si annulla quando il prodotto scalare a' · b dei due vettori è nullo, nel qual caso essi sono ortogonali.
1.2 Matrici
Una tavola a doppia entrata di elementi (ad esempio numeri reali) disposti su n righe ed m colonne, con m ed n interi positivi, è detta matrice ed è indicata con una lettera maiuscola in neretto:
a11 a12 ... a1m a21 a22 ... a2m ... ... ... ... an1 an2 ... anm
Tale matrice è detta avere ordine n × m ed è composta dagli elementi aij, con i = 1, 2, ..., n e j = 1, 2, ..., m. Se n = m, la matrice è detta quadrata, di ordine n. Un vettore riga ad n dimensioni è una particolare matrice di ordine 1 × n, mentre un vettore colonna della stessa dimensione è una matrice di ordine n × 1. Gli elementi aii, di una matrice quadrata appartengono alla diagonale principale e sono detti elementi diagonali; l'altra diagonale di una matrice quadrata è detta secondaria. Una matrice quadrata di ordine 1 è uno scalare.
Se tutti gli elementi di una matrice sono nulli, essa è detta matrice nulla ed è indicata con 0. Se tutti gli elementi di una matrice quadrata sono nulli salvo quelli dislocati sulla diagonale principale, la matrice è detta diagonale ed è indicata con:
d1 0 ... 0 0 d2 ... 0 ... ... ... ... 0 0 ... dn
dove di sono gli elementi non nulli della matrice, detti elementi diagonali. Se gli elementi diagonali sono tutti pari a uno, la matrice è detta unitaria o identica (o unità) ed è indicata con:
1 0 ... 0 0 1 ... 0 ... ... ... ... 0 0 ... 1
dove l'indice n, che rappresenta l'ordine della matrice quadrata, può essere omesso. Per semplicità di notazione, talvolta una matrice diagonale è indicata listando i soli elementi diagonali nel seguente modo:
D = < d1, d2, ..., dn >
Con questa notazione, la matrice identica diventa In = < 1, 1, ..., 1 >.
Una matrice quadrata è detta triangolare superiore (inferiore) se ha tutti zeri al di sotto (al di sopra) della diagonale principale. Una matrice triangolare superiore di ordine n è quindi del tipo:
a11 a12 ... a1n 0 a22 ... a2n ... ... ... ... 0 0 ... ann
Spesso nelle applicazioni conviene far riferimento a singole sottomatrici o blocchi di una data matrice. Si parla allora di matrice partizionata e la si rappresenta generalmente indicizzando i singoli blocchi. Ad esempio, per una matrice partizionata in quattro blocchi si usa una notazione di questo genere:
A11 A12 A21 A22
Un caso particolare di matrice partizionata è la matrice diagonale a blocchi, nella quale gli elementi diagonali sono costituiti da matrici quadrate, non necessariamente dello stesso ordine:
A1 0 ... 0 0 A2 ... 0 ... ... ... ... 0 0 ... An
1.3 Operazioni tra matrici
Due matrici sono uguali se gli elementi corrispondenti (dello stesso posto) sono uguali. La somma di due matrici A e B che hanno lo stesso ordine è una matrice C ancora dello stesso ordine che ha per elemento generico cij = aij + bij. Questa definizione è immediatamente generalizzata al caso della differenza ed a quello della somma di più di due matrici. Si può facilmente verificare che valgono le proprietà:
- A + B = B + A
- (A + B) + C = A + (B + C) = A + B + C
Il prodotto di una matrice A per uno scalare d è la matrice che ha per elemento generico daij. La trasposizione di una matrice di ordine n × m e di elemento generico aij è un'operazione che trasforma A nella matrice di ordine m × n e di elemento generico aji; in altre parole, nella trasposizione si scambiano le righe con le colonne, ovvero il j-esimo vettore riga di A' è il trasposto del j-esimo vettore colonna di A. La matrice A' è detta trasposta di A.
Esempio 1.2 - La trasposta di
2 3 2 1 4 3 0 1
è
2 1 3 4 3 0 1
Esempio 1.3 - Sia A' la trasposta della matrice dell'esempio precedente ed inoltre sia
1 1 2 2 3 0
Allora la loro matrice somma è data da
3 4 4 2 7 1
Se A è quadrata ed uguale alla sua trasposta, è detta simmetrica (cioè aij = aji). Se d e f sono due scalari, valgono le proprietà:
- (A')' = A
- (dA)' = dA'
- (dA + fB)' = dA' + fB'
Si dice prodotto righe per colonne della matrice A di ordine n × m per la matrice B di ordine m × k, la matrice C di ordine n × k con elemento generico:
m∑ cij = aisbsj
s = 1
Il nome di questo prodotto deriva dal fatto che ogni elemento di C è costituito dalla combinazione lineare degli elementi di una colonna di B con pesi dati dagli elementi di una riga di A. Si noti che cij è il prodotto scalare (1.1.3) dell’i-esima riga di A per la j-esima colonna di B.
Esempio 1.4 - Se A e B sono le matrici degli esempi precedenti, il loro prodotto righe per colonne è:
2 1 1 1 2 3 2 2 4 2 16 4 6 3
A meno che k ≠ n, il prodotto B · A non esiste; inoltre, per A · B ≠ B · A, in generale, non vale la proprietà commutativa della moltiplicazione.
Esempio 1.5 - Date le matrici A e B dell'esempio precedente, si ha:
1 2 1 1 2 3 2 1 4 2 5 1 5 6 3 12
Allora, il prodotto di A di ordine 2 × 3 per B di ordine 3 × 2 è una matrice di ordine 2 × 2; il prodotto B · A è una matrice di ordine 3 × 3.
Osservazione 1.1 - Poiché i vettori sono casi particolari di matrici, il vettore riga di n elementi a' può essere considerato come il trasposto del vettore colonna a. Il prodotto scalare tra due vettori che hanno la stessa dimensione è quindi una matrice di dimensione 1 × 1, cioè uno scalare. Invece, il prodotto a · b' è una matrice quadrata di ordine n - 1.
Esempio 1.6 - Dato il vettore a = [0, 1, 0, 0]', il prodotto a · a' vale:
0 0 0 0 0 1 0 0 = 1 0 1 0 0 0 0 0 0 0
matrice quadrata di ordine cinque.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.