Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
=Z =Z
incorrelate; si può notare che, essendo e , il vincolo equivale a porre:
1 1 2 2
1 1
( )
' ' ' ' '
cov y , y y y Z Z v R v λ v v
( ) = =v =v = =0
1 2 1 2 1 2 1 2 1 1 2
n n λ
Scegliendo il secondo autovalore in ordine decrescente e sostituendolo nel sistema
2
R− λ I v v R
( ) =0 , si ottiene ovvero il secondo autovettore della matrice .
2 2 2
L’estrazione delle componenti principali termina quando il numero delle componenti principali estratte
è uguale al numero delle variabili originarie; nella procedura di estrazione, come per le prime due
v
componenti, il generico vettore che massimizza la varianza della k-esima componente principale,
k
sotto i vincoli di incorrelazione con le precedenti componenti già estratte, è il k-esimo autovettore della
λ
R
matrice di correlazione , dove il corrispondente autovalore costituisce la varianza della
k
y p
componente principale . Al termine della procedura si ottengono componenti principali
k
y
dove la generica è data dalla combinazione lineare:
k [ ]
p
∑ v z
[ ][ ] [ ]
sk 1s
z … z v y
11 1p 1k s=1 1k
y v
=Z = = =
…
… … … … …
k k p
z … z v y
∑
n1 np pk nk
v z
sk ns
s=1
p Z
Delle variabili originarie espresse in forma standardizzata nella matrice si ottiene la matrice
Y n × p p n
di dimensione , le cui colonne sono le componenti principali calcolate per le
unità statistiche osservate:
Y =ZV
V p× p R
Dove è la matrice con colonne uguali agli autovettori della matrice di correlazione
R v v
=λ
. Data la relazione , si ha:
j j j
RV =VL L p× p
Dove la matrice è una matrice diagonale di dimensione con gli autovalori sulla
diagonale principale:
[ ]
λ 0 0
1
L= 0 … 0
0 0 λ p
Dove qui osservare che:
p
1. Le componenti principali sono incorrelate tra loro;
p
2. Le componenti principali sono ordinate in senso decrescente rispetto alla varianza
var y ≥ var y ≥... ≥ var y ≥ var y
( ) ( ) ( ) ( )
1 2 p−1 p
p p
3. Le componenti principali riproducono la varianza totale delle variabili originarie
p p p
∑ ∑ ∑
var z var y λ p
( ) ( )
= = =
k k k
k=1 k=1 k=1
Le proprietà 2 e 3 sono utili per scegliere il numero di variabili da selezionare e trattenere nella analisi;
bisogna infatti considerare il valore degli autovalori (si considerano le componenti alle quali è associato
un autovalore della matrice di correlazione maggiore o uguale a 1) e la percentuale di varianza spiegata
(si trattengono le componenti principali le cui varianza cumulate superano una fissata quota di varianza
Σ λ p> 0,75
/
totale, in generale ). I criteri sono alternativi e possono portare a risultati differenti:
k=1 k
CAPITOLO 7 - APPLICAZIONE DELL’ACP IN AZIENDA
L’ACP è frequentemente utilizzata nei seguenti casi: (i) la sintesi di indici del bilancio aziendale per la
valutazione delle prestazioni economico-finanziaria dell’azienda e per il confronto con le prestazioni di
altre aziende, (ii) la riduzione del numero di variabili che descrivono i profili dei clienti oppure i loro
giudizi con riferimento a un certo bene, (iii) la riduzione del numero di variabili effettuata prima della
analisi per gruppi (es segmentazione di mercato). Vediamo qui il caso degli indici di bilancio: supposte
n p
aziende e indici di bilancio per ogni azienda con informazioni diverse, poniamo come
obiettivo la interpretazione della situazione economico-finanziaria dell’azienda in base agli indici
disponibili, nonché il confronto con le altre:
Preliminarmente,(1)in primo luogo andiamo a verificare se l’unità di misura e l’ordine di grandezza
coincidono, e in caso standardizziamo; (2)in secondo luogo andremo ad analizzare le correlazioni tra le
variabili originarie: l’ACP conduce a risultati migliori quando le variabili di partenza sono fortemente
correlate. Dall’analisi di questo caso emerge che IND e CR hanno varianze con ordini di grandezza
differenti rispetto alle varianze di ROA e ROE:
Allora è opportuno passare ai dati standardizzati. Dalla matrice di correlazione si nota inoltre che gli
indici CR e IND sono correlati (negativamente), e che gli indici ROA e ROE sono fortemente correlati
(positivamente):
Questa è la situazione ottimale per l’ACP: esistono variabili ridondanti ma anche variabili non correlate
tra loro. PROCEDURA SOFTWARE NELLE SLIDE CAP 10 DA 19 A 23. Per poi attribuire un
p
significato alle 2 componenti principali trovate impieghiamo la correlazione tra queste e le
T
variabili di partenza (matrice di correlazione ); questa è data da:
−1 −1 −1
1 1
' '
2 2 2
T Z Y L Z ZV L L
= = =RV
n n RV T
Rammentando che si riscrive la matrice come:
=VL
[ ]
λ v … λ v
√ √
1
−1 1 1,1 1 1, p
2 2
T L L
=VL =V = … … …
λ v … λ v
√ √
1 p , 1 1 p , p
√ λ v
Dove è la correlazione tra la prima componente principale e la p-esima variabile originaria.
1 p ,1
L’informazione sulle correlazioni tra le variabili originarie e le prime due componenti principali può
essere rappresentata graficamente: Z
Esercizio: 10 aziende, 5 indici di bilancio; partiamo subito con la matrice standardizzata:
ROA ROE ROS CR QR
-0,24 0,72 0,48 2,26 2,15
-0,54 1,21 0,11 -1,13 -1,26
-1,75 -1,7 -1,75 -0,16 -0,41
0,51 0,24 0,63 -0,48 -0,92
-0,84 -1,21 0,26 -0,16 -0,07
0,07 0,24 0,11 -0,32 0,27
1,28 1,21 0,48 -0,97 -0,58
-0,84 -0,73 -1,38 0,81 1,3
1,58 1,21 1,23 0,97 0,27
0,37 -0,24 1,60 -0,84 -0,75
R)
Passiamo direttamente al secondo punto, la correlazione tra le variabili originarie :
(matrice
ROA ROS ROE CR QR
ROA 1
ROS 0,694 1
ROE 0,687 0,659 1
CR -0,066 0,055 -0,012 1
QR -0,156 -0,017 -0,069 0,923 1
Come si osserva vi è una correlazione medio-alta tra gli indici economici (ROA, ROS e ROE), una
correlazione alta per gli indicatori finanziari (CR e QR), che presentano però una bassa correlazione tra
loro; siamo dunque nella situazione ideale per l’analisi ACP. Avremo la seguente matrice dei vettori
V 5 ×5
di dimensione :
[ ]
0,577 0,078 0,140 0,797 −0,07
0,549 0,188 0,621 −0,527 −0,013
V = 0,557 0,135 0,179 0,023
−0,770
0,693 0,008 0,097 0,701
−0,137 0,678 0,010
−0,190 −0,043 −0,709
Dove la prima colonna rappresenta l’autovettore 1. Andiamo ora a stimare il numero ottimale di
variabili da trattenere impiegando la varianza: 5
∑
λ λ λ λ λ λ complessiva ;
=2,32 =1,91 =0,34 =0,29 =0,07 =5=varianza
1 2 3 4 5 1
i=1
λ λ λ λ
+ 4,3
1 2 1 2
=0,478=47,8 =0,382=38,2 = =0,86=86
5 5 5 5
È utile dunque passare ad una situazione con solo 2 variabili.
[ ] [ ]
v 0,892
11
v 0,849
21
t λ ×
√
= =
v 0,861
1 1 31 −0,212
v 41 −0,294
v
51
I primi 3 sono le correlazioni tra la prima componente e gli indici di reddittività; notiamo che mentre
con questi è alta, è invece bassa per gli indici finanziari.
[ ] [ ]
v 0,108
12
v 0,260
22
t λ ×
√
= =
v 0,187
2 2 32 0,958
v 42 0,937
v 52
Qui invece abbiamo il contrario. In seguito si dovrebbe fare il grafico delle correlazioni.
La prima componente principale è un indicatore sintetico concorde di reddittività; al crescere delle
prime c.p. aumenta la reddittività dell’azienda; vi è una forte correlazione positiva con gli indici di
reddittività e debolmente correlata con gli indici finanziari. La seconda c.p. è un indicatore sintetico
concorde di buon equilibrio finanziario a breve termine; al crescere di questa migliora l’equilibrio
finanziario dell’azienda; forte correlazione positiva con indici finanziari, e debole con gli indici
economici.
Rappresentare sul grafico delle osservazioni le posizioni delle aziende rispetto ai loro punteggi nelle
componenti principali è un ottimo sistema per confrontarle:
z
z
33 × v z × v z × v
¿ ( ) ( )
(¿ )+ + =−2,82
es azienda3 y , y
( ) 31 34 41 35 51
31 32 31 × v z × v
¿ ( )
(¿ )+ +¿
11 32 21
y =¿
31
Avremo ad esempio un grafico di questo tipo:
C2 C1
Con ogni punto indicante un’azienda.
CAPITOLO 8 - ANALISI DEI RISULTATI CON IL MODELLO DI REGRESSIONE LINEARE
SEMPLICE , y ,… , x , y , … , x , y
n
Considerando coppie di osservazioni il modello di regressione
(x )
1 1 i i n n
lineare semplice assume che il processo generatore di tali coppie possa essere espresso con una
funzione lineare: Y β , β , x
Y β x ( )
=f +ε
=β + +ε i 0 1 i i
i 0 1 i i
ε E ε
( ) =0
Dove è una variabile casuale con valore atteso nullo e varianza costante
i i
2
Var ε i=1, … ,n
( ) . In forma matriciale avremo:
=σ ∀
i
{
Y x ε
=β +β +
1 0 1 1 1
Y x ε
=β +β +
n 0 1 n n
[ ] [ ] [ ]
Y 1 x ε
[ ]
1 1 1
β 0
Y X= β= ε
= =
… … … …
β 1
Y 1 x ε
n n n
Y Xβ+ε
= ̂ ̂
β β y
+
Impiegando delle stime dei parametri (incogniti) è possibile stimare :
0 1
̂ ̂
y β β x
̂ = +
i 0 1 i y
̂
Il metodo di stima dei parametri individua i valori di tali parametri in modo che i valori stimati di i
y
siano il più vicini possibili ai valori osservati ; ciò equivale a minimizzare la somma dei residui
i
e y y
= − ̂ elevati al quadrato:
i i i
n n n
∑ ∑ ∑
2 2 2
S β e y y y x
( ) ( ) ( )
= = − ̂ = −β −β
i i i i 0 1 i
i=1 i=1 i=1
In termini matriciali avendo:
[ ] [ ]
y e
1 1
y= come vettore della variabile casuale Y e e= il vettore dei residui
… …
y e
n