Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
U ,U
d , U
(U )
i j i j
seguenti proprietà, per defnizione:
Identità: se e solo se .
x ; 1≤h≤ p
d , U =x
• (U )=0
i j hi hj
Non negatività: .
d , U i , j
• (U )≥0 ∀
i j
Simmetria: .
d , U , U i , j
• (U )=d (U ) ∀
i j j i
Triangolarità: .
d , U , U , U i , j
• (U )≤d (U )+d (U ) ∀
i j i w w j
Le tipologie di distanza maggiormente utilizzate sono le seguenti:
p
√ 2
Distanza euclidea: D(U , U x
∑
)= ( −x )
• i j ik jk
k=1 p
Distanza city block (o Manhattan): D , U x
∑ | |
• (U )= −x
M i j ik jk
k=1
In ogni caso, è possibile ricondurre ogni misura di distanza ad un caso
particolare della cosiddetta distanza di Minkowsky:
1
p
( )
s s
d , U x
∑ | |
(U )= −x
➢ i j ik jk
k=1
Se allora si ottiene la distanza city block. Se si ottiene la
s=1 s=2
distanza euclidea.
Un’altra modalità adeguata di rappresentare la dissimilarità tra diverse unità è
fornita dai cosiddetti indici di distanza. Sono molto simili alle misure di
distanza, ma non possiedono la proprietà di triangolarità. Un indice di
distanza molto utilizzato è il quadrato della distanza euclidea:
p
2 2
D ,U x
∑
➢ (U )= ( −x )
i j ik jk
k=1
3.3: LA MATRICE DI DISSIMILARITÀ.
Una volta scelta una misura (o indice) di distanza da utilizzare per il clustering,
si calcola la distanza tra ogni coppia di unità . I risultati
, j) ; i, j .. , n)
(i ∈ (1,2,.
possono essere raggruppati nella cosiddetta matrice di dissimilarità, che
naturalmente è una matrice .
n×n
Prendiamo nuovamente come esempio i seguenti dati.
Applicando le 3 misure/indici di distanza esposte nel precedente paragrafo, si
ottengono le seguenti 3 matrici di dissimilarità:
MATRICE DI DISSIMILARITÀ CON DISTANZA CITY BLOCK
MATRICE DI DISSIMILARITÀ CON DISTANZA EUCLIDEA
MATRICE DI DISSIMILARITÀ CON QUADRATO DELLA DISTANZA EUCLIDEA
3.4: GLI ALGORITMI GERARCHICI.
Gli algoritmi gerarchici sono processi iterativi, che operano in passi
n−1
(con che è il numero di unità). Ogni passo consiste nell’unire la coppia di
n
unità/gruppi meno distante e nel ricalcolare la matrice delle distanze tenendo
conto del raggruppamento appena efettuato. Una volta che un’unità è entrata
in un cluster, non viene da questo più rimossa.
Si distinguono 3 diferenti algoritmi gerarchici:
Metodo del legame completo: la distanza tra due gruppi è defnita
• come la distanza massima fra due unità appartenenti rispettivamente al
primo e al secondo gruppo.
Metodo del legame singolo: la distanza fra due gruppi è defnita come
• la distanza minima fra due unità appartenenti rispettivamente al primo e
al secondo cluster.
Metodo della distanza media: la distanza fra due gruppi è la media
• delle distanze fra tutte le coppie di unità formate da una unità di un
gruppo e una dell’altro gruppo.
Ipotizziamo di utilizzare i dati di esempio riportati nei paragraf precedenti, di
aver scelto come indicatore di distanza la distanza euclidea al quadrato, e
come algoritmo gerarchico il metodo del legame completo. In R il codice da
implementare sarà il seguente (la seconda linea stampa su schermo le distanze
di unione ottenute progressivamente con ogni passo).
3.5: OUTPUT GRAFICI DELLA CLUSTER ANALYSIS CON ALGORITMO
AGGREGATIVO.
Le cluster analysis producono due tipologie di output grafci, utili per una
visualizzazione più intuitiva dei risultati delle analisi:
Scree plot: grafci in due dimensioni, che riporta la distanza di unione (in
• ascissa) in corrispondenza del numero dei gruppi (in ordinata).
g
Dendrogrammi: si tratta di diagrammi ad albero che descrivono
• l’aggregazione gerarchica dei gruppi e ne mostrano la composizione. La
struttura ad albero del dendrogramma viene “potata” (pruning) in
corrispondenza del “gomito” individuato all’interno dello scree plot.
Ad esempio, se riprendiamo come esempio la cluster analysis svolta nel
paragrafo precedente, otteniamo come risultato i seguenti dendrogramma e
scree plot.
Il comando R usato per produrre lo scree plot è riportato qui sotto.
La potatura del dendrogramma viene svolta col seguente comando (nel nostro
caso avviene in corrispondenza di un numero di gruppi pari a 3).
3.6: INTERPRETAZIONE DEI GRUPPI INDIVIDUATI.
Una volta terminata l’analisi, si devono interpretare i risultati. Ciò può
essere fatto in diversi modi, tra loro complementari.
Scomposizione della devianza totale di ogni variabile in devianza interna
• e devianza tra i gruppi.
Studio univariato delle distribuzioni delle variabili all’interno di ciascun
• gruppo.
Rappresentazione di ciascun gruppo in base ai valori medi (centroidi)
• delle variabili.
Studi di associazione con variabili esterne (NB: non sono ammissibili test
• parametrici).
Concludiamo riproponendo sempre lo stesso esempio. I risultati ottenuti sono i
seguenti.
Questi dati ci dicono che:
I gruppi sono ben discriminati in quanto la devianza tra i gruppi spiega la
• quasi totalità della variabilità totale (86% per il rapporto di indebitamento
RI e quasi il 100% per l’indice di liquidità generale 100%).
Il gruppo di imprese “migliori/meglio performanti” è il gruppo G1 che si
• caratterizza per un più basso livello d’indebitamento e per una più
equilibrata copertura degli investimenti nel tempo.
4: MODELLI DI PREVISIONE DELLE INSOLVENZE.
4.1: L’INSOLVENZA.
Si indica con il termine insolvenza l’incapacità del debitore di far fronte alle
obbligazioni assunte. Si verifca in caso di disequilibrio fnanziario ed è il
presupposto per l’applicazione delle procedure concorsuali:
Fallimento.
• Concordato preventivo.
• Liquidazione coatta amministrativa.
• Amministrazione straordinaria delle grandi imprese.
• Amministrazione straordinaria speciale.
•
Adottando l’ottica dell’investitore, risulta di fondamentale importanza cercare
di valutare il grado di solidità/dissesto fnanziario delle imprese. In generale,
ogni valutazione ex-ante circa la capacità da parte di un debitore di far fronte
alle proprie obbligazioni viene defnita previsione delle insolvenze.
I modelli per la previsione delle insolvenze sono genericamente riconducibili a
modelli classifcatori, il più delle volte binari (del tipo insolvenza/non
insolvenza). I dataset utilizzati in fase di previsione comprendono:
Dati sulle caratteristiche individuali del debitore.
• Dati sulle connotazioni ambientali in cui il debitore opera.
•
In output, si genera un punteggio sintetico volto a misurare la probabilità di
rimborso regolare del debitore.
Le cause dell’insolvenza possono essere distinte secondo 3 diversi criteri di
classifcazione:
Per natura:
• Cause fnanziarie : talvolta, malgrado l’impresa abbia performance
◦ economiche buone, possono generarsi situazioni di disequilibrio
fnanziario (ad esempio nel caso di mancato pagamento da parte dei
clienti e difcoltà nel reperire capitale di credito)
Cause economiche : se l’attività posta in essere dall’impresa non è in
◦ grado di generare utili nel medio/lungo termine, l’impresa si trova in
disequilibrio economico. Se questa condizione si protrae nel tempo, il
risultato può essere un dissesto fnanziario.
Temporale:
• Cause remote : cause lontane nel tempo rispetto alla manifestazione
◦ dell’insolvenza. Sono tipicamente dovute a squilibri e inefcienze
strutturali, incapacità del management, scarsa qualità del sistema
informativo, stile direzionale troppo rigido, scarse competenze
specifche.
Cause prossime : vicine nel tempo rispetto alla manifestazione
◦ dell’insolvenza. Sono generalmente dovute ad eventi improvvisi che
generano un impatto molto rilevante, come ad esempio crisi e
congiunture economiche negative.
Per competenza:
• Cause interne : tipicamente dovute a scelte imprenditoriali sbagliate.
◦ Cause esterne : generalmente dovute a dinamiche e fenomeni non
◦ conoscibili dai soggetti decisori all’interno dell’azienda.
Possiamo facilmente intuire le fnalità dell’analisi statistica degli indici di
bilancio per la previsione delle insolvenze:
Finalità descrittive ed esplicative: per capire come si manifesta e come si
• sviluppa una crisi aziendale, e cogliere le cause che hanno determinato lo
stato di insolvenza.
Finalità predittive: per capire quali sono i rischi di insolvenza associati a
• differenti performance economico-fnanziarie e diagnosticare in anticipo
le possibili situazioni di dissesto.
4.2: LA FUNZIONE DI PROBABILITÀ DI RIMBORSO REGOLARE DEL
DEBITORE.
La probabilità di rimborso regolare del debitore dipende da 2 fattori:
Rispetto delle future condizioni di equilibrio economico fnanziario e
• patrimoniale da parte del debitore.
EqEFP
( )
Caratteristiche comportamentali del soggetto debitore: le
CarComp)
• (
caratteristiche comportamentali sono meno rilevanti quando il debitore è
un’azienda, e sono tipicamente note ex-ante prima della concessione del
fnanziamento.
Considerando questi 2 fattori, la funzione di probabilità di rimborso
regolare del debitore assume la seguente forma generica:
P( RimReg)=f EqEFP ,CarComp)
➢ (
Nel caso di azienda può essere semplifcata così:
P( RimReg)=f EqEFP
➢ ( )
La quantità viene misurata analizzando i valori degli indici di bilancio
EqEFP
dell’impresa. La forma di viene determinata tramite analisi dei dati.
f (⋅)
Naturalmente, la funzione di cui sopra non misura solo la probabilità di
rimborso regolare, ma (adottando l’ottica del creditore) misura anche il rischio
di credito (o rischio di insolvenza) in capo al soggetto creditore.
4.3: TIPOLOGIE DI ANALISI PER LA PREVISIONE DELLE INSOLVENZE.
Le analisi per la previsione delle insolvenze possono essere genericamente
distinte in due categorie:
Analisi univariate: utilizzate prevalentemente fno agli anni ‘60. Le
• analisi univariate degli indici di bilancio servivano principalmente per
capire:
Quali indici (in base ai valori assunti in esercizi precedenti), sono in
◦ grado di