Anteprima
Vedrai una selezione di 10 pagine su 99
Metodi quantitativi Pag. 1 Metodi quantitativi Pag. 2
Anteprima di 10 pagg. su 99.
Scarica il documento per vederlo tutto.
Metodi quantitativi Pag. 6
Anteprima di 10 pagg. su 99.
Scarica il documento per vederlo tutto.
Metodi quantitativi Pag. 11
Anteprima di 10 pagg. su 99.
Scarica il documento per vederlo tutto.
Metodi quantitativi Pag. 16
Anteprima di 10 pagg. su 99.
Scarica il documento per vederlo tutto.
Metodi quantitativi Pag. 21
Anteprima di 10 pagg. su 99.
Scarica il documento per vederlo tutto.
Metodi quantitativi Pag. 26
Anteprima di 10 pagg. su 99.
Scarica il documento per vederlo tutto.
Metodi quantitativi Pag. 31
Anteprima di 10 pagg. su 99.
Scarica il documento per vederlo tutto.
Metodi quantitativi Pag. 36
Anteprima di 10 pagg. su 99.
Scarica il documento per vederlo tutto.
Metodi quantitativi Pag. 41
1 su 99
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

COME INTERPRETARE LE COMPONENTI

1. La rotazione delle componenti principali

La rotazione ortogonale nello spazio dei fattori non influenza la validità del modello: sfruttiamo questa

caratteristica per ottenere dei fattori più facilmente interpretabili

Ci sono numerosi outputs di analisi fattoriale che possono essere prodotti attraverso gli stessi dati input.

Questi numerosi outputs non forniscono un’interpretazione che consente di affermare che siano

notevolmente diversi tra loro, anzi differiscono solo leggermente e ci sono aree di ambiguità.

 Il metodo di rotazione Varimax, suggerito da Kaiser, ha lo scopo di minimizzare il numero di

variabili con elevate saturazioni (correlazioni) per ogni fattore

 Il metodo Quartimax tenta di minimizzare il numero di fattori strettamente correlati a ciascuna

variabile

 Il metodo Equamax è un incrocio tra il Varimax e Quartimax.

La percentuale della varianza complessiva dei fattori ruotati non cambia, mentre la percentuale della

varianza spiegata da ciascun fattore cambia.

Esempio: Per costruzione, i fattori sono variabili

F F F * F *

1 2 1 2 ortogonali, ossia tra loro non correlabili.

X 0,6 0,5 0,65 -0,1

1

X 0,4 0,3 0,5 0,05

2

X -0,2 -0,4 -0,2 -0,4

3

X -0,3 0,4 0,05 -0,6

4

GRAFICO 10 Matrice delle componenti su un

piano cartesiano: posso pensare di

ruotare i due assi mantenendo la

perpendicolare e calcolare le

coordinate rispetto ai nuovi assi.

La rotazione non ha cambiato il risultato ma la quota di informazioni viene distribuita meglio tra i vari

fattori.

Una volta trovata una soluzione adeguata, è possibile utilizzare i fattori ottenuti come nuove macrovariabili

da considerare per ulteriori analisi sul fenomeno in esame, sostituendo così le variabili originali; sempre

tenendo in considerazione l'esempio, possiamo aggiungere sei nuove variabili nel file di dati, come segue:

- Salute,

- Convenienza e praticità, Sono variabili standardizzate: media = 0 e varianza =

- Immagine, 1.

- Artigianato, Saranno l'input per ulteriori analisi di dipendenza e/o

- Comunicazione, interdipendenza.

- Gusti (?). Lezione 10: 17/11

MODELLI STATISTICI:

A seconda della natura delle variabili e della forma funzionale che vogliamo attribuirgli, i modelli assumono

forme diverse.

IL MODELLO DI REGRESSIONE LINEARE

1. Introduzione ai modelli di regressione

2. Obiettivi

3. Le ipotesi del modello

4. La stima del modello

5. La valutazione del modello

6. Commenti

Esempio (case study): La classificazione dei clienti/prospect in termini predittivi

Dal punto di vista aziendale, la fase di acquisizione incrementale del portafoglio clienti comporta un costo

da sostenere maggiore rispetto al ritorno nel breve periodo. Il direttore marketing che ha in carico a

customer base, come indirizza le campagne pubblicitarie? Una volta acquisito il cliente e passati i primi

mesi di rapporto, ha la necessità di stabilire la redditività media attesa da questo momento in poi ai

prossimi 24 mesi.  

Logica mass market logica CRM classico problema di analisi statistica con cui devo piegare un evento

futuro sulla base di dati attuali (tema che rientra nell’ambito dei test statistici).

L’IMPOSTAZIONE DEL PROBLEMA:

Redditività = Ricavi – Costi

- La redditività è una variabile continua

- Classi di redditività (< 0; ≥ 0)

In questo caso la variabile dipendente oggetto di analisi è “redditività = ricavi – costi”; a seconda di come

vogliamo considerare la variabile, possiamo dare una forma alla sua distribuzione.

E’ una variabile potenzialmente misurabile su una scala -∞; +∞. Potrei volere la risposta di una redditività

puntuale (var. continua) oppure volere sapere solamente se sarà positiva o negativa (var. dicotomica).

I DATI DI INPUT

Viene definito l’oggetto di analisi:

- Y: Redditività consolidata

- X: numero di ordini (dati comportamentali e strutturali)

pagato ordini

pagato rateale mensile

sesso (dicotomica)

area (dicotmiche…)

X Y

0 3 24m t

IL PERCORSO DI ANALISI

Come si struttura il percorso di analisi?

- Strutturazione/predisposizione della banca dati: per noi è la matrice dati in cui va evidenziata la

variabile per cui vogliamo spiegare il fenomeno ma di solito è più complessa)

- Costruzione della variabile obiettivo (di natura continua o dicotomica)

- Stima del modello: una volta comprese le dinamiche elementari dei dati, cioè uni e bivariato, si

costruisce il modello

- Validazione

- Implementazione e/o uso a livello interpretativo

ANALISI PRELIMINARI:

1. Lo studio della distribuzione di Y

2. La struttura di correlazione tra Y e X

L’IMPOSTAZIONE DEL PROBLEMA: 

- Redditività variabile continua REGRESISONE LINEARE

- Redditività variabile dicotomica REGRESSIONE LOGISTICA

I MODELLI DI REGRESSIONE

Modelli di dipendenza per la rappresentazione di relazioni non simmetriche tra le variabili

 Y “variabile dipendente” (variabile target da spiegare)

 X1,…,Xp “variabili indipendenti” (variabili esplicative o regressori)

IL MODELLO DI REGRESSIONE LINEARE

E’ un modello/regola statistica costruito e testato al fine di mettere in relazione due oggetti

- X , …, X : VARAIBILI INDIPENDENTI (variabili esplicative o regressioni)

1 p

- Y : VARIABILE DIPENDENTE (o variabile target)

Si vuole pertanto descrivere la relazione tra Y e X ,…, X con una funzione lineare, cercando in particolare di

1 p

spiegare Y in funzione delle X

 

se p =1 osservazioni in uno spazio a due dimensioni

Y f ( X )

i i

1 (i=1,…,n) A parità di forma funzionale

  posso utilizzare una o più

se p > 1 osservazioni in uno spazio a p + 1 dimensioni informazioni

Y g ( X ,..., X ) (i=1,…,n)

i i

1 ip Modello di

regressione

lineare multipla

 

o retta di regressione lineare semplice

se p = 1 spazio a due dimensioni Y = a + bX

E’ una rappresentazione generale perché è il luogo

teorico geometrico che permette di dare

generalità al fenomeno empirico. Trovo una regola

preisa che mi dà l’incremento marginale (per es.

quanto aumenta la redditività al variare di un’unità

aggiuntiva d’età), posso fare una proiezione

o   retta” di regressione lineare multipla

se p > 1 spazio a p+1 dimensioni (tridimensionale) “

Y = a + bX + cX + … + β X

1 2 p p

Incremento marginale di Y all’aumentare di

una unità di X p

La regressione lineare è il modello più semplice da cui si parte; se questo non riesce a spiegare tutti i

regressori, si passa a un modello più complesso.

OBIETTIVI:

 Uso esplicativo: stimare l’influenza dei regressori sulla variabile target, il contributo e la direzione (+ o -)

 Uso predittivo: stimare il valore non osservato della variabile target in corrispondenza di valori

osservati dei regressori.

 Uso comparativo: confrontare la capacità di più regressori, o di più set di regressori, di influenzare il

target (= confronto tra modelli di regressione lineare diversi).

LE IPOTESI DEL MODELLO

 n unità statistiche

 vettore colonna (nx1) di n misurazioni su una variabile continua (Y)

 matrice (nxp) di n misurazioni su p variabili quantitative (X , …, X )

1 p

 (y , x , x , x , …, x )

la singola osservazione è il vettore riga i=1,…,n

i i1 i2 i3 ip

livello soglia matrice del disegno

La matrice X = [1, X , …, X ] è detta .

1 p

β , β , …, β :

- coefficienti non noti nella fase iniziale

1 2 p

ε

- : motivazione dell’inserimento dell’errore

i

L’errore presente nel modello si ipotizza essere di natura casuale. Può essere determinato da:

- variabili non considerate

- problemi di misurazione

- modello inadeguato

- effetti puramente casuali  

E ( ) 0

1. Errore atteso nullo (cioè media errori nulla)  

 2

Cov ( ) I

2. Errori con varianza costante (omoschedasticità) n 

* 1 – 3 hp deboli

   

Cov ( , ) 0 1 – 4 hp forti

3. Errori non correlati (per ogni i≠j) i j

  

~ N ( 0

, I )

4. Errori con distribuzione normale n

Non inficia la possibilità di stimare il

modello ma è necessaria per fare dei test

Da un punto di vista statistico 

- Y è un vettore aleatorio di cui si osserva una specifica realizzazione campionaria hp sulla

distribuzione (tale vettore aleatorio lo andrò a spiegare attraverso una matrice dei coefficienti ed una

componente aleatoria) 

- X è una matrice costante con valore noto no hp sulla distribuzione

- β è un vettore costante non noto 

- l’errore è un vettore aleatorio di cui si osserva una specifica realizzazione campionaria hp sulla

distribuzione

In media Y può essere rappresentata come funzione lineare delle sole (X , …, X )

1 p

 

 

E (

Y ) X

Ogni osservazione di Y è uguale ad una combinazione lineare dei regressori con pesi=coefficienti beta + un

termine di errore  

 

Y X 0 

Per ε Y Xβ

E’ il luogo dei punti che spiegano come Y varia al variare dei regressori X

LA STIMA DEL MODELLO: METODO DEI MINIMI QUADRATI

Si vuole trovare la retta lineare migliore data la nuvola di punti.

Equazione teorica coefficienti non noti

Equazione stimata coefficienti stimati

Stimando la retta di regressione si commette un errore di previsione: Metodo dei Minimi Quadrati

Metodo dei minimi quadrati

per la stima della retta

L’obiettivo è trovare la miglior approssimazione lineare della relazione tra Y e X , …, X . Significa,

1 p

nell’ambito bivariato, trovare la rappresentazione funzionale migliore per rappresentare adeguatamente la

relazione tra i due fenomeni (trovare le stime dei parametri beta che identificano la “migliore” retta di

regressione).

Ho bisogno di un metodo che mi permetta di stimare i coefficienti: METODO DEI MINIMI QUADRATI (lo

stimatore LS è la soluzione al problema) 2

n  

   

 

min y X min '

 

i i

i 1

Il metodo dei minimi quadrati produce uno stimatore LS aventi le seguenti caratteristiche:

 

ˆ 

  1

X ' X X ' Y

• è funzione di Y e X LS ˆ

 

E ( )<

Dettagli
Publisher
A.A. 2018-2019
99 pagine
2 download
SSD Scienze economiche e statistiche SECS-P/07 Economia aziendale

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher elisheba93 di informazioni apprese con la frequenza delle lezioni di Metodi quantitativi per economia, finanza e management e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università "Carlo Cattaneo" (LIUC) o del prof Saccardi Alberto.