Anteprima
Vedrai una selezione di 17 pagine su 79
Analisi Quantitative di Mercato - Prof. Liberati Pag. 1 Analisi Quantitative di Mercato - Prof. Liberati Pag. 2
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 6
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 11
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 16
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 21
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 26
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 31
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 36
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 41
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 46
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 51
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 56
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 61
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 66
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 71
Anteprima di 17 pagg. su 79.
Scarica il documento per vederlo tutto.
Analisi Quantitative di Mercato - Prof. Liberati Pag. 76
1 su 79
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Segmentazione e classificazione dei soggetti

Quando la mia classificazione divide i soggetti in gruppi non banali che quindi non posso separare facilmente come maschi e femmine, se i gruppi sono identificati in maniera più complicata, se dobbiamo classificare altri soggetti utilizzeremo la classificazione a priori che ci dona una regola che ci dia la possibilità di poter classificare nuovi individui.

I modelli di cui ci siamo occupati fino ad adesso è un modello di segmentazione a posteriori o meglio un modello di segmentazione non supervisionato e quindi non ha una variabile target di riferimento. Noi prendiamo le variabili che osserviamo sul nostro campione che possano descrivere il comportamento o variabili psicografiche, quindi a partire da tali variabili, andremo a classificare i nostri soggetti.

La segmentazione cluster, segue questo filone. A partire dalle variabili che osserviamo dobbiamo trovare le somiglianze o dissomiglianze tra i vari soggetti in modo tale da poterli classificare. La somiglianza viene

stabilita a partire da una situazione dove si hanno n soggetti che osserviamo che sono n gruppi, raggruppiamo insieme i soggetti che si somigliano, andando a generare attraverso un algoritmo iterativo via via dei raggruppamenti di unità, sempre più grandi finché tutti i gruppi convergono in un unico grande gruppo che è la nostra popolazione. La somiglianza viene stabilita attraverso una matrice della distanza, dopodiché possiamo utilizzare regole differenti per riorganizzare i dati e poter identificare i nuovi gruppi. Le regole:
  • Metodo legame singolo
  • Metodo legame completo
  • Metodo legame medio
Legame singolo e completo sono dei metodi per poter ricostituire le distanze ogni volta che andiamo ad aggregare dei soggetti nello step di aggregazione che costituisce lo step intermedio tra una aggregazione e la successiva. Ogni volta che l'algoritmo va in funzione ad ogni step, cerca di aggregare i soggetti più simili, quelli con la distanza.

più piccola. 0 vuol dire che il soggetto è sempre uguale a se stesso e lo0 si può avere anche fuori dalla diagonale quando due soggetti hanno lo stesso valoreper le variabili calcolate. Mi serve quindi una regola per stabilire la distanza tra ilgruppo che ho costruito rispetto al nuovo cluster che sono andato a costruire,esattamente con il metodo del legame singolo e completo.

Possiamo ora edere l'ultimo legame e cioè quello medio, il metodo del legame singolosostituisce la distanza più piccola tra le unità che lo costituiscono, il legame completosostituisce la distanza più grande, in questo caso si sostituirà la distanza media.

Stiamo osservando un campione di reti televisive, dove abbiamo calcolato una matrice6x6, la cluster analysis mi serv3 per capire quli reti si somigliano maggiormente. Divolta in volta noi andiamo a cercare i soggetti che maggiormente si assomigliano. Nelcaso del legame medio ci adoperiamo partendo

orizzontale = distanza tra i cluster <p>dalla matrice iniziale, mettiamoinsieme quei soggetti che naturalmente presentano distanza più piccola quindi inquesto caso rai1 e rai2.</p> <p>Nel momento stesso in cui passiamo allo step 2 andiamo a riformulare la nostramatrice che è diventata 5x5, dobbiamo scegliere una regola che descriva come ilnuovo cluster disti dagli altri gruppi. In questo caso alla distanza del nuovo cluster darai 3 devo sostituire la media aritmetica e si ottiene 10764 che si mette nella cellacorrispondente a rai 3. Faremo la medesima cosa con gli altri gruppi. La distanza chedobbiamo calcolare è sempre una distanza ponderata per il numero di osservazioniall'interno del cluster, quindi dobbiamo ponderare bene. Per il resto non cambia moltorispetto a quello che abbiamo già visto.</p> <p>Dendrogramma</p> <p>Rappresentazione grafica della sequenza delle fusioni che consente di comprendere ilnumero esatto di gruppi da formare</p> <p>Asse orizzontale = unità coinvolte nel processo di fusione</p>

verticale = distanza a cui avviene la fusione dei vari gruppi

Attraverso l'osservazione di questi dendogrammi possiamo andare a raccontare come avviene l'aggregazione delle unità all'interno dei nuovi cluster. È anche il grafico che prendiamo in considerazione per capire quando stoppare il processo di aggregazione detto anche 'taglio del dendogramma' ed è come se dicessimo all'algoritmo di fermarsi e di creare dei gruppi che poi andiamo ad indicare. Come si fa a scegliere il numero di gruppi ottimale?

L'analisi del dendrogramma: o andiamo a considerare il salto di distanza che avviene tra un'aggregazione e la successiva e quando questo salto diventa più alto ci indicano che sarebbe il caso di fermare il processo di aggregazione. Questi dendrogrammi non sono in realtà (singolo e completo) non sono grafici dove si ha una vera e propria costituzione di gruppi, quindi non sono troppo belli. Nei primi due casi

quindi si trova un primo gruppo e poi via via si vanno a creare gli altri ---> ciò significa che non abbiamo trovato la segmentazione, quindi non sarà efficiente. Un po' meglio accade nel metodo del legame medio dove si cerca di trovare una differenza tra gruppi ma non abbiamo una forte aggregazione. Andremo ad utilizzare spss e prenderemo in considerazione solo le prime 10 osservazioni del dataset. Nel campo etichetta vengono descritte tutte le variabili rappresentate e vi sono riportate le spese.

Menù dati -> seleziona casi -> click basato su intervallo di tempo o casi 1-10

Analizza -> click cluster gerarchico e inseriamo primi tre soggetti -> click su statistiche e vogliamo osservare la matrice di prossimità (click) -> grafici flagghiamo dendrogramma -> metodo click metodo legame singolo con distanza euclidea.

La cosa che è estremamente importante è che su questi 10 soggetti noi possiamo applicare i metodi che abbiamo osservato prima.

con l'aiuto che avremo già segnalatele distanze maggiori e minori. Nel caso in cui una di queste distanze fosse oscurata ofosse cancellata e io volessi ricalcolarmela avendo a disposizione i dati precedenti:vado nei dati iniziali e ricostruisco la matrice delle distanze e trovo esattamente lostesso valore.Una volta che ho a mia disposizione tutte le distanze posso ad esempio applicare ilmetodo del legame singolo e ad esempio calcolarmi la riga corrispondente alla matriceanche in questo caso è la matrice 9x9.Stoppiamo l'aggregazione quando il salto è talmente grande che il dendogramma cidice che i due gruppi non sono da aggregare. Se io tagliassi a metà orizzontalmentequindi il dendogramma questo vuol dire che il gruppo incontra la retta in due punti equindi 2 cluster.Per parlare di metodi che ci aiutano ad individuare una partizione è necessario fare unpasso indietro e parlare di PARTIZIONE BEN STRUTTURATA MINIMALE. Se i dati

Se fossero così disposti noi sapremmo che i gruppi sono 3 (guarda immagine). Qual è il massimo grado di oggettività che si può conseguire nella formazione dei gruppi di unità partendo dalla matrice delle distanze? Un criterio potrebbe essere stabilire che la massima distanza all'interno dei gruppi sia minore della minima distanza tra i gruppi. Si può parlare di classificazione oggettiva o naturale. L'individuazione della partizione ben strutturata minimale si basa sulle distanze minime e massime tra i clusters.

Definizione: consideriamo una partizione P=(C1,C2…Cg) di n individui x, per i quali abbiamo calcolato una distanza dagli altri individui. La partizione si dice ben strutturata se MAX(dij) > MIN(drs) ogni coppia xi e xj appartenenti allo stesso cluster per ogni coppia xr e xs appartenenti a cluster differenti.

Definizione: la partizione si dice ben strutturata minimale la partizione ben strutturata con il minimo numero di gruppi.

Castagnoli (1978) ha dimostrato che per ogni matrice delle distanze esiste una e una sola partizione ben strutturata minimale. Come individuare la partizione ben strutturata utilizzando le tabelle del piano di agglomerazione delle unità? Il legame singolo, il legame medio e il legame completo, ad un certo punto del piano di agglomerazione, individuano la partizione ben strutturata minimale.

Caratteristiche dei gruppi individuati:

Metodo del legame singolo

  • Soddisfatto il criterio della partizione ben strutturata minimale, identificazione minima dei cluster.
  • Effetto a catena: riunire in un gruppo unico unità anche distanti (a), quindi se vi sono unità anche molto distanti, vi sono delle unità che a catena legano i due gruppi e fa sì che l'algoritmo legga il tutto come un unico gruppo.
  • Forme dei gruppi naturali: presentano generalmente delle forme allungate.

Metodo del legame completo

  • Soddisfa il criterio della partizione ben strutturata minimale.

Individua gruppi compatti di forma sferica

Il metodo che in realtà massimamente riesce a rispondere al criterio di partizione ben strutturata e minimale è il metodo di Ward.

Si basa sulla scomposizione della devianza totale in devianza tra i gruppi e devianza entro i gruppi. Tale metodo si propone di massimizzare la devianza tra i gruppi, minimizzando la devianza entro i gruppi. Da luogo pertanto, a gruppi omogenei, al proprio interno, caratterizzati da una bassa variabilità (varianza).

Lezione 15

Dire che la distanza tra coppie di soggetti che appartengono allo stesso cluster, la loro distanza è molto piccola, quindi la massimo distanza che rilevo tra soggetti appartenenti allo stesso cluster, è più piccola della minima distanza che vado a rilevare tra istanze che appartengono a gruppi distinti.

Questo è un modo per dire che effettivamente la partizione che ho trovato identifica gruppi omogenei al loro interno, ed eterogenei tra loro sulla base

Proprio delladistanza, perché diventa la nostra metrica, il modo per capire se due soggetti sisomigliano oppure no.

Per identificare la partizione ben strutturata MINIMALE, non esiste un momentospecifico ma dovremo studiarci la tabella, dove quanto è più abbiamo un campione diunità tanto più rilevanti, diventa una tabella lunga e onerosa da guardare e diconseguenza diventa difficile identificare in maniera oggettiva questa partizionestrutturata minimale.

Sappiamo che la classificazione che andiamo ad identificare coni legami, è una classificazione che comunque gode di alcune proprietà.

Riprendiamo quindi il metodo di WardNon fa altro che massimizzare la devianza tra gruppi o minimizzare la devianza entro igruppi.

Criteri di valutazione della partizioniViene utilizzato un indice che ci aiuta: R quadro. Ci aiuta a scegliere tra partizionicompetitive che abbiamo costruito e possono essere plausibili come un problema disegmentazione, nel caso

on un testo da formattare utilizzando tag html.
Dettagli
Publisher
A.A. 2020-2021
79 pagine
2 download
SSD Scienze economiche e statistiche SECS-S/03 Statistica economica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Monsieurcono di informazioni apprese con la frequenza delle lezioni di Analisi di mercato e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Liberati Caterina.