Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Y|X
passando da:
I. Nessuna informazione
II. Si conosce anche la modalità della variabile X (indipendente).
−
Probabilità di errore nel caso I. Probabilità di errore nel caso II.
λ =
Y|X Probabilità di errore nel caso I.
r
∑ n − n
i(ma x) .ma x
i=1
λ =
Y|X n − n
.ma x
n = max(n , n , . . . , n ) = max
(n ) → massimo di tutte le frequenze assolute
i(ma x) i1 i2 ic ij
j
condizionatamente alla i-esima riga.
n = max(n , n , . . . , n ) = max (n ) → massimo delle frequenze marginali di
.ma x .1 .2 .c .j
j
colonna.
j = 1,2,…, c.
c = colonne della tabella Esempio - dati: cb_lambda
Analizza > Statistiche descrittive > Tabelle di contingenza > Righe: Professione > Colonne:
Acquisto 17 Giada Pedroni
Sapere la professione svolta dai consumatori aiuta a prevedere la loro scelta
sull’acquisto di un nuovo magazine?
Senza conoscere la professione dei consumatori, si potrebbe concludere che i
consumatori osservati sono acquirenti di una nuova testata giornalistica azzeccando la
previsione nel:
243 = 0.566 → 56,6% dei casi
429
e commettendo un errore nel:
186 = 0.433 → 43,3% dei casi.
429
Conoscendo la professione di ciascun consumatore, è possibile migliorare la previsione
circa la loro scelta sull’acquisto del magazine?
n :
i(max)
n = 16
1(max)
n = 40
2(max)
n = 49
3(max)
n = 49
4(max)
n = 18
5(max)
n = 98
6(max)
n = 243
.(max) (16 + 40 + 49 + 49 + 18 + 98) − 243
λ = = 0.145 -> La conoscenza della professione
Y|X 429 − 243
riduce l’errore della previsione sull’acquisto della nuova testata giornalistica del 14,5%.
LEZIONE 7
N.B: l’outcome non deve essere necessariamente dicotomico, possono esserci anche
molteplici variabili.
Nell’esame l’outcome non è sempre in riga, può essere anche in colonna e viceversa.
Esempio - dati: cb_lambda
Calcolare Lambda su SPSS:
Analizza > Statistiche descrittive > Tabelle di contingenza > Righe: Professione > Colonne:
Acquisto > Statistiche > Lambda 18 Giada Pedroni
Lambda = 14,5% (Valore > Acquisto dipendente)
Esercizio da svolgere: n_i(max):
n_1(max) = 3
n_2(max = 8
n_3(max) = 10
n_4(max) = 16
n_5(max) = 11
n.(max) = 43
(3 + 8 + 10 + 16 + 11) − 43
λ = = 0,135 = 13,5 % -> L’informazione aggiuntiva
Y|X 80 − 43
riduce l’errore di previsione del 13,5%.
MARKET BASKET ANALYSIS
La Market Basket Analysis nasce all’interno della GDO.
L’obiettivo è quello di evidenziare gruppi di prodotti che tendono a presentarsi insieme
in una transazione. Si fa riferimento ad un insieme di consumatori, ad esempio quelli
con la carta fedeltà di un particolare supermercato; è interessante studiare la
composizione dei “carrelli della spesa”, cioè la composizione dei beni che vengono
acquistati simultaneamente in una visita del consumatore.
Risulta interessante per l’azienda capire anche quali sono i prodotti che non compaiono
mai (o raramente) nel medesimo carrello.
N.B: la Market Basket Analysis si effettua sempre e solo su tabelle di contingenza a
doppia entrata 2x2. Alcune applicazioni della MBA
- Riorganizzazione del lay-out del supermercato: i prodotti venduti spesso insieme
dovrebbero essere posizionati nella stessa zona;
- Aumento dell’efficacia delle promozioni: prodotti fortemente associati non
dovrebbero essere in promozione insieme, in quanto la promozione su uno di essi
incrementa anche le vendite dell’altro;
- Brand research tra prodotti associati (es. latte e biscotti) oppure nel riacquisto del
medesimo prodotto: valutare se vi è fedeltà alla marca;
- Web mining: relazioni tra le pagine visitate di un sito di e-commerce.
Informazioni ricavabili da un pagamento
Per ciascuna transazione presso un punto vendita si conoscono:
- Elenco dei prodotti acquistati e relativa numerosità;
- Prezzo di vendita;
- Identificativo del cliente se si è in possesso di una carta fedeltà o il pagamento è
effettuato mediante carta di credito;
- Importo complessivo della transazione;
- Modalità di pagamento. 19 Giada Pedroni
Paniere dei prodotti acquistati
Il modo per organizzare una tabella in modo che sia più facile da codificare è utilizzare le
variabili dummy. Si tratta di variabili dicotomiche che assumono valori 0 ed 1 (0 quando
la variabile non è presente, 1 quando lo è - Sì/No).
Si misurano i prodotti con scala di tipo nominale.
Regole di associazione
Una regola associativa descrive un’implicazione logica tra due proposizioni (es. eventi,
attributi, ecc.).
Ad esempio, consideriamo l’acquisto del prodotto A e l’acquisto del prodotto B. Si può
definire una regola associativa che pone in relazione i due eventi.
{A} ⇒ {B}
In generale, si indica con la regola associativa “se si acquista A, allora si
acquista B”.
La regola di associazione pone in relazione due proposizioni:
- Proposizione antecedente: “se si acquista A”;
- Proposizione conseguente: “allora si acquista B”.
20 Giada Pedroni
Per misurare la relazione che lega l’acquisto del prodotto A e quello del prodotto B, può
essere conveniente costruire una tabella 2x2 con le frequenze congiunte delle
transazioni rispetto all’acquisto dei due prodotti.
Indicatori
{A} ⇒ {B}
Supporto di n
11
S({A} ⇒ {B}) = n
{A} ⇒ {B}
Il supporto di indica la proporzione di transazioni nelle quali compaiono
simultaneamente i prodotti A e B rispetto al totale delle transazioni avvenute nel punto
vendita.
Si scelgono le relazioni con i supporti più elevati oppure si stabilisce una soglia sopra la
quale vengono mantenute determinate relazioni.
{B} ⇒ {A}
N.B: Supporto di n
11
S({B} ⇒ {A}) = (simmetrico)
n
{A} ⇒ {B}
Predicibilità di n
11
P({A} ⇒ {B}) = n
1.
{A} ⇒ {B}
La predicibilità di indica la proporzione di transazioni che includono
contemporaneamente i prodotti A e B rispetto al numero di transazioni che includono il
prodotto A.
{A} ⇒ {B}
Lift di n /n n
11 1. 11
L({A} ⇒ {B}) = = ̂
n /n n
.1 11
̂
n
dove è la frequenza teorica dell’acquisto congiunto di A e B ipotizzando che
11
l’acquisto di A e l’acquisto di B siano eventi indipendenti.
{A} ⇒ {B}
Il lift di è il rapporto tra la predicibilità osservata e la predicibilità attesa nel
caso in cui l’acquisto di B sia indipendente da quello di A.
L({A} ⇒ {B}) > 1
- Se , esiste un’associazione positiva tra l’acquisto di A e l’acquisto
di B;
0 < L({A} ⇒ {B}) < 1
- Se , esiste un’associazione negativa tra l’acquisto di A e
l’acquisto di B. Esempio - dati: MB.sav
Le variabili sono tutte nominali.
Vista Variabile > Valori > + > Valore: 0 - Etichetta: No > Valore: 1 - Etichetta: Sì
Analizza > Statistiche descrittive > Tabelle di contingenza > Righe: A > Colonne: tutti gli altri
prodotti. 21 Giada Pedroni
LEZIONE 8 (Excel - Tabelle_MB)
Interpretazione
{B} ⇒ {A}
- Supporto di = 0,25. L’acquisto simultaneo dei due prodotti è presente nel
25% delle transazioni analizzate;
{B} ⇒ {A}
- Predicibilità di = 0,60. La probabilità che uno scontrino comprenda il
prodotto A se in esso è già presente il prodotto B è pari al 60%;
{B} ⇒ {C}
- Lift di = 1,44. L’associazione tra i due prodotti è positiva: la probabilità
che uno scontrino presenti il prodotto C quando è già presente il prodotto B è una
volta e mezza rispetto alla medesima probabilità che i due prodotti siano presenti
casualmente. Classificazione delle regole di associazione
Le regole di associazione più rilevanti sono quelle che presentano un elevato supporto
ed un’elevata predicibilità.
Un supporto elevato assicura che la frazione di transazioni coinvolte nella regola
associativa sia considerevole, quindi che le conseguenti azioni di marketing siano
rivolte ad un numero non esiguo di consumatori.
Una predicibilità elevata permette di selezionare dei gruppi di consumatori con un
comportamento di acquisto prevedibile, a cui indirizzare azioni di marketing mirate.
Si fissano delle soglie minime per individuare la regole associative più interessanti. Tali
soglie variano in base al contesto in cui la Market Basket Analysis è applicata (grande
distribuzione, e-commerce, ecc.).
Le regole associative evidenziate dall’analisi possono essere:
- Banali: facili da immaginare;
- Non banali: individuabili solo con l’esplorazione dei dati delle vendite. Una regola
associativa non banale può derivare da:
Attività esogene:
• Cambiamenti nelle preferenze dei consumatori;
Azioni della concorrenza.
Attività endogene:
• Promozioni che hanno modificato il comportamento d’acquisto dei
consumatori;
Introduzione di nuovi prodotti che determina la cannibalizzazione di altri
prodotti.
Selezione delle regole di associazione
Le regole di associazione da valutare sono numerose nel caso in cui i prodotti
acquistabili presso il punto vendita sono molti.
È necessario selezionare le regole associative più importanti e ciò avviene attraverso
due stadi:
1. Si selezionano le regole associative con un supporto che eguaglia o supera una
soglia minima, detta supporto minimo, fissata a priori;
2. Tra le regole associative selezionare al 1° stadio, si scelgono quelle con una
predicibilità che eguaglia o supera una soglia minima, detta predicibilità minima,
stabilita a priori. 22 Giada Pedroni
1º stadio: Il supporto di una regola
associativa è una misura
simmetrica, in quanto non
dipende dalla direzione
dell’implicazione logica.
Es.
S({A} ⇒ {B}) = S({B} ⇒ {A}) .
Per una coppia di prodotti è
possibile calcolare il supporto
senza stabilire la direzione della
regola.
2º stadio:
Una volta che le regole associative forti sono state estratte, è conveniente calcolare il lift
per verificare se la predicibilità osservata è maggiore di quella attesa, nell’ipotesi che
l’acquisto conseguente non sia influenzato da quello antecedente.
Le associazioni vengono rappresentate attraverso il Diagramma di associazione, il quale
prevede la rappr