Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
OTTAVA LEZIONE: Report mozzarella
Le slide seguenti mostrano una possibile traccia del report, ma altre tracce sono possibili:
- Si può scegliere l'oggetto di indagine e il livello di approfondimento che si vuole (ovviamente più approfondita è l'analisi meglio è).
- Nessuna limitazione (come in aula).
- Solo le marche con distribuzione nazionale.
- Solo le marche con livelli di preferenza paragonabili solo un'area (es. nord).
- Tutte le aree (per sé) ma sole le marche principali in ciascuna area.
- Solo le marche adatte a un target particolare = bisogna inventarselo. Ad esempio degli studenti con una particolare fascia d'età e con degli attributi, come spendere poco (quindi si prendono coloro che considerano troppo care le cose) e si selezionano quelli che alla variabili "sono troppo care" hanno dato una valutazione alta, oppure dato che mangeranno in università, si può pensare che preferiscano il secchiello al sacchetto.
Che dunque siano attenti al packaging. Possiamo fare un report su word, oppure un file in pdf o una presentazione in PowerPoint (più complicata).
- Obbiettivi e formula di ricerca.
- Campione.
- Consuma mozzarella, conosce Pettinicchio.
- Campione della popolazione italiana uniformemente distribuito per età (due classi: 21-45 e 46-64) e per area (nord, centro, sud). Qui si comincia a dire chi abbiamo intervistato (file:
- 5. Segmentazione.
- Segmentazione dei prodotti, sugli attributi di prodotto: Cluster analysis (k-means, attributi o fattori?) mapping dei cluster.
- Segmentazione delle marche, sul consumo. Cluster analysis gerarchica sul consumo (per intv).
- Segmentazione delle marche, sugli attributi di marca. Cluster analysis gerarchica (attributi o fattori? usare le medie).
- 6. Conclusioni.
- Selezione delle variabili.
- Calcolo della matrice di correlazione.
- Si parte da variabili standardizzate e la loro matrice di correlazione. L'idea di standardizzare è im
Dobbiamo definire i nostri obiettivi e la nostra formula di ricerca. Possiamo introdurre qualcosa sul brand, però non troppo. Quello che facciamo in aula è un’indagine con l’obiettivo di analizzare la concorrenza e la segmentazione. La formula di ricerca varia, però quella che facciamo noi in classe è una survey e poi si devono dispiegare le tecniche. Questo serve per dire “cosa vogliamo fare”.
Che dati vado a prendere dal punto di vista del campione? Quali sono i criteri di campionamento? Per la nostra ricerca:
mozzarella per intervistato). Questa affermazione non va a definire che non è rappresentativo: poiché nella realtà la popolazione italiana53 giovedì 19 gennaio 2023 non è uniformemente distribuito (nord - 46%; centro 20%; sud 34%). Mentre per l’età, invece, è rappresentativo: l’età si divide anche nella realtà uniformemente. Perché si cerca di uniformare l’area? Poiché si vuole poter andare nel dettaglio di ogni area. Dato che nella realtà nel centro ci sono pochi casi, si cerca di spalmare i casi in maniera uniformata per rappresentare ogni area.
- Numero intervistati. Per verificare l’uniformità della suddivisione: andiamo sul file mozz.int e selezioniamo area3 - età e facciamo la distribuzione. Per comprendere se l’età e le aree sono dipendenti tra di loro, dobbiamo fare il test chi-quadrato, poiché abbiamo due variabili categoriche. Affinché
il nostro test sia interessante, in questo caso, le due variabili devono essere indipendenti (P-VALUE > 0.05). In questo caso è 0.6, quindi accettiamo l'ipotesi nulla. Come si organizzano le interviste? - Ogni intervistato dichiara le marche consumate negli ultimi tre mesi. - preferenza attributi Ogni intervistato valuta e delle marche consumate. Con questo meccanismo si arriva ad avere 1688. Ai fini delle analisi per marca e prodotto: Numero marche valutate ("citazioni", quante per intv in media?). • Tutte le citazioni sono considerate indipendenti. • Andando a prendere 3.6 citazioni per intervistato (1688, citazioni : 454, intervistati) • ci permette di andare a creare un buon lavoro con poche risorse. Andare ariprendere 1688 intervisti, sarebbe molto costoso con tempi lunghissimi. 3. Dati. L'obiettivo qui è far sapere che informazioni abbiamo a disposizione. - A livello di marca e prodotto (citazioni). Attenzione alla differenza tra consumo ecitazione: quelle dichiarate per intv sonotutte le marche consumate le citazioni sono le marche più consumate (max 6).Lo scopo dell'area dei dati è un primo luogo di far sapere, al nostro lettore, sono i dati che abbiamo a disposizione. Nel fare ciò, già che ci siamo, gli diamo i primi risultati -> per farlo seguiamo un indicazione strategica su come organizzare il lavoro di analisi.
Nel momento in cui comincio l'analisi, genero un file excel dove si inseriscono i risultati, man mano che li trovo. Copiare questo in excel momento dell'analisi dal momento della stesura report -> si trasporta ciò che serve in excel. Quando si trovano cose sensate, si lavorerà principalmente sui risultati trovati strada facendo.
Trasportare tutti i dati in excel, comporta anche realizzare un po' di editing. Abbiamo quindi spostato la distribuzione su excel, creando di
conseguenza ungranfio con —> inserisci —> grafico a barre orizzontale (permette di avere lecitazioni più lunghe). NON FAR VEDERE I GRAFICI SIA IN FORMA TABELLARE SIAIN GRAFICO.
Guardando il grafico notiamo che la situazione di Pettinicchio: le sue citazioni sono esattamente 454 (come gli intervistati). Di conseguenza capiamo che coloro che non conoscevano Pettinicchio sono stati scartati (è sovracampionato —> tutti quelli che sono stati interrogati conoscevano Pettinicchio). Le altre marche, invece, sono rappresentate secondo la awareness reale (conoscenza) dei consumatori verso la marca.
Num citazioni per marca e per area.
•Andiamo poi a vedere se le marche sono uniformemente distribuite per area: portiamo, quindi, la distribuzione delle marche nelle aree. Dopo averla trovata, togliamo tutte le percentuali e inseriamo tutto in una tabella di dati cliccando sul triangolo dell’analisi di contingenza. Questa tabella può essere trasferita.
Grafico di sinistra = vediamo le citazioni.- Se il numero di citazioni diventa 100%, chi ha più o meno citazioni scompare (perché sono tutti 100%) e diventa come si distribuisce l'area per marca.Nel report ci dovrà essere uno dei due grafici qui presenti: scegliamo quello di destra poiché l'informazione presente nel grafico di sinistra l'avevamo già.55 giovedì 19 gennaio 2023Preferenza (e differenze per marca).•Il modo per trovare le preferenze è vedere le distribuzioni —> vediamo che è spostata verso l'alto però non verso l'altissimo. Facciamo diventare la preferenza ordinale e poi si rifà l'analisiAttributi della marca.• Attributi del prodotto.•- A livello di intervistato.Consumo marche•4. Analisi della concorrenza.- Analisi sugli attributi di marca o di prodotto.Riduzione dimensioni.• Differenze tra marche.• Preference analysis (totale e per)Marca) quadrant analysis.
La sintesi dei risultati principali è obbligatoria: se le conclusioni sono interessanti o particolari, una persona poi può andare a leggere il report. Possiamo anche creare dei suggerimenti operativi o strategici per la marca che stia analizzando. Inoltre, possono essere realizzate anche possibili estensioni o approfondimenti.
"Come" scrivere.
All'inizio di ogni passo bisogna precisare lo scopo dell'analisi: perché si fa una certa cosa in un certo momento, di modo che sia chiaro il contesto.
56 giovedì 19 gennaio 2023
LEZIONE
Riduzioni della dimensionalità.
Il problema nasce dalla grande disponibilità dei dati - quando i dati diventano tanti, questo impone di sintetizzarli. Tuttavia, parlare di grande massa di dati è troppo generico. Bisogna pensare a come aumentano i dati.
Numerosità:
1. Se aumenta la numerosità non è un problema, è legata alle righe (problemi tecnici).
Dimensionalità:
2. Se ad aumentare sono il numero delle colonne/delle variabili, questo fa aumentare la dimensionalità del problema. Se aumentano le righe ci vuole tantissimo a leggere. Se aumento le colonne il tempo di elaborazione può aumentare. In questo caso gli algoritmi possono, anche, non funzionare più. In questo caso aumenta la complessità, dovuta alla ridondanza informativa.
Si pone il problema di ridurre il numero delle colonne.
Questo processo ha due scopi:
Tecnico:
1. Ridurre il numero delle variabili (da 40 a 10) - si parte dai
1. Dati originali e genero delle nuove variabili (in numero minore), che si possono affiancare a quelle originali (devono riassumere al meglio l'informazione delle variabili originali, che diventano parte del dataset e consentono di lavorare su queste nuove variabili).
2. Individuando delle ridondanze a livello dei dati, delle sovrapposizioni di significato, si riesce a riconoscere quali sono gli elementi principali, rappresentati però da più variabili, e quali sono quelli fondamentali. Individuare strutture nelle relazioni tra le variabili.
Le variabili di partenza possono essere riassunte in due sole variabili, delle quali una rappresenta l'età, gli anni, reddito (quindi riassumibili con età e anzianità), la seconda nuova variabile, invece, mette insieme tutti i concetti che fanno capo all'indebitamento. Questo vuol dire che tra le prime quattro e, separatamente, tra le ultime tre ci sono dei collegamenti che possono essere riassunti.
57
giovedì 19 gennaio 2023Analisi fattoriale e PCA. analisi fattoriale
La famiglia di tecniche va sotto il nome di analisi fattoriale e ci sono anche le PCA (analisi componente principale). Noi considereremo sostanzialmente l'analisi delle componenti principali come un sottoinsieme dell'analisi fattoriale.
L'analisi fattoriale si occupa di trovare strutture tra le variabili. Le due anime di queste analisi (riduzione delle variabili e relazione tra le strutture) identificano anche i Pearson e Spearman.
Metodo (delle componenti principali).