Estratto del documento

Metodi quantitativi

Indice

  • Ricerche di mercato
  • Campionamento:
    • Metodi probabilistici
    • Metodi non probabilistici
  • Dimensione del campione aspetti d’influenza
  • Tipologia di dati:
    • Quantitativi
    • Qualitativi
  • Univariata:
    • Distribuzione di frequenza
    • Misure di sintesi
  • Bivariata:
    • Tavole di contingenza test chi-quadrato
    • Correlazione lineare test t
    • Confronto fra le medie test f
  • Multivariata:
    • Analisi fattoriare metodo delle componenti principali:
      • Proprietà
      • Metodo di valutazione
      • Interpretazione
    • Regressione lineare:
      • Obiettivi
      • Equazione errore metodo minimi quadrati
      • Indicatori di bontà
      • Multicollinearità
      • Selezione regressori
      • Analisi d’influenza
    • Regressione logistica

File generato da Irene Tumminelli – Varie Fonti

Introduzione

La business intelligence è l'insieme delle competenze, conoscenze, tecnologie, applicazioni, qualità, rischi, problemi di sicurezza e pratiche che si usano per acquisire al meglio le informazioni sul comportamento di mercato e sul contesto commerciale. Essa perciò si impegna nella collezione, integrazione, interpretazione, analisi e presentazione di informazioni del business fornendo così visioni storiche, presenti e future delle operazioni ad esso relative. Essa utilizza dati interni e dati esterni all’impresa. I primi sono numerosissimi e fanno riferimento al Data Warehousing, al Data Mining e customer profiling; i secondi comprendono i database pubblici e privati e le ricerche di mercato. Per questi motivi, la BI si può definire come un sistema di supporto decisionale.

Le ricerche di mercato

Le ricerche di mercato possono essere qualitative e quantitative. Le ricerche qualitative hanno l’obiettivo di approfondire la conoscenza di un fenomeno di mercato attraverso l’esecuzione di interviste individuali approfondite e l’analisi di dati qualitativi destrutturati. Le ricerche quantitative hanno l’obiettivo di fornire un’accurata misurazione del fenomeno oggetto di ricerca, mediante la compilazione di questionari e l’analisi di dati quantitativi e/o qualitativi strutturati.

5 fasi dell'esecuzione di una ricerca di mercato

  1. Set-up: Disegno e impostazione della Survey; nello specifico possiamo descriverlo come l'insieme di decisioni di partenza, vale a dire la definizione degli obiettivi di ricerca, descrizione del contesto di mercato, definizione del target su cui veicolare la ricerca e la definizione della modalità (canale) con cui eseguire le interviste.
  2. Fieldwork: Consiste nella raccolta di dati elementari. Nell’ambito del fieldwork possiamo distinguere tra sondaggio e questionario:
    • Il sondaggio è assimilabile a un’intervista individuale veicolata su un campione di una popolazione target di riferimento. L’intervista ha forma strutturata, ci sono poche domande aperte e molte domande chiuse e presenta diverse modalità di contatto. Esso è diretto se l’intervistato conosce il vero scopo del sondaggio, in caso contrario è indiretto. Il sondaggio è il più importante metodo di indagini quantitative nelle ricerche.
    • Il questionario è invece il format con cui si raccolgono dati qualitativi strutturati e/o dati quantitativi e viene costruito attraverso: il disegno del suo schema concettuale, la redazione e la verifica. Le domande devono essere uguali per tutti gli intervistati, e non devono lasciare spazio ad interpretazioni soggettive. Le informazioni contenute riguardano dati personali, culturali, sociali, comportamentali, scale di soddisfazione. Le domande qualitative devono avere un range definito di risposte e non devono essere aperte, quelle quantitative devono essere almeno 30-40 e non ambigue.
  3. Data Audit: La certificazione dei dati elementari;
  4. Data Analysis: Analisi dei dati;
  5. Business Presentation: Presentazione dei risultati.

Il campionamento

Il fine di un’indagine campionaria è generalizzare i risultati ottenuti sul campione all’intera popolazione di riferimento. Il problema di tale approccio consiste nell’approssimazione con cui è possibile descrivere la popolazione attraverso il campione. Oggetto di studio di un’indagine campionaria è una popolazione finita Ω=(1,2…N) le cui unità presentano tutte un medesimo carattere U. Si definisce campione di dimensione n della popolazione Ω un suo qualsiasi sottoinsieme c contenente n unità. Per ottenere tale campione si possono estrarre dalla popolazione n unità secondo due modalità principali:

  • Estrazione con ripetizione: ogni volta viene reintrodotta l’unità già estratta dalla popolazione;
  • Estrazione senza ripetizione: tutte le unità già selezionate non possono più essere estratte.

Metodi di campionamento

I metodi di campionamento si dividono in probabilistici e non probabilistici. Nei metodi di campionamento probabilistici ogni unità della popolazione ha una probabilità nota e diversa da zero di essere selezionata e quindi entrare nel campione. Essi richiedono un piano di campionamento, cioè un insieme di regole note a priori per formare il campione. Nei metodi di campionamento non probabilistici invece la selezione delle unità avviene in base a criteri soggettivi, e la probabilità di selezione non è nota a priori.

Metodi di campionamento probabilistici

  • Campionamento casuale semplice: A ogni estrazione un elemento della popolazione ha la stessa probabilità di essere selezionato, secondo un meccanismo che garantisce la casualità delle estrazioni. La probabilità di estrazione è 1/N se il campionamento è con ripetizione e 1/N * (N-1) * (N-2)*… (N-i+1) se il campionamento è senza ripetizione;
  • Campionamento stratificato: Si suddivide la popolazione in strati, sulla base di informazioni suppletive, al cui interno le unità sono omogenee secondo un criterio. Da ogni strato viene estratto, in modo indipendente, un campione casuale;
  • Campionamento a grappoli: Le unità elementari della popolazione sono raggruppate in sottoinsiemi di unità contigue di osservazione, dette grappoli. Data una popolazione viene estratto un certo numero di grappoli, e tutti gli elementi appartenenti ai gruppi selezionati entrano a far parte del campione. Di solito come grappoli vengono utilizzati dei gruppi naturali o amministrativi già esistenti, per contenere i costi;
  • Campionamento a due o più stadi: Data una popolazione le cui unità elementari sono divise in gruppi, dapprima si seleziona un campione casuale di gruppi e poi si estrae un certo numero di unità elementari dai gruppi selezionati. Vi sono allora due livelli di campionamento: al primo vengono scelti i gruppi, o unità di primo stadio; al secondo vengono scelte le unità elementari o secondarie;
  • Campionamento sistematico: È necessario che le unità siano ordinate secondo un criterio qualsiasi, solo la prima unità verrà estratta in maniera casuale dalla popolazione, le altre verranno selezionate in modo automatico secondo un criterio prefissato (ad esempio una ogni tre).

Metodi di campionamento non probabilistici

  • Campionamento per quote: La popolazione viene suddivisa in gruppi omogenei in base ad alcune variabili strutturali (sesso, residenza, età). Si individua il numero di osservazioni da raccogliere in ogni gruppo (quote): gli intervistatori scelgono il campione all’interno delle classi, in modo da rispettare le proporzioni prescelte, e hanno totale arbitrarietà nella scelta delle unità da intervistare nelle quote assegnate;
  • Campionamento a scelta ragionata: Le unità campionarie sono selezionate solo in determinate aree d’analisi, in base ad informazioni preliminari sulla popolazione indagata, risulta adatto per campioni di piccole dimensioni;
  • Campionamento per convenienza: La selezione delle unità si basa su elementi di convenienza temporale, economica o di altro genere.

Dimensione del campione

Gli aspetti principali che influenzano la dimensione del campione sono:

  • Il costo e il tempo della raccolta dei dati elementari;
  • Il livello di accuratezza delle stime, e cioè:
    • La variabilità dei caratteri investigati nella popolazione target;
    • Gli errori di campionatura;
    • Il tipo di campionatura;
    • La scelta dell’estimatore.

Gli estimatori a varianza uguale a 0 danno la minor percentuale d’errore.

Tipologie di dati

I dati si distinguono in primo luogo in qualitativi e quantitativi.

Dati qualitativi sono di solito espressi in forma verbale e danno origine a classificazioni in categorie distinte (ad esempio le risposte fornite a domande relative alla professione). Se i dati qualitativi vengono classificati in varie categorie distinte senza alcun ordine implicito si ottiene un livello di misurazione nominale (ad esempio: da dove vieni? 5 risposte: nord, sud, est ecc.); se le categorie presentano un ordine implicito il livello di misurazione risulta ordinale (ad esempio la frequenza di visite, suddivise nelle classi bassa-medio-alta). La scala ordinale, pur consentendo di stabilire una relazione d’ordine tra le diverse categorie, non consente alcuna asserzione numerica (cioè si può dire quale categoria è più grande ma non di quanto).

Dati quantitativi sono invece legati a quantità intrinsecamente numeriche (ad esempio il livello di soddisfazione dei clienti). Tra i dati quantitativi abbiamo quelli discreti, caratterizzati da una quantità finita o infinita numerabile di classi di misura, e quelli continui, la cui risposta numerica deriva da un processo di misurazione che fornisce indicazioni puntuali all’interno di un continuum (ad esempio il livello di soddisfazione è discreto perché può assumere valori da 1 a 9, la distanza è un dato continuo perché può assumere qualsiasi valore all’interno di un continuum). I dati quantitativi possono prevedere una scala di rapporti o di intervalli: con la scala di rapporti si può dire di quanto una categoria è maggiore rispetto ad un’altra ed è fissato un valore “0” (scale di valutazione comparativa); le scale di intervalli presentano le medesime caratteristiche della precedente tranne lo “0”.

La tipologia di dati guida l’analisi.

La statistica descrittiva

La statistica descrittiva è l’insieme dei metodi che riguardano la rappresentazione e sintesi di un insieme di dati per evidenziarne le caratteristiche principali. La statistica inferenziale è l’insieme dei metodi che permettono la stima di una caratteristica della popolazione basandosi sull’analisi di un campione. Nella statistica descrittiva univariata ci sono due principali metodologie per rappresentare i dati analizzati: distribuzione di frequenza e misure di sintesi.

Le distribuzioni di frequenza

(Insieme delle modalità e delle loro frequenze). La premessa di una qualsiasi analisi statistica descrittiva è costituita da una procedura di classificazione. Tale procedura consiste nell’associare ogni osservazione ad una classe di misura. Se interessa un primo livello di sintesi dei dati, si deve associare a ciascuna categoria, o modalità il numero di volte in cui compare nei dati. Questo numero si chiama frequenza assoluta. L’insieme delle classi di misura e delle loro frequenze costituisce una distribuzione di frequenza o variabile statistica. Si definisce frequenza relativa (espressa in percentuale) della classe, il rapporto tra la frequenza assoluta e il numero complessivo delle osservazioni effettuate pi = ni/ N (Freq. Relativa = Freq. Assoluta / Tot. Osservazioni). Essa consente di effettuare confronti tra le diverse classi di una stessa variabile, o fra le stesse classi di variabili statistiche. I due tipi di frequenze vengono usati con dati qualitativi e quantitativi discreti. Nel caso di variabili qualitative le distribuzioni di frequenza possono essere riportate in forma tabellare, riportando accanto alla modalità la frequenza assoluta e relativa, oppure tramite grafici. Nei diagrammi a barre verticali, l’asse orizzontale riporta le categorie della variabile qualitativa, senza un ordine preciso e l’asse verticale le frequenze assolute/relative corrispondenti alle diverse modalità. Nel caso dei grafici a torta, la torta è divisa in tante fette quante sono le categorie della variabile qualitativa considerata, le cui ampiezze sono proporzionali alle frequenze corrispondenti alla categoria. Nel caso di variabili quantitative discrete, la distribuzione di frequenza può essere rappresentata anch’essa in forma tabellare oppure tramite grafici. Nel grafico del diagramma delle frequenze, l’asse orizzontale ha un significato quantitativo, segnalando i valori assunti dalla variabile discreta; l’altezza delle barre è proporzionale alle frequenze relative o assolute del valore stesso. Se le variabili statistiche sono continue per intervallo si rappresentano graficamente tramite istogrammi: sull’asse orizzontale si riportano le classi degli intervalli considerati e sopra ogni intervallo si costruisce un rettangolo la cui area corrisponde alla frequenza relativa della classe stessa. Le altezze dei rettangoli (corrispondente all’asse verticale) si ottengono dividendo l’area per l’ampiezza di tale intervallo e prendono il nome di densità di frequenza.

Le misure di sintesi

Le misure di sintesi si dividono in: misure di tendenza centrale (media aritmetica, mediana e moda), misure di tendenza non centrale (quantili e percentili), misure di dispersione o variabilità (campo di variazione, differenza interquartile, varianza, scarto quadratico medio e coefficiente di variazione) e misure di forma della distribuzione (indice di Skewness e indice di Kurtosis).

Misure di tendenza centrale (posizione)

La media è la misura di tendenza centrale più comune ed è uguale alla somma dei valori diviso il numero dei valori. Essa risulta influenzata da valori estremi (outlier). La mediana in una lista ordinata è il valore ‘centrale’ (50% sopra e 50% sotto) e quindi non risulta influenzata da valori estremi. La moda è il valore che occorre più frequentemente, non è influenzata da valori estremi ed è usata sia per dati numerici che per dati categorici. Può non esserci una moda e può esserci più di una moda.

Misure di tendenza non centrale (posizione)

I quartili dividono la sequenza ordinata di dati in quattro segmenti contenenti lo stesso numero di valori. Il primo quartile Q1 è il valore per il quale il 25% delle osservazioni sono minori e il 75% delle osservazioni sono maggiori di esso; Q2 coincide con la mediana in quanto il 50% delle osservazioni sono minori e il 50% maggiori; Q3 è quel quartile per cui il 75% delle osservazioni sono minori e solo il 25% delle osservazioni è maggiore. (Q3-Q1= differenza interquartile).

Misure di variabilità (o dispersione)

Le misure di variabilità forniscono informazioni sulla dispersione o variabilità dei valori. Il campo di variazione è la più semplice misura di variabilità ed è uguale alla differenza tra il massimo e il minimo dei valori osservati (Campo di variazione = Xmax – Xmin). Esso ignora il modo in cui i dati sono distribuiti, ed è sensibile agli outlier. La differenza interquartile serve per eliminare il problema degli outlier, in quanto elimina i valori osservati più alti e più bassi e calcola il campo di variazione del 50% centrale dei dati, essendo uguale a Q3-Q1. (Rappresentazione grafica: BOX PLOT solo per variabili quantitative di alcune misure di sintesi). La varianza è la media dei quadrati delle differenze fra ciascuna osservazione e la media, dove μ è la media della popolazione, N è la dimensione della popolazione e x è il valore della variabile X. Lo scarto quadratico medio misura la variabilità comunemente usata, mostra la variabilità rispetto alla media e ha la stessa misura dei dati originali. La formula è uguale a quella della varianza con la differenza che omega non è elevata al quadrato e la formula è sotto radice quadrata. Viene calcolato usando tutti i valori nel set di dati e i valori più lontani dalla media hanno più peso perché si elevano al quadrato. Il coefficiente di variazione misura la variabilità relativa rispetto alla media, è sempre espresso in percentuale e può essere usato per confrontare due o più set di dati con unità di misura diversa CV= (σ/xmedio) * 100. (Esempio azione A prezzo medio 50 e scarto quadratico medio 5, CV=10%; azione B prezzo medio 100 e scarto quadratico medio 5, CV=5%; entrambe le azioni hanno lo stesso scarto quadratico medio, ma l’azione B è meno variabile rispetto al suo prezzo).

Misure di forma della distribuzione

La forma della distribuzione si dice simmetrica se le osservazioni sono bilanciate o distribuite in modo approssimativamente regolare rispetto al centro; si dice asimmetrica se le informazioni non sono distribuite in modo simmetrico rispetto al centro. Una distribuzione con asimmetria positiva...

Anteprima
Vedrai una selezione di 6 pagine su 22
Appunti metodi quantitativi Pag. 1 Appunti metodi quantitativi Pag. 2
Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.
Appunti metodi quantitativi Pag. 6
Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.
Appunti metodi quantitativi Pag. 11
Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.
Appunti metodi quantitativi Pag. 16
Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.
Appunti metodi quantitativi Pag. 21
1 su 22
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-P/08 Economia e gestione delle imprese

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Angila945 di informazioni apprese con la frequenza delle lezioni di Metodi quantitativi per economia, finanza e management e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università "Carlo Cattaneo" (LIUC) o del prof Saccardi Alberto.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community