Estratto del documento

Statistica

La parola “Statistica” deriva dal latino “status” e significa “condizione”, ovvero la situazione di un soggetto in relazione a un determinato contesto sociale. Inizialmente, questa disciplina consisteva nella raccolta di dati relativi allo Stato (numerosità della popolazione, quantità di grano raccolto, ecc.); successivamente acquisì pian piano significati più ampi, andando a includere il calcolo delle probabilità, l’inferenza statistica, il campionamento statistico e gli sviluppi teorici.

La statistica analizza in termini quantitativi i fenomeni collettivi, generati da un insieme di manifestazioni individuali: si tratta quindi di una scienza quantitativa. Il modo di pensare statistico si distingue da quello matematico in quanto, a differenza di quest’ultimo, non può prescindere dal contesto e non si basa sulla deduzione, bensì sull’induzione. La matematica ricopre però un ruolo strumentale nell’analisi statistica.

Si usa la statistica per fornire una rappresentazione adeguata dei dati sotto forma di tabelle e/o grafici per poi sintetizzarli attraverso specifici indicatori (statistica descrittiva) e per prendere decisioni in condizioni di incertezza utilizzando la teoria delle probabilità (statistica inferenziale).

Indagine statistica

L’indagine statistica è la principale tecnica con cui si possono acquisire informazioni sulla manifestazione di un fenomeno su una data popolazione. L’obiettivo principale è la conoscenza di un collettivo statistico, inteso come insieme di unità elementari, su cui si manifesta il fenomeno oggetto di studio.

Esistono 2 diverse tipologie di indagine:

  • Indagine totale, che rileva i caratteri di interesse su tutte le unità che costituiscono il collettivo statistico.
  • Indagine campionaria, che rileva i caratteri di un sottoinsieme ridotto di unità, ossia un campione, permettendo un risparmio di tempi e costi in cambio di una minore precisione dei dati raccolti.

Un’indagine statistica prevede la progettazione di un piano di lavoro in cui vengono definite le diverse fasi necessarie allo svolgimento dell’indagine:

  1. Definizione degli obiettivi;
  2. Individuazione della popolazione e della lista delle unità statistiche;
  3. Definizione del piano di campionamento;
  4. Raccolta dei dati;
  5. Registrazione dei dati;
  6. Elaborazione e analisi dei dati;
  7. Interpretazione dei dati.

Acquisizione dei dati

L’acquisizione dei dati può avvenire in diversi modi, a seconda della fonte delle informazioni:

  • Fonte primaria, che consiste nella raccolta diretta dei dati, effettuata seguendo un metodo:
    • Sperimentale, attraverso esperimenti fisici, chimici o clinici e caratterizzata da:
      • Ipotesi di lavoro, elaborate da enunciati, formalizzabili spesso in termini matematici.
      • Possibilità di controllare sia le condizioni in cui l’esperimento si svolge, sia le caratteristiche delle unità statistiche da impiegare.
    • Osservazionale, attraverso indagini statistiche, che non permettono di controllare le condizioni sotto le quali si svolge l’osservazione ed che rendono possibile controllare solo in parte le caratteristiche delle unità statistiche.
  • Fonte secondaria, che consiste nell’utilizzo di dati raccolti e distribuiti da enti pubblici o privati.

Le condizioni in cui si svolgono i rilevamenti e le caratteristiche delle unità statistiche vengono dette fattori. Questi possono essere distinti in:

  • Sperimentali, se riguardano le variabili oggetto della ricerca;
  • Di stratificazione, se riguardano l’insieme delle unità sperimentali.

Tecniche di rilevazione

  • Intervista diretta, che consiste nella somministrazione di un questionario mediante il contatto personale tra intervistatore e intervistato.
  • Intervista telefonica, che consiste nella somministrazione del questionario con assistenza tramite telefono (CATI).
  • Auto-compilazione, che consiste nella compilazione autonoma del questionario recapitato per posta o consegnato dal personale, con allegato un libretto delle istruzioni.
  • Indagine web, che consiste nella somministrazione del questionario via internet, che verrà compilato autonomamente e riconsegnato tramite posta elettronica o altri strumenti informatici (CAPI).

Questionario

Il questionario è lo strumento di rilevazione dei dati più utilizzato nelle indagini statistiche, consistente in un insieme di domande da sottoporre a un collettivo di unità statistiche. La costruzione del questionario comincia con la concettualizzazione, in cui si cerca di ricondurre il fenomeno a un modello logico-concettuale. In questa fase si individuano le entità che entrano in gioco, si descrivono le relazioni esistenti tra di esse e si determinano le possibili gerarchie fra queste ultime.

La seconda fase è la formulazione delle domande, che possono essere:

  • Aperte, in cui le categorie di risposta non sono fornite di seguito alla domanda e l’intervistato deve quindi fornire un valore numerico esatto o rispondere con parole proprie;
  • Chiuse, in cui le possibili categorie di risposta sono elencate dopo il quesito;
  • Semi-aperte, formate da risposte pre-formulate più una risposta aperta, combinando i vantaggi di entrambi i formati;
  • A scelta multipla, in cui è possibile indicare due o più modalità di risposta, talvolta dando un ordine di importanza alle stesse;
  • Diretta, in cui è chiamato in causa il diretto interessato;
  • Indiretta, in cui ci si riferisce a una generica terza persona.

Esistono inoltre domande in scala grafica, costituita da un segmento di risposte in ordine crescente o decrescente in cui l’intervistato dovrà posizionare il suo giudizio.

Per prevenire e limitare il numero di errori è necessario evitare:

  • Formulazione di domande troppo generiche o, al contrario, troppo tecniche;
  • Domande complesse che richiedono un elevato sforzo di memoria;
  • Situazioni di imbarazzo o tensione;
  • Domande poste in maniera tale da influenzare la risposta dell’intervistato;
  • Successione di domande in cui ciascuna condiziona la risposta alla successiva.

La domanda filtro consente di passare da una batteria di domande a un’altra, evitando di sottoporre all’intervistato domande non pertinenti. Le sequenze di domande possono seguire una successione:

  • A imbuto, se partendo da domande generiche si arriva a domande più specifiche;
  • A imbuto capovolto, se partendo da domande specifiche si arriva a domande generiche.

Scale di misura

Scala nominale, che assegna un codice alle modalità di risposta di un determinato quesito al fine di identificare ogni unità elementare di analisi in base al possesso di una determinata modalità del carattere in esame; non è possibile stabilire un ordine tra le modalità e perciò produce distribuzioni secondo un carattere qualitativo sconnesso.

Scala ordinale, che classifica un fenomeno consentendo un ordinamento tra le varie modalità, anche se non si conoscono le distanze tra le diverse posizioni, andando a costituire una distribuzione secondo un carattere qualitativo ordinato.

Scala metrica, che consente di ordinare le varie modalità quantificando inoltre le distanze tra ciascuna di esse; la scala può essere:

  • A intervalli, dove non esiste uno zero assoluto e non è quindi possibile stabilire rapporti tra i valori misurati;
  • Di rapporti, dove lo zero assoluto corrisponde all’intensità nulla rispetto alla modalità ed è quindi possibile stabilire rapporti tra i valori misurati.

Carattere

Il carattere è ciò che viene rilevato in ogni unità statistica che forma il collettivo. È una caratteristica dell’oggetto in esame sulla cui base avviene la raccolta dei dati e viene espressa secondo diverse modalità. Un carattere può assumere modalità differenti in corrispondenza delle diverse unità statistiche del collettivo. Queste modalità devono essere esaustive e non sovrapposte.

Quando le modalità sono espresse numericamente, il carattere è detto quantitativo, altrimenti è detto qualitativo.

Carattere quantitativo

Un carattere quantitativo può essere distinto in:

  • Continuo, se le modalità appartengono all’insieme dei numeri reali;
  • Discreto, se le modalità appartengono all’insieme dei numeri naturali.

Un carattere quantitativo può anche essere:

  • Con scala a intervalli, se non esiste uno zero assoluto, neutrale o arbitrario;
  • Con scala di rapporti, se esiste uno zero assoluto, neutrale o arbitrario.

Infine, un carattere quantitativo può essere:

  • Trasferibile, se un’unità statistica può cedere parte del carattere posseduto a un’altra;
  • Non trasferibile, se un’unità statistica non può cedere parte del carattere posseduto a un’altra.

Se il carattere che si vuole analizzare presenta molte modalità distinte, può essere necessario procedere a un accorpamento delle stesse. Si definisce suddivisione in classi l’operazione consistente nel dividere l’insieme dei possibili valori di un carattere quantitativo in intervalli tra loro disgiunti.

Carattere qualitativo

Un carattere qualitativo può essere distinto in:

  • Sconnesso, o su scala nominale, se non esiste un ordine naturale alle modalità;
  • Ordinato, o su scala ordinale, se esiste un ordine naturale alle modalità; in questo caso, i caratteri possono essere a loro volta suddivisi in:
    • Rettilinei, se possiedono una modalità iniziale e una finale;
    • Ciclici, se le modalità sono collegate tra loro in un ordine che non possiede un vero inizio o una vera fine.

Distribuzioni di frequenza

Distribuzione unitaria semplice: elenco delle modalità osservate di un carattere prendendo in considerazione le singole unità del collettivo statistico.

Distribuzione unitaria multipla: elenco delle modalità osservate riferito a più caratteri, sempre prendendo in considerazione le singole unità del collettivo preso in esame.

Tramite le frequenze è possibile pervenire a una rappresentazione molto sintetica denominata distribuzione di frequenze, che può essere:

  • Semplice, se associa alle modalità che può assumere un carattere (qualitativo o quantitativo) le corrispondenti frequenze assolute;
  • Doppia, se si riferisce a due caratteri congiunti e associa loro le corrispondenti frequenze assolute;
  • Multipla, se si riferisce a più di due caratteri e associa loro le corrispondenti frequenze assolute.

Dalle distribuzioni di frequenze è possibile passare alle frequenze:

  • Assolute, che indicano il numero di volte che una modalità di un carattere viene osservata (nj);
  • Relative, date dal rapporto tra la frequenza assoluta e il numero totale di unità osservate (fj = nj/n);
  • Percentuali, date dalle frequenze relative moltiplicate per 100 (pj = fj · 100).

Le frequenze relative e percentuali permettono di effettuare confronti tra collettivi con diversa numerosità. Nel caso in cui le modalità del carattere in esame siano ordinate, è possibile considerare la frequenza con cui esse si presentano di ordine inferiore o uguale a una certa modalità: in questo caso si parla di distribuzione di frequenze cumulate (indicate con la lettera maiuscola).

Distribuzione di quantità

Le distribuzioni di quantità si ottengono come risultato congiunto delle operazioni di classificazione del collettivo rispetto a un carattere e di misurazione, all’interno di ogni classe, di un carattere quantitativo trasferibile. Quando si misura un fenomeno nel tempo si ottiene una rappresentazione detta serie storica (o temporale). Quando invece si misura un carattere geografico, la distribuzione viene detta serie territoriale (o spaziale).

Distribuzioni in classi

Una variabile quantitativa continua viene solitamente rappresentata mediante una tabella di frequenze associate a classi di valori. Le classi sono formate da gruppi contigui di valori non sovrapposti, in cui ogni modalità appartiene a una sola classe. Le classi in questione possono essere:

  • Aperte, quando è indicato solo uno dei due limiti (massimo o minimo), e possono esserlo:
    • Inferiormente x < a oppure x ≤ a
    • Superiormente x > a oppure x ≥ a
  • Chiuse, quando è indicato sia il limite massimo che minimo, e possono a loro volta esserlo:
    • A destra a < x ≤ b
    • A sinistra a ≤ x < b
    • A destra e sinistra a ≤ x ≤ b

Rappresentazione grafica distribuzioni semplici

La trasformazione di una distribuzione semplice dalla forma tabellare a quella grafica ha lo scopo di rendere più evidente e di facile lettura le caratteristiche della distribuzione della variabile sul collettivo preso in esame. I grafici più importanti sono:

  • Grafici a barre/nastri, in cui viene rappresentata, attraverso rettangoli aventi la stessa base, la frequenza (o intensità delle frequenze) che si riflette nell’altezza (proporzionale) degli stessi;
  • Istogrammi, in cui viene rappresentata, attraverso barre non distanziate con base uguale all’intervallo dei valori e altezza corrispondente alle frequenze o quantità, la distribuzione di caratteri quantitativi continui;
  • Grafici ad aree, in cui viene rappresentato l’andamento nel tempo di un fenomeno rispetto alle modalità di un carattere quantitativo continuo;
  • Grafico a torta, in cui viene rappresentata la composizione di un aggregato, sia in termini di valori assoluti che relativi o percentuali;
  • Grafico a radar, in cui viene rappresentato, suddividendo l’angolo giro in tanti segmenti quante sono le modalità del carattere, le modalità di un carattere ciclico;
  • Cartogrammi, in cui vengono rappresentate le serie territoriali utilizzando una mappa sulla quale vengono evidenziate le frequenze o le intensità di un carattere;
  • Diagramma cartesiano, in cui viene rappresentato l’evolversi nel tempo di un fenomeno osservato in vari istanti tramite una successione di punti collegati da segmenti in cui l’asse orizzontale rappresenta la linea temporale e quello verticale indica l’intensità del carattere.

Media aritmetica

La media aritmetica (M oppure x̄) è un singolo valore numerico che descrive sinteticamente un insieme di dati su un fenomeno misurabile, ed è quindi utilizzata nel caso di caratteri quantitativi. È pari alla somma dei valori osservati divisa per il loro numero: x̄ = 1/n Σxi.

Si tratta dell’indice di posizione più utilizzato. Secondo la definizione di Chisini, la media è quel numero che, se sostituito a tutte le variabili della funzione, lascia invariato il valore della stessa: f(x₁, x₂, x₃, …, xn) = f(M, M, M, …, M).

Nel caso di caratteri suddivisi in classi, la media viene calcolata prendendo come riferimento il valore centrale di ognuna di queste. La media aritmetica ponderata (Mp) viene invece calcolata sommando i valori in analisi, ognuno dei quali moltiplicato per un coefficiente che ne definisce l’importanza, e dividendo il tutto per la somma dei “pesi”.

Media geometrica

La media geometrica (Mg) è la radice n-esima del prodotto dei valori considerati, dove n rappresenta il numero di valori. Può essere applicata solo a valori positivi e non-nulli. Al contrario della media aritmetica, i valori piccoli sono molto più influenti di quelli grandi, tanto che è sufficiente un valore nullo per annullare la media.

Analogamente alla media aritmetica, attribuendo un “peso” ai valori è possibile calcolare la media geometrica ponderata (Mgpond).

Moda

La moda è un indice di posizione che rappresenta la modalità della distribuzione che si presenta con la frequenza più alta (assoluta, cumulata, percentuale o relativa). Nel caso di distribuzione per classi eterogenee, la moda è rappresentata dalla classe avente la più alta densità di frequenze. Talvolta la moda può non esistere o non essere unica.

Quantili

I quantili sono valori che dividono una distribuzione di caratteri ordinati in 2 parti di uguale numerosità. Alcuni quantili frequentemente utilizzati sono:

  • Mediana, che corrisponde al quantile di ordine 1/2;
  • Quartili, che corrispondono ai quantili di ordine 1/4, 1/2 e 3/4;
  • Percentili, che dividono la distribuzione in cento parti uguali.

Se n è dispari, per calcolare i quantili è necessario moltiplicare il totale delle unità più 1 (n + 1) per la frazione corrispondente. Se n è pari, per calcolare i quantili è necessario moltiplicare sia il totale delle unità (n) che il totale delle unità più 1 (n + 1) per la frazione corrispondente, ottenendo perciò 2 valori.

Mediana

La mediana di un insieme di unità ordinate è la modalità corrispondente all’unità centrale, ovvero quella che divide il collettivo in 2 parti di uguale numerosità: una parte formata da tutte le unità che precedono la mediana e l’altra formata da tutte quelle che la succedono. Si tratta di un indice di posizione che non è influenzato dalla presenza di valori estremi, in quanto dipende solo dal numero di unità.

Per calcolare la mediana è necessario:

  • Ordinare le unità in senso crescente rispetto alle modalità del carattere;
  • Individuare la posizione in graduatoria dell’unità centrale.
Anteprima
Vedrai una selezione di 11 pagine su 47
Appunti Statistica Pag. 1 Appunti Statistica Pag. 2
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti Statistica Pag. 6
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti Statistica Pag. 11
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti Statistica Pag. 16
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti Statistica Pag. 21
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti Statistica Pag. 26
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti Statistica Pag. 31
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti Statistica Pag. 36
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti Statistica Pag. 41
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti Statistica Pag. 46
1 su 47
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher federicogiordano1995 di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi della Tuscia o del prof Laureti Tiziana.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community