Estratto del documento

Autore: Luigi D'Ambra - Statistica Descrittiva

Capitolo primo: La rilevazione statistica

Ogni ∑ ha un intervallo di i che va da 1 ad n. Oggi il termine statistica è riferito a due significati: un dato numerico o una tavola di dati numerici ottenuto mediante indagini ed elaborazioni; la scienza del collettivo, utilizzato ovunque siano quantificabili i fenomeni di massa.

Carattere: rappresentano gli aspetti delle unità statistiche oggetto di studio.

Modalità: i modi diversi di essere di un carattere con cui si possono presentare le unità di una popolazione. I caratteri si dicono:

  • Quantitativi: le modalità sono espresse attraverso una grandezza misurabile o numerabile;
  • Qualitativi: se le modalità sono espresse mediante espressioni verbali o attributi.

Sempre per quanto riguarda il carattere, distinguiamo:

  • Carattere discreto: quello che ha per modalità i numeri reali 0,1,2,3, etc. (es. gli alunni di una scuola);
  • Carattere continuo: quello che ha come modalità tutti i valori compresi in un intervallo (es. altezza, peso).

Le distribuzioni statistiche si distinguono in semplici (se consideriamo un solo carattere) e multiple (se consideriamo due o più caratteri).

Frequenza: il numero delle unità di un carattere che presentano le stesse modalità.

Intensità: è il numero di un carattere che esprime il suo ammontare o la sua misura o la sua grandezza.

Distinguiamo tre tipi di frequenze:

  • Frequenza assoluta: il numero delle volte in cui la modalità è stata osservata;
  • Frequenza relativa: è il rapporto tra la frequenza assoluta ed il totale delle frequenze;
  • Frequenze cumulate: corrispondenti al valore di è la somma delle frequenze assolute, o relative, dalla prima modalità fino a comprendere quella di xi.

Distribuzione statistica: la classificazione delle unità statistiche secondo la modalità di uno o più caratteri e la conseguente tabellazione dei risultati dell’indagine oggetto di studio da luogo alle distribuzioni statistiche. Distinguiamo le distribuzioni statistiche in:

  • Distribuzioni semplici: se è riferita ad un unico carattere;
  • Distribuzioni in classi: quando i dati sono numerosi conviene procedere ad una suddivisione in classi del carattere cioè la popolazione viene suddivisa in classi distinte;
  • Distribuzioni doppie: si hanno quando su ciascuna unità della popolazione si rilevano due caratteri X e Y.

Per le distribuzioni in classi calcoliamo:

  • L’ampiezza della classe come la differenza tra il suo estremo superiore e il suo estremo inferiore: hi= xi – x(i-1); oppure w= x(max.) - x(min.) / S;
  • La densità di frequenza è il rapporto tra la frequenza e l’ampiezza di una classe: di= ni / hi;
  • Il valore centrale di una classe è la semisomma dei suoi estremi: i= xi + x(i-1) / 2;
  • Il numero minimo delle classi è dato da: S= 1 + 10/3 log n.

Capitolo secondo: Rapporti statistici

I rapporti statistici vengono elaborati per consentire il confronto tra i dati osservati. In questi rapporti utilizziamo:

  • Indici a base fissa: il denominatore scelto è sempre uguale ad una stessa intensità base;
  • Indici a base variabile: si confronta ciascun dato con quello precedente, assumendo quest'ultimo volta per volta come base di riferimento.

Numeri indici:

  • Numeri indici semplici: rapporti che consentono il confronto tra le intensità di uno stesso fenomeno o più situazioni diverse o in tempi diversi o in luoghi diversi;
  • Numeri indici complessi: rapporti che mettono in confronto le intensità di più fenomeni rispetto ad un tempo o luogo base.

Proprietà dei numeri indici semplici:

  • Proprietà dell’identità: si pone che il numero indice relativo al periodo di base deve essere uguale ad 1 o ad una potenza di 10; xi = xj -> iij = xj / xi = 1;
  • Proprietà della reversibilità delle basi: serve per passare da una serie di numeri indici a base fissa alla corrispondente serie di numeri indici a base mobile ed è sufficiente dividere ciascun numero indice a base fissa per il suo precedente;
  • Proprietà transitiva: serve per passare da una serie di numeri indici a base mobile alla corrispondente serie di numeri indice a base fissa, aventi come base fissa il termine iniziale della serie;
  • Proprietà della reversibilità dei fattori: l’indice di valore è uguale al prodotto dell’indice dei prezzi e di quello delle quantità, cioè si consideri un dato di valore v suddiviso nei suoi elementi costituenti: v = pq dove p= prezzo e q= quantità;
  • Proprietà di commensurabilità: si verifica quando l’indice è indipendente dall’unità di misura delle quantità e non varia se cambia l’ordine di grandezza dell’unità di misura impiegata per esprimere la quantità di beni su cui si commisura il prezzo unitario;
  • Proprietà di proporzionalità: un indice non deve annullarsi né tendere ad infinito o diventare indeterminato se si annulla un termine compreso nella formula.

Si possono costituire i seguenti indici dei prezzi:

  • Formula di Laspeyre: Ip(L)= ∑p(i1)q(i0) / ∑p(i0)q(i0)
  • Formula di Paasche: Ip(P)= ∑p(i1)q(i1) / ∑p(i0)q(i1)

In entrambe le formule i prezzi variano sia al numeratore che al denominatore e le quantità sono costanti, quindi entrambi gli indici sono espressi come rapporti tra medie aritmetiche ponderate dei prezzi degli n beni e/o servizi. Per risolvere il dualismo nella scelta dell’una o dell’altra formula si può procedere ad un’ulteriore sintesi: il criterio proposto da Fisher:

√ ( )Ip(F)= Ip L x Ip(P) √ ( )Iq(F)= (P)Iq L x Iq

Capitolo terzo: Rappresentazioni grafiche

Per rappresentare i fenomeni si utilizzano, come abbiamo già visto, le rappresentazioni tabellari, ora vedremo le rappresentazioni grafiche.

  • Diagrammi circolari:
  • Diagramma a canne d’organo:
  • 3210
  • Istogramma:
  • Stereogramma:
  • 543210 1 2 3 4
  • ia ia ia iar r r ro o o oeg teg teg tegtCa Ca Ca Ca
  • Box-plot:

Capitolo quarto: Le medie

Gli indici utilizzati sono principalmente 4:

  • Indici di posizione (media, mediana, quartili e moda);
  • Indici di variabilità;
  • Indici di forma;
  • Indici di curtosi.

Consideriamo ora gli indici di posizione. Generalmente definiamo la media come quel valore verso il quale convergono tutti i punti. La definizione proposta da Chisini afferma che: sia x1, x2, x3, …, xn la distribuzione per unità di un carattere quantitativo X, una sua media è una quantità che, se sostituita a ciascun termine della distribuzione, lascia inalterato il risultato delle operazioni f eseguite sui termini della distribuzione. In altre parole, se si considera la distribuzione come se fosse una funzione o la media presa n volte quante sono le osservazioni è la stessa cosa.

Abbiamo diverse tipologie di medie:

  • La media aritmetica è la media semplice dei termini x1, x2, …, xn e quella ponderata, delle k modalità x1, x2, …, xk di pesi n1, n2, …, nk sono rispettivamente: M= x1 + x2 + … + xn / n

Proprietà della media aritmetica:

  • Internalità: la media aritmetica di una serie di valori è sempre compresa tra il valore minimo e il valore massimo, ovvero x1 ≤ M ≥ xn;
  • Omogeneità: moltiplicando con una costante c appartenente all’insieme dei numeri reali R i termini di una distribuzione anche la media risulta moltiplicata per la stessa costante c, ovvero (cx1+cx2+…+ cxn)/n = cM;
  • Associativa: secondo tale proprietà dividendo un collettivo di numerosità n in c sottogruppi a due a due disgiunti e di numerosità n.1, n.2, …, n.c, dove n=n.1 + n.2 + n.c, la media aritmetica ponderata è uguale alla media ponderata delle medie dei sottogruppi con pesi pari alla frequenza di ogni sottogruppo;
  • La somma algebrica degli scarti dei termini della distribuzione della media aritmetica è uguale a zero, ovvero ∑(xi – M)=0;
  • La somma dei quadrati degli scarti dei termini della distribuzione dalla media aritmetica è un minimo rispetto alla somma dei quadrati degli scarti dei termini da un qualsiasi altro valore, ovvero ∑ (xi − M)2 = min;
  • Consistenza: la media aritmetica è la più usata delle medie;
  • La media armonica è il rapporto tra il numero di valori considerati e la somma tra i reciproci dei valori numerici, ovvero: n/(1/x1 + 1/x2 + … + 1/xn);

Proprietà della media armonica:

  • Internalità, tale proprietà è valida a patto che i termini della distribuzione siano tutti positivi o tutti negativi;
  • Omogeneità, n/(∑ cxi) = cM;
  • La somma dei quadrati degli scarti dei reciproci dei valori xi dall’inverso della media armonica è un minimo rispetto alla somma dei quadrati degli scarti dei medesimi valori inversi xi dall’inverso di un qualsiasi altro valore c ≠ Ma, ovvero: ∑ (1/xi − 1/Ma)2 < ∑ (1/xi − 1/c)2;

La media geometrica è la radice n-esima del prodotto dei valori considerati, ovvero: √n(x1 x2 … xk)

Proprietà della media geometrica:

  • È nulla la somma degli scarti dei logaritmi dei valori xi > 0 dal logaritmo della media geometrica, ovvero ∑(log xi – log Mg) = 0;
  • La somma dei quadrati degli scarti tra i logaritmi dei valori xi ed il logaritmo della media geometrica è un minimo, ovvero ∑ (log xi – log Mg)2 < ∑ (log xi – log c)2;
  • Omogeneità, moltiplicando i termini xi per uno stesso numero c appartenente all’insieme dei numeri reali R anche la media geometrica risulta moltiplicata per quel valore c;
  • Il reciproco della media geometrica è uguale alla media geometrica dei reciproci dei valori xi, cioè Mg-1(1/x1, 1/x2, …, 1/xk);
  • La media geometrica di una serie di rapporti X/Y è uguale al rapporto tra le medie geometriche del numeratore X e del denominatore Y, cioè Mg(X/Y) = Mg(X)/Mg(Y);
  • La media geometrica è invariante per una trasformazione di potenza;
  • Monotona, se la distribuzione per unità B è più grande della distribuzione A allora: Mg(A) < Mg(B);
  • Associativa;
  • Consistente;
  • Internalità, ma non dipende da quella traslativa;

La media quadratica di ordine h, con h appartenente all’insieme dei numeri reali R di una distribuzione per unità (x1, x2, …, xn), è definita dalla seguente espressione: √h(∑ xih/n).

Le medie troncate si utilizzano quando la media risente troppo dei valori anomali (troppo alti o troppo bassi rispetto al resto della sequenza dei valori) e dunque si considerano solo i valori centrali. Ad esempio, consideriamo i valori 2,15,17,20,40, considerando i valori anomali (2 e 40) la media risulterebbe 18,8 mentre se consideriamo solo i valori centrali (15,17 e 20) essa risulta 17,3 e dunque più attendibile.

Il calcolo della media varia a seconda della distribuzione di cui ci troviamo:

  • Serie di dati: ∑ xi/n;
  • Tabella di distribuzione semplice: ∑ nixi/n;
  • Distribuzione in classi: ∑ nixi/n.

Mediana

È quell’osservazione reale o teorica che separa il 50% che ha intensità inferiore dal 50% che ha...

Anteprima
Vedrai una selezione di 7 pagine su 26
Appunti esame statistica Pag. 1 Appunti esame statistica Pag. 2
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Appunti esame statistica Pag. 6
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Appunti esame statistica Pag. 11
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Appunti esame statistica Pag. 16
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Appunti esame statistica Pag. 21
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Appunti esame statistica Pag. 26
1 su 26
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher angy1610 di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi del Sannio o del prof Amenta Pietro.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community