Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Caratteri qualitativi sconnessi
- Rappresentazione tramite rettangoli (si disegnano in corrispondenza di ciascuna modalità dei rettangoli di stessa base e altezza proporzionale alle frequenze. Tali rettangoli possono essere disegnati anche in senso orizzontale, in quel caso le modalità saranno elencate nell'asse delle y e le frequenze sull'asse delle x)
- Grafici a torta (si costruisce un cerchio, i cui settori circolari (α) hanno ampiezza proporzionale alle frequenze (α= fi * 360° = frequenza x 360°) (360° x pi) 360° x fi (360° x ni) α = = = 100 n pi = frequenza percentuale fi = frequenza relativa ni = frequenza assoluta n = totale unità statistiche)
- Rappresentazione tramite figure (si sceglie una figura per rappresentare l'unità di misura e si rappresentano le modalità riportando un numero di figure proporzionale alle frequenze osservate)
Caratteri qualitativi ordinati
- Rappresentazione tramite rettangoli (si
disegnano in corrispondenza di ciascuna modalità dei rettangoli di stessa base e altezza proporzionale alle frequenze. Tali rettangoli possono essere disegnati anche in senso orizzontale, in quel caso le modalità saranno elencate nell'asse delle y e le frequenze sull'asse delle x. I rettangoli vanno messi in ordine crescente (gerarchico). CARATTERI QUANTITATIVI DISCRETI:Grafico a barre (le frequenze sono rappresentate soltanto da un segmento lineare). Il grafico viene disegnato quindi su un piano cartesiano, dove sull'asse orizzontale si riportano le modalità - discrete - del carattere, e sull'asse verticale le rispettive frequenze. La barra è disegnata soltanto in corrispondenza del valore puntuale del carattere, per mettere in evidenza che questo è discreto.
CARATTERI QUANTITATIVI CONTINUI:Sono rappresentati tramite tabelle con modalità espresse in classi. La presenza delle classi richiede alcune accortezze. Innanzi tutto,
al fine della costruzione del grafico, è fondamentale tener conto dell'ampiezza della classe.
AMPIEZZA CLASSE
ai = ampiezza classe = wi+1 - wi
wi = valore di inizio range
wi+1 = valore di fine range
Per depurare le frequenze dalla diversa ampiezza delle classi si devono calcolare le densità di frequenza, ovvero quanto le mie osservazioni sono "addensate" all'interno della classe. È come se le osservazioni venissero distribuite equamente all'interno della classe. L'ipotesi è quella di equidistribuzione.
DENSITÀ DI FREQUENZA
li = densità di frequenza = ni/ai
ni = frequenze assolute (espresse in numeri finiti)
ai = ampiezza di classe
- istogramma: è fondamentale che le aree dei rettangoli rispettino le proporzioni tra le frequenze osservate. L'area del rettangolo è data da base x altezza, dove la base è l'ampiezza dell'intervallo. Vediamo quindi che considerando nel rettangolo
l'altezza pari alla densità, la corrispondenza tra area e frequenza è rispettata. Inserire i valori degli intervalli (linea orizzontale) rispettandone le proporzioni. Inserire i valori della densità di frequenza (linea verticale).
L'area del rettangolo che deriva dal range di valori x la densità di frequenza di ogni modalità è proporzionalmente giusta, infatti il risultato di questa operazione sarà uguale al numero di frequenze assolute di quell'area.
ai x li = ni
MEDIA/INDICE DI TENDENZA= indice sintetico adatto a descrivere la tendenza del fenomeno. Permette di sintetizzare con un unico valore (attributo) l'intera distribuzione osservata.
MEDIA DI POSIZIONE= indice sintetico ricavato facendo riferimento alla particolare posizione occupata da una osservazione nella distribuzione. È sempre determinabile per qualsiasi tipologia di caratteri (caratteri qualitativi e quantitativi).
MODA= è la modalità xi di un
fenomeno statistico che presenta la Moda, cioè la frequenza (assoluta, relativa o percentuale) più elevata. Può essere facilmente individuata osservando attentamente il grafico della distribuzione, perché corrisponde alla modalità (con barra, rettangolo, sezione, ecc) maggiore. Se le classi hanno diversa ampiezza, l'individuazione della Moda (in questo caso parliamo in realtà di classe modale) avviene in corrispondenza del massimo di densità di frequenza. Per comodità, una volta individuata la classe con massima densità, si definisce Moda il valore centrale del rispettivo intervallo. Può succedere inoltre che ci siano più valori con frequenza più elevata, allora tutti vengono considerati moda e in questo caso che la distribuzione è plurimodale individuare la frequenza più elevata all'interno della distribuzione. Se la distribuzione è per classi, calcolare le densità di frequenza e individuare laLa densità maggiore è la modalità, o classe modale, che corrisponde al valore massimo. Tale modalità è la Mediana, indicatore di tendenza generale, valore che occupa la posizione centrale all'interno della distribuzione. Quel valore centrale che, una volta ordinati i dati del campione, lascia alla sua sinistra e alla sua destra la metà del campione, ossia che divide a metà la distribuzione dei dati ordinati. Rappresenta un valore di equilibrio all'interno della distribuzione, poiché metà delle osservazioni saranno maggiori della Mediana e metà inferiori.
Affinché la Mediana sia determinabile, i dati devono essere ordinabili e devono essere ordinati. L'esatta posizione varia a seconda che il numero di dati sia pari o dispari. La posizione deve essere un numero intero. Ricordarsi che la Mediana non è la posizione, ma il valore che occupa quella posizione. Come trovare la posizione centrale
(N=numero del campione):Se N è dispari: Me= (n+1)/2 (una mediana)o Se N è pari. Ho due valori al centro, uno di posizione e l'altro in posizione successiva (2 mediane). Il valore della Mediana in questo caso è dato dalla media tra le 2 mediane trovate. È un eccesso di sintesi, poiché solitamente il valore della mediana deve essere un valore assoluto e non decimale.Me1= n/2 Me2= (n/2)+1 Me = (Me1+Me2)/2Quando i valori osservati sono tanti e non li abbiamo per elenco, ma sono rappresentati in tabella di frequenza, possiamo ricorrere alle frequenze cumulate per determinare la Mediana.Trovare la posizione centrale tramite le formuleo precedenti(n+1)/2n/2 = x(n/2) +1Calcolare le Frequenze cumulate assolute o relativeo La modalità in corrispondenza del valore x è la MedianaIl caso di dati raccolti in classi deve essere trattato separatamente.Infatti la procedura vista fino ad ora permette l'individuazione della classe mediana.
Dopodiché sarà necessario individuare, all’interno della classe, il valore specifico. Trovare la posizione centrale tramite le formule precedenti (classe mediana, ovvero quella classe che contiene il valore della mediana)<p>(n+1)/2n/2 = x(n/2) +1</p>
Calcolare le frequenze cumulate assolute e guardare in quale classe trovo il valore x. Se il valore x cade a cavallo delle due classi contigue, la Mediana è il valore separatore delle due classi. Se invece il valore x cade all’interno di una classe i, per calcolare il valore esatto della Mediana all'interno di tale intervallo si fa l'ipotesi che le osservazioni che cadono nell'intervallo siano equi-distribuite.
<p>Me xi [(n/2) (Ni1)] / li Ni-1 = frequenze cumulate assolute corrispondenti alla classe precedente a quella della mediana</p>
<p>Xi= valore iniziale del range/classe in cui è contenuta x (es. classe 10-15 -> xi=10)</p>
<p>Li= valore corrispondente al rapporto tra frequenze assolute della classe i e la frequenza totale</p>
classe mediana e tra differenza dell'ampiezza della classe mediana
QUANTILI: sono dei valori che occupano particolari posizioni all'interno della distribuzione, lasciando a destra e sinistra percentuali di valori diversi. Dividono la distribuzione in parti uguali (k). Per poter calcolare tali indici, il carattere deve essere almeno ordinabile.
QUARTILI quando k= 4 (divide in 4 parti uguali) Seo dividiamo la distribuzione in 4 parti uguali, parliamo di quartili:
Q1 = valore che lascia il 25% dei dati a sinistra e il 75% a destra;
Calcolare n/4 (totale frequenze assolute diviso 4)
Vedere in quale classe si trova il risultato di n/4, identificando in quale classe si trova il primo quartile
Q1 xi [(n/4) (Ni-1)] / li + - n/4 = totale delle unità statistiche (frequenze assolute) diviso 4
Ni-1 = frequenze cumulate nella classe precedente a quella identificata del primo quartile
Li = valore corrispondente al rapporto tra frequenze assolute della classe del primo quartile edelle osservazioni superiori ad esso.tmetica si calcola sommando tutti i valori osservati e dividendo per il numero totale di valori.
MEDIANA= è il valore centrale di un insieme di dati ordinati in modo crescente o decrescente. Se il numero di dati è pari, la mediana è la media dei due valori centrali.
MODA= è il valore che compare più frequentemente in un insieme di dati.
RANGE= è la differenza tra il valore massimo e il valore minimo di un insieme di dati.
VARIANZA= è una misura di quanto i dati si discostano dalla media. Si calcola sommando il quadrato delle differenze tra ogni dato e la media, e dividendo per il numero totale di dati.
DEVIAZIONE STANDARD= è la radice quadrata della varianza. Rappresenta la dispersione dei dati rispetto alla media.
PERCENTILI= sono valori che dividono un insieme di dati in parti uguali. Il percentile k indica che k% dei dati è inferiore o uguale a quel valore.
Questi sono solo alcuni dei principali indicatori statistici utilizzati per analizzare e sintetizzare i dati.