vuoi
o PayPal
tutte le volte che vuoi
Misure di tendenza centrale
Che cos'è una media?
La statistica si occupa tra l'altro della descrizione e della sintesi dei dati quantitativi, la descrizione di un campione di osservazioni rispetto ad una variabile quantitativa deve comprendere la misura della tendenza centrale. In altri termini, ci occorre identificare un numero vicino al centro della distribuzione dei valori del campione, tale che lo rappresenti. Tale numero è chiamato media la quale è anche definita come una misura di posizione perché indica, in quella che potrebbe essere una scala di grandezza infinita, la posizione del gruppo di osservazioni. Esistono altre misure di tendenza centrale quali la mediana e la moda.
La media
La media (o media aritmetica) è la misura di tendenza centrale più nota. Si calcola dividendo la somma dei valori per il numero delle osservazioni. Se è possibile ottenere un'osservazione per ogni singolo elemento e unità di un campione o di una popolazione, la media è indicata con il simbolo µ ed è chiamata media della popolazione. Di solito, si deve a conteggiare delle osservazioni di un campione; in tale caso la media è rappresentata con il simbolo x̄ ed è chiamata media campionaria la media del campione è una stima diretta della media della popolazione.
- Media popolazione (µ): Σx / N dove x singola osservazione e N numero di elementi.
- Media campionaria (x̄): Σx / n dove n numero di osservazioni del campione.
Media di dati raggruppati
Nel caso in cui un certo numero di osservazioni sia raggruppato in una tabella di frequenza, la media si calcola in modo differente.
- Media dati raggruppati (x̄): Σfx / n dove f frequenza (il numero di osservazioni) in ogni classe.
La mediana: una statistica robusta
La mediana è una misura di tendenza centrale tra le variabili osservazionali disposte in ordine crescente o in ordine decrescente.
cui le osservazioni siano pari ed ordinata è data dalla media dei due valori centrali tra le altre osservazioni disposte in ordine crescente.
La Moda
La moda rappresenta un ulteriore misura di tendenza centrale. Quando i valo-ri sono raggruppati in classi di frequenza, parliamo di classe modale ossia laclasse che contiene il maggior numero di osservazioni rispetto a delle altre.Una distribuzione di frequenza con più di un picco è detta distrubuzione mul-ti-modale. Quando si registrano due picchi si parla di distrubuzione bimodale.
distribuzione. In teoria le due code della distribuzione non incrociano mai l'asse delle
ascisse e tendono all'infinito.
Su entrambi i lati di una curva normale c'è un PUNTO DI FLESSO, in corrispondenza
del quale la curva si trasforma da concava a convessa. La distanza dei punti di
flesso rispetto all'asse centrale è uguale sui due lati: tale distanza corrisponde
alla deviazione standard. Tale distanza può essere utilizzata come unità che
divide l'asse x in seguenti componenti.
Se si modifica la scala dell'asse verticale della distribuzione indicando i valo-
ri di probabilità, la curva diventa una distribuzione di probabilità o, più preci-
samente, una DENSITÀ DI PROBABILITÀ. La probabilità totale è pari a 1 (100%). Se indi-
chiamo come 100 l'area totale sotto la curva normale, allora una delle proprietà
della curva normale è definita dal fatto che l'area della zona compresa entro
una deviazione standard a sinistra dell'asse di simmetria ed una deviazione standard
a destra dell'asse di simmetria è pari al 68.26% dell'area totale.
LA CURVA NORMALE STANDARD
Qualsiasi valore di un'osservazione x di una distribuzione normale può essere standari-
zzato calcolando il numero di UNITÀ DELLA DEVIAZIONE STANDARD che lo separano dalla
la media. Tale valore è detto z. Per trasformare x in z è possibile applicare la
formula z = (x - k) / s. Se M è maggiore di x, allora z è negativo.
Unica raro è il caso in cui non si conoscono i valori di M e di s: in questo caso z si otte-
iene con la formula z = (x - x̄) / s.
STANDARDIZZANDO un'osservazione x in z è possibile fare comunque riferimento alle
proprietà attribuibili alla curva normale: se il valore calcolato di z è maggiore di 1.96,
allora la probabilità di ottenere casualmente un numero così lontano dalla media,
è inferiore a 0.05. Si dice che tale valore è STATISTICAMENTE SIGNIFICATIVO.
Nei test a una coda e l'ipotesi nulla e, ea stessa, una e l'ipotesi semplicemente e diversa.
Le test a una coda e uno conseguimiento dei test a due code accadere peo cio pressine attenzioni primari dovrb essere recisao.
Le test a una coda dovrebbero essere aprimiba quando esistene una motivazione a priori, leke ca decisione su quale dei test da applicare, deve essere peeso prima che i deti vengno animalizzati. In caso di inclezzeza, uni un test a due code, un ruscatto pfatistichemente significativo con un test
ERROR DI 1a:
fissare il livelle per rifiutare e l'ipotesi H0 a p > 0.05 significa che nel test il quivelonte del test statistico e uquale o eccede tale vului, uniuco ca decisione do rifiutare l'ipotesi nulla e probabile quorretta 95 volie su 100. Ul segne che ho il ruschio di rifiutare e l'ipotesi nulla quando e vera e fasi a 5 vole su 100. Si rifiuta l'ipotesi H0 quando e vera, commettei, uno un ERRONE di 1o. Il ruschio da commettere tale errore si ridurre impicando il livelle da accetazione a un velote piu basso.
Il caso goimporta a quello gia estposto e l'ERRORI a di 2o tipo che consister ne ci non rifiutare e l'ipotesi nulla H0 quandeo e felcia.
I due risischi in campensusio, quandeo si ridurre la probabilita di commetture un errore di 1o tipo, aumente la probabilite decommettere un 2o tipo. L'unico modo da mantanere entrcai bio'e quello da aumentare le diccursioni del campione.
zione di regressione y = a + bx, e selezionano due valori di y ai px che si corrispondono ai valori di x dell’equazione. Questi diventano le coordinate dei due punti.
IL COEFFICIENTE DI DETERMINAZIONE NELLA REGRESSIONE
Il termine COEFFICIENTE DI DETERMINAZIONE si parla di quadrato del coefficiente di cor. relazione dell’analisi di regressione; del momento che le unità di comportamento sono raremente selezionabili in modo casuale e dalla popolazione, il coefficiente di correCA, zione non è significativo. Comunque il suo quadrato, il coefficiente di determinazione, ha effettivamente un significato
LE RELAZIONI NON LINEARI
Una delle condizioni applicabili alla regressione lineare semplice è che esiste una relazione lineare tra le variabili x e y. Molte relazioni significative nella scienza vedolci ma non sono lineari, ma mostrano curve di implicito adattamento. L’utilità della regressione aumenta di molto quando le relazioni curve sono tradotte (linearizzate) dalle trasformazioni. Diventa quindi possibile effettua. re un'analisi di regressione e simulare le valore di una variabile della minquacia. ne dell’alta.