vuoi
o PayPal
tutte le volte che vuoi
FREQUENZA
E’ il numero di volte in cui si verifica un determinato evento in un gruppo di eventi.
Se ci interessa la mutabile sesso dei soggetti, possiamo contare quanti maschi e
quante femmine ci sono in un determinato gruppo. L’ insieme di questi dati si dice
distribuzione di frequenza.
Nel caso di una variabile, è un po’ più complesso, perchè dobbiamo contare quante
volte si presenta un valore.
Es: una classe di 20 persone, si misura il peso, 8 persone pesano 60 kg, 8 è la
frequenza.
Se abbiamo molte modalità di variabili, ci conviene raggruppare le frequenze in
intervalli o classi.
Le condizioni affinchè siano validi sono:
-il n° di classi non deve essere nè troppo elevato nè troppo basso (tra 5 e 20)
-l’ ampiezza delle classi sarebbe meglio siano uguali
-devono essere mutualmente esclusivi ovvero una variabile x deve comparire in una
sola classe
-non deve causare ambiguità
Innanzitutto bisogna ordinare i valori, per ottenere il valore minimo e il valore
massimo. Il campo di variazione, ovvero l’ ampiezza totale si ottiene sottraendo al
valore massimo il valore minimo.
E’ importante da capire il concetto dei limiti tabulati e dei limiti reali.
CLASSE LIMITI TABULATI LIMITI REALI
1 33-46 32,5-46,5
2 47-60 46,5-60,5
Ma dove va 46,5? La regola dice che i limiti reali inferiori sono compresi nella classe,
i limiti reali superiori, non sono compresi nella classe. Quindi 46,5 va nella seconda
classe, se fosse stato 46,999999 sarebbe rimasta nella prima.
FREQUENZA CUMULATA
Si usa se la variabile si usa almeno nella scala ordinale, e è la somma totale della
frequenza assoluta dell'elemento della serie preso in esame e di tutte le frequenze
assolute dei valori che lo precedono. Può essere espressa anche in percentuali.
TABELLE A ENTRATA MULTIPLA
Nelle tabelle ad entrata multipla vengono sintetizzate informazioni provenienti da due
o più variabili. I dati contenuti sono frequenze e indicano quante osservazioni
presentano una particolare combinazione delle modalità delle variabili che stiamo
cercando.Quando abbiamo due variabili costruiamo una tabella a doppia entrata o di
contingenza, in cui su ogni riga sono rappresentate le categorie di una delle due
variabili, su ogni colonna le categoria dell’ alttra.
RAPPRESENTAZIONI GRAFICHE
La tabella ci permette di rappresentare la quantità di informazioni che riteniamo utile
in sufficiente dettaglio. Ma se siamo interessati ad altri aspetti, come la forma di
distribuzione di frequenza, e dobbiamo quindi usare una rappresentazione grafica.
DIAGRAMMA A BARRE
Per rappresentare dati misurati su scala nominale o ordinale si usa il diagramma a
barre. E’ costituito da due assi, verticale e orrizontale, sull’ orrizontale vengono
riportate le categorie della variabile, su quella verticale la frequenza osservata.
GRAFICO A TORTA
Nel grafico a torta l’ ampiezza dell fette è rappresentata dalla frequenza, e il numero
delle fette dalle categorie della variabile.
RAPPRESENTAZIONI GRAFICHE DELLE TABELLE DI CONTINGENZA
Si possono utlizzare i diagrammi a barre affiancati o poligoni cumulativi.
STATISTICA DESCRITTIVA
La statistica descrittiva è la branca della statistica che studia i criteri di rilevazione,
classificazione, sintesi e rappresentazione dei dati appresi dallo studio di una
popolazione o di una parte di essa (detta campione).
Si differenzia dalla statistica inferenziale che si basa sullo studio di un campione,
trae informazioni sui cambiamenti del campione stesso.
INDICATORI DI TENDENZA CENTRALE
Gli indicatori di tendenza centrale consentono di sintetizzare un insieme di misure
tramite un unico valore rappresentativo, è un indice che riassume e descrive i dati e
dipende dalla scala di misura dei dati in oggetto.
Abbiamo:
-MODA:corrisponde al valore più frequente. Se si parla di distribuzione di frequenza
in classe si parla di classe modale.Unimodale se è un unico valore, bimodale se due
valore. E’ poco informativo
-MEDIANA: corrisponde al valore che occupa la posizione centrale in una
disposizione ordinata, ed è il valore al di sopra e al di sotto del quale sta il 50% dei
casi,il valore che divide esattamente la distribuzione.
Quando il n° dei casi è dispari, si sommano il n° dei soggetti + 1 , diviso 2.
Se il n° dei soggetti è pari il numero che otteniamo non è intero, quindi dobbiamo
fare la semisomma dei due casi centrali.
Si usa dalla ordinale in su.
-MEDIA: La media rappresenta il baricentro di una distribuzione di valori e potrebbe
quindi essere considerato il fulcro grazie al quale i valori posti su un ideale leva
stanno in equilibrio orrizontale.
Si applica solo alle scale quantitative ed è datta dalla somma dei valori diviso il n°
dei casi. Di contro ha che è sensibile ai valori estremi, perchè è una somma, quindi
delle volte non può darci informazioni esaurienti.
Quindi per capire il rapporto che c’è tra i valori e la media, dobbiamo utilizzare gli
indici di dispersione.
INDICI DI DISPERSIONE
Consente di descrivere la variabilità all’ interno della distribuzione tramite un unico
valore.
CAMPO DI VARIAZIONE: In statistica, il campo di variazione è il più semplice indice
di variabilità ed è dato dalla differenza tra il valore massimo di una distribuzione ed il
valore minimo. Esso può essere definito anche come intervallo di variabilità o
gamma.
DIFFERENZA INTERQUARTILE: Differenza tra il primo e il terzo quartile, ovvero
rappresenta l’ ampiezza della fascia dei valori che contiene la metà centrale dei
valori osservati. Limite: non tiene conto di cosa accade nella zona centrale e agli
estremi della distribuzione.
SCOSTAMENTO SEMPLICE MEDIO: media della somma degli scarti dei valori dalla
media.
VARIANZA: scostamento semplice medio al quadrato, permette di evidenziare i
valori più grandi. Maggiore è la varianza, più i casi sono distanti dalla media.
DEVIAZIONE STANDARD è la radice quadrata della varianza. Ha unità di misura
uguale alla media quindi è più confrontabile con essa.
COEFFICIENTE DI VARIAZIONE:rapporto tra media e dev. standard.
INDICI DI POSIZIONE
Servono per standardizzare le distribuzioni per renderle confrontabili.
In statistica, gli indici di posizione sono indici che danno un'idea approssimata
dell'ordine di grandezza dei valori esistenti.
Requisiti: distribuzione ordinata di frequenza, almeo scala ordinale.
QUARTILI: si divide la distribuzione in 4, rappresenta il 25% dei valori.
DECILI: distribuzione divisa in 9 punti con 10 intervalli
QUANTILI
Sono utili per avere un’ idea della variabilità di una distribuzione.Si ordinano le
categorie, si calcolano le frequenze cumulate e si identifica la posizione occupata dal