Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
DESCRITTIVA MONOVARIATA
Definizione di statistica: insieme di metodologie e tecniche per la trattazione quantitativa dei fenomeni osservabili nella realtà sociale, in natura e in laboratorio.
I 4 elementi base sono:
- Popolazione statistica (U): collettivo delle unità statistiche su cui interessa un particolare fenomeno. Insieme delle unità statistiche sulle quali interessa studiare il fenomeno.
- Fenomeno statistico (X): fenomeno d'interesse per la statistica e sono diversi a seconda della diversa natura del fenomeno. Si presentano con una molteplicità di manifestazioni, non con un'unica modalità.
- Manifestazione/modalità (x): modalità in cui si manifesta il fenomeno. Può essere svariate cose come un attributo o categoria (talvolta ordinabile), un numero o insieme di numeri (interi o reali a seconda che si conti o si misuri).
- Numerosità di U (N): numero intero positivo (può
essere anche considerato come infinito). È il numero di unità statistiche che compongono la popolazione.
Su U di numerosità N sono presenti le manifestazioni x del fenomeno X.
Classificazione dei fenomeni statistici
QUALITATIVI (fenomeni che si manifestano nella popolazione osservata attraverso attributi o categorie, qualità). Possono essere:
- ordinali (si manifestano con attributi e categorie che si possono ordinare secondo un qualche criterio oggettivo e convenzionalmente accettato).
- categoriali (non c'è un criterio oggettivo per ordinare le categorie).
QUANTITATIVI (si manifestano nella popolazione osservata attraverso numeri). Possono essere:
- discreti (possiamo contare, enumerare).
- continui (si possono misurare con una unità di misura o con un intervallo).
Scale di modalità o di rilevazione
Sono costituite dall'insieme di tutte le diverse manifestazioni di X su U. Devono rispettare due principi generali:
esaustività (deve prevedere tutte le possibili manifestazioni di X che potenzialmente si possono osservare su U) e mutua esclusività (la scala con cui si effettua la rivelazione deve prevedere modalità che si escludono a vicenda senza possibilità di confusione e ambiguità). Si dice scala dicotomica (o binaria) una SdM con solo due modalità.
Le scale di modalità QUALITATIVE (se le modalità sono attributi o categorie). Si dividono in:
- scale qualitative ordinali quando sono ordinabili secondo un criterio oggettivo o convenzionalmente accettato.
- sconnesse quando le categorie non possono essere ordinate secondo un criterio oggettivo (es scala dicotomica, 2 sole modalità, come fenomeno qualitativo genere M o F).
Le scale di modalità QUANTITATIVE (le modalità sono numeri). Si dividono in:
- scale quantitative rapporto (l'origine è 0 e ha un significato assoluto, cioè assenza del fenomeno)
- non rapporto
I fenomeni quantitativi possono essere rilevati con scale qualitative e viceversa. Ad esempio il fenomeno reddito mensile è quantitativo, ma può essere rilevato con una scala qualitativa (alto, basso). Il fenomeno deve essere ordinale.
Il fenomeno esito dell'esame è qualitativo perché dipende dal giudizio del professore ma si rileva con una scala quantitativa.
Infine vi sono fenomeni discreti che paiono continui, ad esempio il reddito ma ho bisogno di un'unità di misura.
Variabile statistica v.s.
Una variabile statistica è l'insieme di k coppie come "modalità-frequenza" tale che la somma delle frequenze assolute è uguale alla numerosità di U. Il primo elemento della coppia è la manifestazione del fenomeno, il secondo è la frequenza con la quale si presenza nella popolazione.
Distribuzioni di frequenze
Il risultato dellarilevazione è una serie di modalità xi che si manifestano su N. Questi vengono definiti dati grezzi i quali hanno l'obiettivo di far emergere dati e informazioni utili a descrivere il comportamento di X su U. La frequenza assoluta (fi) di ciascuna modalità osservata xi è il numero di unità statistiche, tra le N osservate, che manifesta quella modalità xi di X. L'insieme delle k frequenze (assolute) è detta distribuzione di frequenze assolute di X su U. Sono sempre numeri interi e la somma è pari a N. Non sono confrontabili fra popolazioni di numerosità diversa: sono direttamente influenzate da N e non sono nemmeno valutabili. Per fare dei confronti servono indicatori relativi, per fare delle valutazioni servono degli indicatori normalizzati. Quindi per confrontare popolazioni con numerosità diversa occorre costruire le frequenze relative. La frequenza relativa (pi) associata alla modalità xi è il
rapporto tra le frequenze assolute e la numerosità N. (formula: f = n/N). La colonna delle frequenze relative costituisce la distribuzione di frequenze relative di X su U. Attraverso questa distribuzione possiamo anche confrontare popolazioni con dimensioni diverse.
Frequenze percentuali: sono le frequenze relative moltiplicate per 100. Sono sempre comprese tra 1 e 100 e la loro somma è pari a 100.
Le frequenze cumulate si hanno quando il fenomeno è almeno ordinale (qualitativo ordinale o quantitativo) quindi possiamo cumulare le frequenze associate alle modalità inferiori di xi costruendo le frequenze cumulate che possono essere di due tipi. Le frequenze cumulate assolute (Fi) sono numeri compresi tra 0 e N. Σfi = f1 + f2 + ⋯ + fn = ∑f i=1
Le frequenze cumulate relative (PHI φi) permettono il confronto tra popolazioni di numerosità diversa. Sono comprese tra 0 e 1. Φi = f1 + f2 + ⋯ + fi/N⋯ + fn = ∑f i=1
1 �� = �Su un istogramma sono rappresentate come aree anche le frequenze cumulate assolute o relative. L’istogramma permette il calcolo delle frequenze cumulate per qualunque valore del fenomeno quantitativo continuo X. Il calcolo avviene sotto l’ipotesi di uniforme distribuzione. Sulle ascisse mettiamo gli intervalli e sulle ordinate mettiamo le densità di frequenza.
Fra le frequenze assolute e relative e le corrispondenti frequenze cumulate esiste una relazione biunivoca, ovvero data una distribuzione è possibile passare all’altra e viceversa. Se conosciamo le frequenze assolute o relative possiamo ottenere le cumulate, sommando e se conosciamo le cumulate possiamo riottenere le frequenze sottraendo.
Intervalli
I fenomeni quantitativi continui si rilevano con degli intervalli. In questo caso la variabile statistica non dice in che modo sono distribuite le unità statistiche all’interno dell’intervallo. Allora si può ricorrere a due
ipotesi: ipotesi del valore centrale si assegna a ciascuna unità statistica dell’intervallo o (x*i=xl+xL/2). un unico punto all’interno dell’intervallo stesso. In questo modo si supera il problema dell’ignota distribuzione di frequenze all’interno degli intervalli. Questo di solito fa riferimento a fenomeni con intervalli di ampiezza uniforme. Si utilizza un diagramma a bastoncini. fi
ipotesi della distribuzione uniforme possiamo assumere che le siano distribuite in modo uniforme ed equidistante lungo tutto l’intervallo. Questo è utilizzato di più quando gli intervalli sono di ampiezza diversa. L’ampiezza dell’intervallo è la differenza tra l’estremo superiore e l’estremo inferiore �� −��. Si utilizza un istogramma.
Densità di frequenza phi �� (intervalli) Per riuscire a confrontare due intervalli tra di loro abbiamo bisogno della densità di frequenza che è la frequenza
dell'intervallo depurata dall'influenza dell'ampiezza. Èxl= È/È - [assoluta]. Il concetto di densità di frequenza può essere anche rappresentato utilizzando le frequenze relative [È/È - È = È /(È - È) = È]. È una distribuzione per fenomeni quantitativi continui. Le densità di frequenza sono numeri reali e positivi. Le densità di frequenze sono utili quando le ampiezze degli intervalli sono diverse e quindi rendono difficile l'interpretazione delle frequenze. Un intervallo ampio è meno denso di un intervallo più stretto e le densità di frequenza servono per individuare l'intervallo con densità maggiore. Siccome la distribuzione di frequenza in un intervallo è ignota, si adotta l'ipotesi della distribuzione uniforme. La migliore rappresentazione grafica è l'istogramma. Per rappresentare la distribuzione difrequenze assolute si pongono gli intervalli sulle ascisse e la densità di frequenza sulle ordinate. Se si vogliono rappresentare le frequenze relative, si pongono le densità di frequenze relative sulle ordinate. L'area totale sottesa all'istogramma è pari a N se si rappresentano le frequenze assolute, mentre è pari a 1 se si rappresentano le relative. Grafici Il metodo più opportuno per disegnare e per capire meglio una variabile statistica è attraverso i grafici. Sulle ordinate scriviamo le modalità (o gli intervalli) e sulle ascisse le variabili. Istogramma viene usato con i caratteri quantitativi continui. Sull'istogramma le aree sono le frequenze, sappiamo che tutta l'area dell'istogramma vale N. In un istogramma le frequenze sono rappresentate come aree. Diagramma a bastoncini viene usato con i caratteri quantitativi discreti. Diagramma a barre viene usato con i caratteri quantitativi discreti o continui.qualitativi ordinali. Areogramma viene usato con i caratteri qualitativi categoriali.
Valori medi: moda, mediana, media
I valori medi sono valori che mettono in evidenza un particolare aspetto del comportamento di X su U. Su un fenomeno quantitativo continuo posso calcolare moda, mediana e media. Su un fenomeno qualitativo rilevato con scala sconnessa posso calcolare solo la media. Su un fenomeno ordinale posso calcolare solo la moda e la mediana.
Moda (x0)
La moda di una variabile statistica è la modalità a cui è associata la frequenza più elevata tra le k osservate. La moda si può calcolare per ogni tipo di fenomeno. Se gli intervalli sono di ampiezza differente, è necessario usare la densità di frequenza. Chiamiamo intervallo modale quello a cui è associata la densità phi ϕi più elevata tra le k osservate. Talvolta la v.s. è