Anteprima
Vedrai una selezione di 9 pagine su 37
Appunti teorici di Statistica Pag. 1 Appunti teorici di Statistica Pag. 2
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Appunti teorici di Statistica Pag. 6
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Appunti teorici di Statistica Pag. 11
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Appunti teorici di Statistica Pag. 16
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Appunti teorici di Statistica Pag. 21
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Appunti teorici di Statistica Pag. 26
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Appunti teorici di Statistica Pag. 31
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Appunti teorici di Statistica Pag. 36
1 su 37
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

DESCRITTIVA MONOVARIATA

Definizione di statistica: insieme di metodologie e tecniche per la trattazione quantitativa dei fenomeni osservabili nella realtà sociale, in natura e in laboratorio.

I 4 elementi base sono:

  • Popolazione statistica (U): collettivo delle unità statistiche su cui interessa un particolare fenomeno. Insieme delle unità statistiche sulle quali interessa studiare il fenomeno.
  • Fenomeno statistico (X): fenomeno d'interesse per la statistica e sono diversi a seconda della diversa natura del fenomeno. Si presentano con una molteplicità di manifestazioni, non con un'unica modalità.
  • Manifestazione/modalità (x): modalità in cui si manifesta il fenomeno. Può essere svariate cose come un attributo o categoria (talvolta ordinabile), un numero o insieme di numeri (interi o reali a seconda che si conti o si misuri).
  • Numerosità di U (N): numero intero positivo (può

essere anche considerato come infinito). È il numero di unità statistiche che compongono la popolazione.

Su U di numerosità N sono presenti le manifestazioni x del fenomeno X.

Classificazione dei fenomeni statistici

QUALITATIVI (fenomeni che si manifestano nella popolazione osservata attraverso attributi o categorie, qualità). Possono essere:

  • ordinali (si manifestano con attributi e categorie che si possono ordinare secondo un qualche criterio oggettivo e convenzionalmente accettato).
  • categoriali (non c'è un criterio oggettivo per ordinare le categorie).

QUANTITATIVI (si manifestano nella popolazione osservata attraverso numeri). Possono essere:

  • discreti (possiamo contare, enumerare).
  • continui (si possono misurare con una unità di misura o con un intervallo).

Scale di modalità o di rilevazione

Sono costituite dall'insieme di tutte le diverse manifestazioni di X su U. Devono rispettare due principi generali:

esaustività (deve prevedere tutte le possibili manifestazioni di X che potenzialmente si possono osservare su U) e mutua esclusività (la scala con cui si effettua la rivelazione deve prevedere modalità che si escludono a vicenda senza possibilità di confusione e ambiguità). Si dice scala dicotomica (o binaria) una SdM con solo due modalità.

Le scale di modalità QUALITATIVE (se le modalità sono attributi o categorie). Si dividono in:

  • scale qualitative ordinali quando sono ordinabili secondo un criterio oggettivo o convenzionalmente accettato.
  • sconnesse quando le categorie non possono essere ordinate secondo un criterio oggettivo (es scala dicotomica, 2 sole modalità, come fenomeno qualitativo genere M o F).

Le scale di modalità QUANTITATIVE (le modalità sono numeri). Si dividono in:

  • scale quantitative rapporto (l'origine è 0 e ha un significato assoluto, cioè assenza del fenomeno)
  • non rapporto
(l'origine non è assoluta ma convenzionale -es. gradi).
I fenomeni quantitativi possono essere rilevati con scale qualitative e viceversa. Ad esempio il fenomeno reddito mensile è quantitativo, ma può essere rilevato con una scala qualitativa (alto, basso). Il fenomeno deve essere ordinale.
Il fenomeno esito dell'esame è qualitativo perché dipende dal giudizio del professore ma si rileva con una scala quantitativa.
Infine vi sono fenomeni discreti che paiono continui, ad esempio il reddito ma ho bisogno di un'unità di misura.
Variabile statistica v.s.
Una variabile statistica è l'insieme di k coppie come "modalità-frequenza" tale che la somma delle frequenze assolute è uguale alla numerosità di U. Il primo elemento della coppia è la manifestazione del fenomeno, il secondo è la frequenza con la quale si presenza nella popolazione.
Distribuzioni di frequenze
Il risultato dellarilevazione è una serie di modalità xi che si manifestano su N. Questi vengono definiti dati grezzi i quali hanno l'obiettivo di far emergere dati e informazioni utili a descrivere il comportamento di X su U. La frequenza assoluta (fi) di ciascuna modalità osservata xi è il numero di unità statistiche, tra le N osservate, che manifesta quella modalità xi di X. L'insieme delle k frequenze (assolute) è detta distribuzione di frequenze assolute di X su U. Sono sempre numeri interi e la somma è pari a N. Non sono confrontabili fra popolazioni di numerosità diversa: sono direttamente influenzate da N e non sono nemmeno valutabili. Per fare dei confronti servono indicatori relativi, per fare delle valutazioni servono degli indicatori normalizzati. Quindi per confrontare popolazioni con numerosità diversa occorre costruire le frequenze relative. La frequenza relativa (pi) associata alla modalità xi è il

rapporto tra le frequenze assolute e la numerosità N. (formula: f = n/N). La colonna delle frequenze relative costituisce la distribuzione di frequenze relative di X su U. Attraverso questa distribuzione possiamo anche confrontare popolazioni con dimensioni diverse.

Frequenze percentuali: sono le frequenze relative moltiplicate per 100. Sono sempre comprese tra 1 e 100 e la loro somma è pari a 100.

Le frequenze cumulate si hanno quando il fenomeno è almeno ordinale (qualitativo ordinale o quantitativo) quindi possiamo cumulare le frequenze associate alle modalità inferiori di xi costruendo le frequenze cumulate che possono essere di due tipi. Le frequenze cumulate assolute (Fi) sono numeri compresi tra 0 e N. Σfi = f1 + f2 + ⋯ + fn = ∑f i=1

Le frequenze cumulate relative (PHI φi) permettono il confronto tra popolazioni di numerosità diversa. Sono comprese tra 0 e 1. Φi = f1 + f2 + ⋯ + fi/N⋯ + fn = ∑f i=1

1 �� = �Su un istogramma sono rappresentate come aree anche le frequenze cumulate assolute o relative. L’istogramma permette il calcolo delle frequenze cumulate per qualunque valore del fenomeno quantitativo continuo X. Il calcolo avviene sotto l’ipotesi di uniforme distribuzione. Sulle ascisse mettiamo gli intervalli e sulle ordinate mettiamo le densità di frequenza.

Fra le frequenze assolute e relative e le corrispondenti frequenze cumulate esiste una relazione biunivoca, ovvero data una distribuzione è possibile passare all’altra e viceversa. Se conosciamo le frequenze assolute o relative possiamo ottenere le cumulate, sommando e se conosciamo le cumulate possiamo riottenere le frequenze sottraendo.

Intervalli

I fenomeni quantitativi continui si rilevano con degli intervalli. In questo caso la variabile statistica non dice in che modo sono distribuite le unità statistiche all’interno dell’intervallo. Allora si può ricorrere a due

ipotesi: ipotesi del valore centrale si assegna a ciascuna unità statistica dell’intervallo o (x*i=xl+xL/2). un unico punto all’interno dell’intervallo stesso. In questo modo si supera il problema dell’ignota distribuzione di frequenze all’interno degli intervalli. Questo di solito fa riferimento a fenomeni con intervalli di ampiezza uniforme. Si utilizza un diagramma a bastoncini. fi

ipotesi della distribuzione uniforme possiamo assumere che le siano distribuite in modo uniforme ed equidistante lungo tutto l’intervallo. Questo è utilizzato di più quando gli intervalli sono di ampiezza diversa. L’ampiezza dell’intervallo è la differenza tra l’estremo superiore e l’estremo inferiore �� −��. Si utilizza un istogramma.

Densità di frequenza phi �� (intervalli) Per riuscire a confrontare due intervalli tra di loro abbiamo bisogno della densità di frequenza che è la frequenza

dell'intervallo depurata dall'influenza dell'ampiezza. Èxl= È/È - [assoluta]. Il concetto di densità di frequenza può essere anche rappresentato utilizzando le frequenze relative [È/È - È = È /(È - È) = È]. È una distribuzione per fenomeni quantitativi continui. Le densità di frequenza sono numeri reali e positivi. Le densità di frequenze sono utili quando le ampiezze degli intervalli sono diverse e quindi rendono difficile l'interpretazione delle frequenze. Un intervallo ampio è meno denso di un intervallo più stretto e le densità di frequenza servono per individuare l'intervallo con densità maggiore. Siccome la distribuzione di frequenza in un intervallo è ignota, si adotta l'ipotesi della distribuzione uniforme. La migliore rappresentazione grafica è l'istogramma. Per rappresentare la distribuzione difrequenze assolute si pongono gli intervalli sulle ascisse e la densità di frequenza sulle ordinate. Se si vogliono rappresentare le frequenze relative, si pongono le densità di frequenze relative sulle ordinate. L'area totale sottesa all'istogramma è pari a N se si rappresentano le frequenze assolute, mentre è pari a 1 se si rappresentano le relative. Grafici Il metodo più opportuno per disegnare e per capire meglio una variabile statistica è attraverso i grafici. Sulle ordinate scriviamo le modalità (o gli intervalli) e sulle ascisse le variabili. Istogramma viene usato con i caratteri quantitativi continui. Sull'istogramma le aree sono le frequenze, sappiamo che tutta l'area dell'istogramma vale N. In un istogramma le frequenze sono rappresentate come aree. Diagramma a bastoncini viene usato con i caratteri quantitativi discreti. Diagramma a barre viene usato con i caratteri quantitativi discreti o continui.

qualitativi ordinali. Areogramma viene usato con i caratteri qualitativi categoriali.

Valori medi: moda, mediana, media

I valori medi sono valori che mettono in evidenza un particolare aspetto del comportamento di X su U. Su un fenomeno quantitativo continuo posso calcolare moda, mediana e media. Su un fenomeno qualitativo rilevato con scala sconnessa posso calcolare solo la media. Su un fenomeno ordinale posso calcolare solo la moda e la mediana.

Moda (x0)

La moda di una variabile statistica è la modalità a cui è associata la frequenza più elevata tra le k osservate. La moda si può calcolare per ogni tipo di fenomeno. Se gli intervalli sono di ampiezza differente, è necessario usare la densità di frequenza. Chiamiamo intervallo modale quello a cui è associata la densità phi ϕi più elevata tra le k osservate. Talvolta la v.s. è

Dettagli
Publisher
A.A. 2020-2021
37 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher ilacon di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Mecatti Fulvia.