Che materia stai cercando?

Anteprima

ESTRATTO DOCUMENTO

Uso dei Grafici

- Torta -> Qualitativo Nominale

- Barre -> Qualitativo Ordinale: es. Scuola Obbligo<diploma<laurea triennale<titolo post laurea

- Bastoncini -> Quantitativo Discreto

- Istogramma -> Quantitativo Continuo

- Scatter Plot/Grafici a Dispersione ->2 Fenomeni quantitativi (MATRICE)

- Grafico a Bolle - 2 fenomeni quantitativi (TABELLA CONGIUNTA)

>

Scale di Modalità

1) Qualitative: Si manifestano attraverso attributi o categorie.

• X: Genere

• Y: Squadra

• S: Titolo di Studio

- Qualitativo Ordinale: rilevabili con scala qualitativa ordinale. Es. Scuola

Obbligo<diploma<laurea triennale<titolo post laurea.

- Qualitativo Categoriale: rilevabile con scala qualitativa sconnessa. Es. Si/No Vero/Falso

Femmina/Maschi

2) Quantitative: Si manifestano attraverso numeri o quantità.

• Numero accessi in un dato giorno

• Temperatura massima nel giorno x

-Quantitativo di Rapporto: es. # di accessi ad un sito: 0(Nessuno), 1 2 3

-Quantitativo di Non Rapporto: es. da 0° a 100° dove lo 0° non rappresenta l’assenza ma un

valore (non consentono la divisione).

Sotto Categorie

- Fenomeni Continui: si rilevano mediante la misurazione.

- Fenomeni Discreti: Si rilevano mediante conteggio/enumerazione. Es. # esami registrati, # furti

motorini.

Frequenze e Variabili

f

La Frequenza Assoluta di ciascuna modalità osservata xi è il numero di unità statistiche

i

che, fra le N osservate manifesta quella modalità xi di X.

La Variabile Statistica è un insieme di k coppie del tipo “modalità frequenza” le modalità possono

avere natura varia mentre le corrispondenti frequenze sono numeri interi positivi o nulli la cui

somma riproduce la numerosità N di U. c

vs= f i

i=1

La Frequenza Relativa è il rapporto (divisione) fra la frequenza assoluta di xi e la numerosità N.

p f i

i= N F

Le Frequenze Cumulate sono la somma delle frequenze assolute o la somma delle

i

Φ

frequenze relative i

Il Valore Centrale si calcola nei fenomeni quantitativi continui quando la frequenza all’interno

dell’intervallo è ignota. x x

+

l L

¿

x =

i 2

La Densità di Frequenza di un intervallo è la frequenza di un intervallo depurata dall’influenza

dell’ampiezza. f i

φ =

i x x

+

L l

Moda, Mediana e Media Aritmetica

La Moda/Norma è la modalità a cui è associata la frequenza più elevata tra le frequenze relative

p . La moda nei fenomeni continui quantitativi continui è sugli intervalli.

i

La Mediana di X è la modalità che, nell’ordinamento, occupa la posizione centrale, divide

l’ordinamento in due gruppi ugualmente numerosi.

La Media Aritmetica è il valore medio conosciuto c

1 ∑

x x f

́ = i i

N i=1

Proprietà:

- Proprietà di internalità: il valore della media aritmetica è sempre compreso tra la più piccola e la

più grande delle modalità osservate di X

- Proprietà di omogeneità: se X e Y sono due fenomeni diversi ma collegati fra loro dalla formula:

Y=aX dove a è un qualsiasi numero diverso da 0, si dice che Y è una trasformazione di scala di

X; la media aritmetica di Y si ottiene dalla media aritmetica di X con la stessa identica

trasformazione cioè:

y x

́ =a ́

- Proprietà associativa: la media di X è sempre raggiungibile dai dati aggregati, basta calcolare la

x

́

media delle medie delle sottopopolazioni. Si tratta di usare le medie parziali al posto delle

j

x N f

modalità di e le numerosità parziali al posto delle frequenze .

i j i

r

1 ∑

x x N

́ = ́ j j

N j=1

- Proprietà di linearità: se X e Y sono due fenomeni diversi ma legati dalla formula Y=a+bX con a

e b numeri reali qualunque b diverso da 0, si dice che Y è una trasformazione lineare di X. La

media aritmetica di Y si ottiene dalla media aritmetica di X con la stessa identica trasformazione

cioè: y x

́ =a+b ́

- Proprietà di annullamento degli scarti: i valori sopra e sotto media si compensano, cioè se si

sommano tutti i k scarti ponderati si ottiene sempre 0. Questa proprietà è valida solo per la media

aritmetica. c

∑ x x f

( )

− ́ =0

i i

i=1

- Proprietà di mantenimento e di equidistribuzione del totale: la somma di tutti i valori di X su

tutte le N unità osservate prende il nome di totale di X:

c

∑ x f di X su U

=Totale

i i

i=1

Variabilità

Si considerano solo i fenomeni quantitativi Variabilità o dispersione di X: attitudine di un

fenomeno quantitativo a manifestarsi, sulle N unità di U, con modalità fra loro diverse e distanti.

Il range è una misura assoluta di variabilità infatti:

• Vale 0 se la v.s. è degenere cioè quando X si manifesta con un'unica modalità, perciò

x =x

max min x x

>

• Assume valori positivi quando X si manifesta con più modalità diverse e perciò . In

max min

x x

questo caso il valore assunto dal range cresce all’aumentare della differenza fra e

max min

cioè all’aumentare della variabilità di X

Deviazione standard o scarto quadratico medio di X

Misura la variabilità di X considerando la dispersione dei suoi valori intorno al suo valor medio. σ è

espresso nella stessa unità di misura con cui è rilevato X e in cui è espressa la media. Ci dice che

X si manifesta su U con valori che in media distano da x medio per ±σ.

√ c

1 ∑

σ x x ² f

́

( )

= − =¿

i i

N i=1

√ c

1 ∑ 2

x f x ²

́

i i

N i=1

La varianza è una misura di variabilità, vale 0 in caso di assenza di variabilità e assume valori

positivi e crescenti all’aumentare della variabilità di X in U. Non è una buona misura di variabilità:

l’ordine di grandezza è l’unità di misura sono alterati dal quadrato.

c

1 ∑

2

σ x x ² f

( )

= −́ =¿

i i

N i =1

c

1 ∑ 2 2

x f x

−́

i i

N i=1

La Devianza è una misura di variabilità, vale 0 in assenza di variabilità e assume valori positivi e

crescenti al crescere della variabilità. Non è una buona misura di variabilità perché è al quadrato.

In più è un totale di quadrati anziché una media perché non essendo divisa per N non è mediata

su tutta U.

c

2

N σ x x ² f

( )

= − ́

i i

i=1

Coefficiente di Variazione

Il cv è un indice puro cioè senza unità di misura, è confrontabile fra fenomeni con diverso ordine di

grandezza e diversa unità di misura oppure rilevati su popolazioni diverse. È inoltre valutabile

come percentuale della media.

σ

cv= x

́

x

́ =40.625

σ =18.23

cv=0,449

L’età di X presenta variabilità su U che le età dei giurati sono disperse intorno all’età media 40,625

mediamente per ±18.23 anni. La variabilità di X su U è il 44,9% dell’età media. Il cv è risultato

minore di 1, cioè non siamo in grado di stabilire se il criterio adottato dagli organizzatori per

formare la giuria rispetta la regola “variabilità non inferiore al 50%”

Tabella di massima variabilità

Per avere la percentuale di variazione di σ in se e non sulla media bisogna ottenere la deviazione

max dalla tabella di massima variabilità:

N xi x

( )

−́

max

f = xi −xi

max min

Normalizzazione di σ

σ ← calcolato su tabella osservata

σ ← calcolato su tabella teorica

max

Frequenze Congiunte e Marginali

Le frequenze congiunte sono il risultato della somma all’incrocio della i-esima riga e la j-esima

f

colonna e sono chiamate .

ij r

∑ f =¿

ij

j=1 c

∑ ¿

i =1

c r

∑ ∑ f =N

ij

i=1 j=1 f

Le frequenze marginali sono la somma della riga o della colonna Frequenze marginali di X

i.

f frequenze marginali di Y.

.j f i.

Le frequenze marginali relative di X .

N

f i. =¿

N

c

∑ ¿

i=1 c

1 1

∑ f ∙ N

= =1

i.

N N

i=1

Le frequenze condizionate di Y|xi: f ij (x100 danno le % di riga)

f i.

Le frequenze condizionate di X|yi: f ij (danno le % di colonna)

f .j

Indipendenza Statistica

Due variabili sono Statisticamente Indipendenti se fra X e Y non esiste alcuna relazione

statistica. Il metodo per stabilire se X e Y sono statisticamente indipendenti consiste nel

confrontare le frequenze condizionate, che informano sul comportamento di un fenomeno

condizionatamente alle modalità dell’altro.

f f

ij . j

=

Condizioni di indipendenza statistica: per tutti gli indici i=1….c e j=1…r

f N

i.

Frequenze teoriche di indipendenza statistica:

f f

i. . j

¿

f =

ij N

Indice di connessione: ¿

c r f ²

( )

−f

ij ij

2 ∑ ∑

χ = ¿

f

i=1 j=1 ij

2

( )

c r f

∑ ∑ ij

N

¿ −1

f f

i=1 j=1 i. . j

Il valore massimo del χ²: è pari a N moltiplicato per il più piccolo fra il numero delle righe e il

numero delle colonne, -1: N x min {r-1, c-1}.

Se χ² = 0,3661, ci dice che la connessione tra X e Y è pari circa il 37% della connessione

massima. La connessione massima è χ²= 100% e sarebbe una relazione statistica perfetta. Cioè

se fosse sufficiente conoscere X per stabilire Y e viceversa

Indice di connessione normalizzato

¿r −1,

χ²

N × min ¿c−1

{ }

Medie e varianze marginali e condizionate

Se X e Y sono connessi, quindi non sono statisticamente indipendenti, possiamo definire

Media Marginale di Y:

r

1 ∑

y y f

́ = j . j

N j=1

Varianza Marginale di Y:

r

1 ∑

2 2

σ y y f

( )

= − ́

Y j . j

N j=1

Se la tabella è sconnessa

r

1 ∑ 2 2

y f y

¿ − ́

j . j

N J=1

Varianza marginale di X:

c

1 ∑

2

σ x x ² f

( )

= −́

X i i.

N i=1

Se la tabella è sconnessa:

c

1 ∑ 2 2

x f x

¿ −́

i i.

N i=1

Prima sommare i quadrati poi dividere per 8 e infine sottrarre per la media al quadrato

x

Media Condizionata di Y dato :

i r f

∑ ij

y y

́ ∨x =

i j f

j=1 i.

r

1 ∑ y f

¿ j 1j

f j=1

i.

(Indice i è fisso)

x

Varianza Condizionata di Y dato :

i

r f

2 ij

σ y y ²

( )

= − ́

Y j x

∨x f

i i

j=1 i. =

j−¿ y

́ x i

y ¿

¿

¿

r

1 ∑ ¿

f i. j=1

(Indice i è fisso)

x

Coefficiente di variazione delle V.S. condizionate Y| :

i

√ 2

σ Y ∨x

cv Y x

∣ =

( ) i

i y

́ ∨x i

Associatività delle medie condizionate

y

́ ∨x

Di medie condizionate ne abbiamo k ciascuna si riferisce ad una sottopopolazione di

i

f

numerosità . Si possono sintetizzare in una media, la media aritmetica delle medie

i.

condizionate, ponderata con le numerosità delle sottopopolazioni che coincide con la media

marginale. La proprietà associativa che vale per la media aritmetica non vale per la mediana e la

moda:


ACQUISTATO

2 volte

PAGINE

17

PESO

39.93 KB

PUBBLICATO

+1 anno fa


DETTAGLI
Esame: Statistica
Corso di laurea: Corso di laurea in sociologia
SSD:
A.A.: 2016-2017

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher stearbitrio di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Milano Bicocca - Unimib o del prof Mecatti Fulvia.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Statistica

Riassunto esame Statistica, prof. Mecatti, libro consigliato Statistica di base - Come, quando, perché, Fulvia Mecatti
Appunto
Riassunto esame MacroEconomia, Docenti Resmini e Vittucci , libro consigliato Principi di economia, Frank, Bernanke, McDowell, Thom
Appunto
Riassunto esame Elementi di Economia-Microeconomia, prof. Resmini, libro consigliato Principi di economia 4/ed, Robert H. Frank, Ben S. Bernanke, Moore McDowell, Rodney Thom e Ivan Pastine
Appunto
Riassunto esame Statistica, prof. Mecatti, libro consigliato Statistica di base - Come, quando, perché, Fulvia Mecatti
Appunto