vuoi
o PayPal
tutte le volte che vuoi
VARIABILITÀ E DEVIANZA
VARIABILITÀ: Devianza = 2 * frequenza * (valore - media)
VARIANZA (V) = somma delle devianze / numero di valori o totale frequenze
SCARTO QUADRATICO MEDIO = radice quadrata della varianza
COEFFICIENTE DI VARIAZIONE (CV) = media / scarto quadratico medio
La distribuzione che presenta maggiore variabilità è quella con il CV più alto.
CONCENTRAZIONE
Per calcolare l'indice di Gini:
- Ordinare i soggetti rispetto al reddito, in maniera crescente
- Calcolare A = somma dei redditi
- Calcolare Qi per ogni riga = somma del valore e dei valori precedenti / A
- Calcolare Fi per ogni riga = numero di soggetti / totale soggetti
- Calcolare Fi - Qi per ogni riga
- Calcolare l'indice di Gini (R) = somma di Fi - Qi fino al penultimo valore / somma di Fi fino al penultimo valore
Se R = 0, c'è equidistribuzione
Se R = 1, c'è massima concentrazione
Per verificare se c'è equidistribuzione, la somma dei redditi divisa per il totale dei soggetti deve corrispondere ai redditi; altrimenti non c'è equidistribuzione.
c'è equidistribuzione DOPPIE DISTRIBUZIONI Costruire TABELLA A DOPPIA ENTRATA - Colonne con una variabile - Righe con altra variabile - Fare colonne e riga con somma di righe e colonne (= frequenze marginali di riga e frequenze marginali di colonna). - La somma delle frequenze all'interno della tabella (quindi escluse le frequenze marginali) è uguale alla somma delle frequenze marginali di riga ed è uguale alla somma delle frequenze marginali di colonna CON RICLASSIFICAZIONI - Rifaccio le tabelle per ogni variabile e le raggruppo in classi, indicando la frequenza assoluta per ogni classe - Creo tabella a doppia entrata e su righe/colonne inserisco le classi anziché le variabili Come sapere se c'è dipendenza tra le due variabili - Creare altra tabella ricopiando le variabili e le frequenze marginali di riga e di colonna - Calcolare i valori all'interno: (frequenza colonna * frequenza riga) / totale frequenza di colonna/riga - Se i valori trovatisono uguali ai valori della prima tabella, allora c'è indipendenza. Se sono diversi, c'è dipendenza. CALCOLARE NUOVA MATRICE DELLE CONTINGENZE - Ricreo la tabella iniziale cambiando i valori all'interno, con questo calcolo (frequenza osservata - frequenza attesa)^2 / frequenza attesa La frequenza attesa è quella della tabella creata per sapere se c'è dipendenza tra le variabili. - CHI-QUADRATO (x^2) (valori della somma di tutte le contingenze tabella sopra). Se maggiore di zero, c'è dipendenza. Se è uguale a zero c'è indipendenza. - INDICE DI CONT. QUADRATICA (Phi φ^2) = √(CHI QUADRATO / tot) Se maggiore di zero, c'è dipendenza. - INDICE DI CRAMER (V) = √(CHI QUADRATO / (minimo tra H-1 e K)) V=0 indipendenza; V=1 dipendenza perfetta H= n. modalità prima variabile K= n. modalità seconda variabile PROBABILITÀ P(E) = (casi favorevoli) / (casi possibili) CON VARIABILI CASUALI (ALEATORIE) DISCRETE Comedefinire se c'è una distribuzione di probabilità:
- La somma delle probabilità deve essere uguale a 1
- Ogni probabilità deve essere maggiore/uguale a 0
VALORE ATTESO O MEDIA
E( X)=(valore di X*probabilità)+(...)
FUNZIONE DI RIPARTIZIONE calcolata in tabella per ogni riga
P( X ≤ Xi)=cumulata della probabilità( valore corrispondente+ valori precedenti)
DISTRIBUZIONE DI BERNOULLI
x 1-x=x)=π (1-π )
P( X per X=0,1=π probabilità di successo
VALORE ATTESO / MEDIA → ( )=E X pari a π
VARIANZA → ( )=π*(1-π )
V XDISTRIBUZIONE BINOMIALE
( )n -xx n)= *π *(1-π)P( X X per x = 0,1
Questa formula viene utilizzata anche per calcolare la probabilità con cui X = x n*numerix numeri inferiori
Per calcolare si fa: inferiori*( )*numerix*numeri n-x inferiorix
VALORE ATTESO→ E( X)=n*π
VARIANZA→ (X
La distribuzione di Poisson descrive la probabilità di avere n eventi in un dato periodo di tempo, con un tasso di evento medio di lambda.
La formula per calcolare la probabilità P(X=x) è:
P(X=x) = (e^(-lambda) * lambda^x) / x!
dove:
- e è la costante di Nepero (~2.71828)
- lambda è il tasso di evento medio
- x è il numero di eventi
- x! rappresenta il fattoriale di x