Estratto del documento

Parte B: distribuzione di frequenze

Creare tabella con frequenze assolute e relative

fi = si contano
Pi = fi / N

Carattere fi Pi
Modalità 1
Modalità 2
Totali 20 1

Elementi necessari per aerogramma

Bisogna trovare l'ampiezza degli angoli: αi = Pi · 360

Grafico a barre

Distribuzione con classi continue di ugual ampiezza
Trovare ampiezza delle classi: W = (valore max - valore min.) / n. classi

Carattere fi Pi
x0, x1
H
x1-x2
x2-x3
Totali 20 1

Istogramma

Per carattere quantitativo continuo o diviso in classi, si calcola la densità di frequenza e si assegna a tabella in classi
di = fi / w

La frequenza assoluta, w = ampiezza classe

La colonna più alta è la moda

Quartili

  • Modalità/valori che dividono la distribuzione in 4 parti.
  • Primo quartile: lascia il 25% delle frequenze alla sua sinistra e il 75% alla sua destra
  1. Calcolare su tabella le frequenze cumulate:

Q1 = estremo sinistro della classe + (frequenza relativa della percentuale - frequenza cum. in classe precedente) / (frequenza cum. del classe - frequenza cum. in classe precedente) * ampiezza classe

Mediana

Me = estremo sinistro della classe la cui frequenza cumulata è superiore a 0,50 + (0,50 - freq. cum. in classe precedente) / (freq. cum. in classe mediana - freq. cum. classe prec.) * ampiezza classe mediana
Il secondo quartile è la mediana: divide la popolazione in due gruppi di numerosità uguale
Il risultato sia della formula dei quartili che della mediana deve essere un valore compreso nella classe

Media

In distribuzione in classi:
M = Σi Xi * ki / N
N = numero esempi = 20
Xi è il valore centrale della classe = (estremo sinistro + estremo destro) / 2

Scarto quadratico medio

σ = √[Σi (Xi - M)2 * ki / N]
(Xi - M)2 * ki si calcolano in tabella e si fa somma

Coefficiente di variazione

cv = (σ / M) * 100 = %

Moda

  • Modalità/valore che si presenta con maggior frequenza
  • Non in classi: valore che si presenta con maggiore frequenza nelle fi
  • In classi: si fa riferimento a densità di frequenza → di = fi / ampiezza classe

Mo = valore centrale della classe con maggiore densità di frequenza, la calcolo in tabella

Simil tabella finale
Carattere fi pi Fi xi xi*fi (xi - M)2 (xi - M)2*fi di
160 - 170 3 0.15 0.15 165 495 156.3 468.9 0.2
170 - 180 9 0.45 0.60 175 1575 6.3 56.3 0.9
180 - 190 8 0.40 1.00 185 1480 56.3 450.0 0.8
Totali 20 1 3550 975.0

Parte C: tabella di contingenza

Per il carattere x in riga e y in colonna

Distribuzioni marginali
A B C Marginali riga
4 3 4 11
No 2 2 3 9
Marginali colonna 8 5 7 20

TABELLA IN IPOTESI DI INDEPENDENZA DEI CARATTERI

4,4 2,75 3,85 11
3,6 2,25 3,15 9
8 5 7 20

Esiste relazione tra i caratteri? Giustifica la risposta.
Vi è dipendenza tra i caratteri in quanto la tabella in ipotesi di indipendenza è differente da quella osservata.

Misura relativa di associazione

  1. Contingenze: differenza tra valore osservato e atteso in ipotesi di indipendenza
0,4 0,25 0,15 0
-0,4 -0,25 -0,15 0

SOMMA SEMPRE ZERO

Chi-quadrato

χ2 = Σi (c2 / F) c = contingenza quadrato
F = frequente atteso
In ipotesi di indipendenza χ2=0 / massimo non definito perché dipende da numerosità

Indice quadratico di contingenza

  1. I2C = χ2 / χ2 + N

I2CMAX = 1 / min(n, p) → Valore più piccolo tra no di colonne e di righe
I2CREL = I2C / I2CMAX
Valore compreso tra 0 e 1 = √( 1 / min(2, 3) ) → √( 1 / 2 ) → 0,7

Diagramma a dispersione

Diagramma cartesiano in cui ogni unità statistica viene rappresentata con un punto avente per coordinante i valori delle due variabili di riferimento

Retta di regressione

UNITÀ Xi Yi Xi - Mx Yi - My (Xi - Mx)2 (Xi - Mx)(Yi - My) Ŷ Ŷ - Y

  1. Determinare le medie: Mx = ΣXi / 5, My = ΣYi / 5
  2. Calcolare gli scarti dalla media di x e y → la somma è sempre zero
  3. Calcolare il quadrato dello scarto di x: (Xi - Mx)2 → la somma è la devianza
  4. Calcolare il prodotto tra gli scarti: (Xi - Mx)(Yi - My) → la somma è la covarianza

Equazione della retta di regressione

Ŷ = P0 + P1 × x
P1 = covarianza / devianza    coefficiente di regressione lineare
P0 = My - P1 × Mx    intercetta

Errori di previsione

Ŷ - Y su tabella

Rappresentazione grafica retta di regressione

Assegnare alle 2 variabili casuali e collocare Ŷ con equazione su una tabella

Calcolo combinatorio

Disposizioni

Per oggetti il cui ordine ha importanza

  • Senza ripetizione → Dn,k = n!/(n-k)! es.: lettere con destinatario in 10 cassette postali anonime
    D10,4 = 10!/(10-4)! = 10⋅9⋅8⋅7⋅6! = 5040= 64!
  • Con ripetizione → D'n,k = nk es.: lucchetto a 5 ruote numerate da 0 a 9
    D'10,5 = 105= 100000

Combinazioni

Per oggetti il cui ordine non ha importanza

  • Senza ripetizione → Cn,k = n!/(k!(n-k)!) es.: 3 volantini anonimi in 8 cassette postali anonime
    C8,3 = 8!/(3!(8-3)!) = 8⋅7⋅6⋅5!/3⋅2⋅1⋅5! = 336/6 = 56
  • Con ripetizione → C'n,k = (n+k-1)!/((n-1)! k!)

Permutazioni

Disposizioni in cui la formazione del gruppo richiede tutti gli elementi

Pn = n! es.: P7 = 7! = 7⋅6⋅5⋅4⋅3⋅2 = 5040

Se uno degli oggetti è fisso al primo posto: Pn-1 = (n-1)!
Se uno degli oggetti è fisso al primo oppure ultimo posto: P(n-1) + Pn-1 = 2Pn-1
es.: P7 = 6! = 6⋅5⋅4⋅3⋅2 = 720
P6 + P6 = 720⋅2 = 1440

es. 1: dimostra la validità Cn,k = Cn,n-k
si assegnano valori casuali a n e k → n = 5 k = 2
Cn,k = C5,2 = 5!/2!(5-2)! = 5!/2!3! = 5!/2!3!
Cn,n-k = C5,5-2 = C5,3 = 5!/3!(5-3)! = 5!/3!2!

Distribuzione binomiale

La probabilità di avere un certo numero di successi vale:

P(X=k) = (n)(k) ⋅ (π)k ⋅ (1-π)n-k
n: lanci totali
k: n. successi
π: probabilità successo

Esempio: lanciare dado regolare 6 volte; n. d. probabilità di ottenere la faccia 6 per 6 volte
n = 6    k = 6    π = 16    la faccia 6 compare una sola volta nel dado
P(4 su 6 volte) = P(X=6) = (6)(6) ⋅ ( 16 )6 ⋅ ( 56 )0 = 16666

Probabilità di ottenere numero minore di 3 non più di una volta
n = 6    K0 = 2    π = 13    i 2⁄6
Non più di una volta: 0 volte + 1 volta
P(k=0) + P(k=1) = (6)(0) ( 13 )0 ( 23 )6 + (6)(1) ( 13 )1 ( 23 )5 = ...

  • Probabilità di solo esiti favorevoli -> K=n
  • Solo esiti sfavorevoli -> K=0
  • Probabilità di avere un numero dispari di eventi favorevoli -> K1 = 1 K2 = 3 K3 = 5 fino a max di n
  • OPPURE = SOMMARE P(k=2 oppure k=4) = P(K2) + P(K4)

Esempio: in un lancio ripetuto di una moneta non truccata, calcolare la probabilità di ottenere 3 croci in 5 lanci
n = 6    K = 3    π = 12
P(k=3) = (6)(3) ⋅ ( 12 )3 ⋅ ( 12 )3 = 6!3! 3!1818 = 2064

Es. si esegue il lancio ripetuto di una moneta non truccata π = 1/2
È più probabile ottenere la sequenza TTCCTC o CTTCTT?
P(TTCCTC) = (1/2)3 ⋅ (1/2) ⋅ (1/2)2 = (1/2)6 = 1/64
P(CTTCTT) = 1/21/21/21/21/21/2 = (1/2)6 = 1/64

È più probabile la sequenza TTTTTT o TCTCTC?
Qualunque sequenza di esiti avrà la stessa probabilità di verificarsi
P(TTTTTT) = P(TCTCTC) = (1/2)6 = 1/64

Distribuzione normale

Per determinare le probabilità che si osservino i valori appartenenti a un determinato insieme

Problemi diretti

Si ha l'intervallo di x, si vuole sapere la probabilità

  • % dei casi con valore inferiore o pari a X1
  1. X→Z = X-M/σ → arrotondato al 2° decimale
  2. P: F(z) cercare valore nella tabella:
    • La parte intera e il primo decimale di z sulle righe.
    • Il secondo decimale di z sulle colonne
    • es.: F(1,28) = 0,9671 - non può essere più grande di 1!
  3. Trasferire in percentuale (es.: 96,71%)

Se z è negativo: F(z) = 1 - F(z) - Z diventa positivo

  • % dei casi superiori a X1
  1. X→Z = X-M/σ → arrotondato al 2° decimale
  2. P: 1-F(z) es. 1-F(0,7734) = 1-0.7734: 0,2266 = 22,66%
    • Se z è negativo: 1-F(-z) = 1-[1-F(z)]
  • % dei casi compresi tra X1 e X2
  1. Ordinare le x in senso crescente
  2. X2→Z2 = X-M/σ
  3. P: F(z2) - F(z1) es.: z1 = 0,75 z2 = 1,84 F(1,84) - F(0,75) = 0,9671 - 0,2266 = 74,05%
Anteprima
Vedrai una selezione di 4 pagine su 11
Formulario Statistica sociale per parte pratica dell'esame Pag. 1 Formulario Statistica sociale per parte pratica dell'esame Pag. 2
Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.
Formulario Statistica sociale per parte pratica dell'esame Pag. 6
Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.
Formulario Statistica sociale per parte pratica dell'esame Pag. 11
1 su 11
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/05 Statistica sociale

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher irene.riste di informazioni apprese con la frequenza delle lezioni di Statistica sociale e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli studi "Carlo Bo" di Urbino o del prof Corsi Mario.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community