vuoi
o PayPal
tutte le volte che vuoi
Introduzione alla statistica descrittiva
- La popolazione di riferimento è l'insieme di individui che ci interessa studiare. Gli elementi che la costituiscono si chiamano unità statistiche. La loro numerosità è il numero N che li quantifica.
- Le variabili statistiche sono le caratteristiche X rilevate sulle unità tecniche. Esse si dividono in:
- Variabili quantitative: sono espresse da numeri e possono essere:
- Discrete: sono esprimibili con numeri interi o naturali.
- Continue: sono esprimibili con numeri reali.
- Variabili qualitative: sono definite da aggettivi o espressioni e possono essere:
- Nominali: non esiste nessun ordinamento naturale.
- Ordinali: invece possono essere ordinate.
- Variabili quantitative: sono espresse da numeri e possono essere:
- La modalità è il valore distinto assunto da una variabile.
- La classe di rappresentare è un insieme di un certo numero di modalità delle variabili che sono consecutive nella linea ordinata. È costituita da un'ampiezza ai e da diviso d di delle classi legate dalle formule: fi = ai * di (aree dell'istogramma).
- La frequenza assoluta è il numero di unità statistiche che soddisfa la stessa variabile statistica.
- La frequenza relativa è il rapporto tra le frequenze assolute e le numerosità: fi = Fi / N.
- La funzione di ripartizione empirica applicata ad un punto x è data dalle frequenze di tutti i dati minori di x divise per le numerosità: Fn(x) = ∑Fi / N per xi ≤ x.
- La frequenza cumulata è data delle somme delle frequenze delle modalità inferiori o uguali ad un certo valore delle variabile. Può essere relativa e assoluta:
- Un diagramma a bastoncini è tipico delle variabili discrete.
- Un istogramma permette di avere una regione di insieme sulle le distribuzione di frequenze e si applica anche a classi continue.
Indicatori di posizione (o centralità)
Per sintetizzare dati forniti da un solo parametro che ci indichi dove le distribuzioni si posizionano, ci serviamo degli indici di centralità:
- Le medie per le modalità qualitative sommarie e le mode
- Le mediane per le quantitative
La media aritmetica
La media è il rapporto tra la somma di valori di tutte le unità statistiche per il numero: n∑i=1 xi / n = xi n∑i=1 xifi / n
Nei dati raggruppati in classi si usa l’approssimazione: m(x) = m∑i=1 (ai + ai-1) / 2 m∑i=1 fi / m∑i=1 fi
Se tutti i dati sono uguali, allora anche le medie avranno quel valore.
Dim.
Siano x1, x2, ..., xn dati riordinati: x1 = x2 = ... = xn = k Allora
m(x) = m∑i=1 xi/ n = m∑i=1 k / n = mk / n = k (v.d.)
La media è compresa tra il più piccolo e il più grande dei valori osservati.
Dim.
Voglio dire che m(x) ≤ max(xi) min(xi) ≤ m(x) ≤ min(xi) ∀ i = 1, ..., m, sebbene 0 ≤ ∑i=1 n(xi) ⇒ min(xi) ≤ m(x)
Voglio dire che ∑i=1 m = max(xi) ∀ i = 1, ..., m ∑i=1 m > max(xi) ⇒ max(xi) ≥ m ∑i=1 n(xi) ⇒ max(xi) ≥ m m(x) ≤ max(xi) (c.v.d.)
Conclusione
min(xi) ≤ m(x) ≤ max(xi)
La media di una trasformazione lineare di dati è la stessa trasformazione applicata alla media dei dati:
zi = axi + b m(z) = a·m(x) + b
Dim.
Siano zi = axi + b, a ∈ ℝ, b ∈ ℝ, ∀ i = 1, m
m(z) = ∑ xi (axi + b) / n = a·∑ xi + n·b / n = a·∑ xi / m + mb / n = a·m(x) + b (c.v.d.)
La media delle differenze dei dati dalle medie (valore degli scarti) è nulla.
Dim.
Siano x1, x2, xn dati:
Voglio dim. che ∑ xi - x̄ / n = 0
In generale i con:
- fij è le generica frequenza congiunta;
- fi è la frequenza totale della distribuzione di Y condizionata a X = xj (è la riga della c.d. distrib. marginale);
- fj è la frequenza totale della distribuzione di X condizionata a Y = yi (è la colonna delle fj, per i = 1,... r, è la distribuzione marginale di X);
- fi = fi fj / f
- fj = fi / fiN
Le frequenze attese f'ij sono quello che ci aspettiamo nel caso di indipendenza completa
f'ij = (fi + fj) / N
Il χ2 di Pearson e la V di Kremer
Per misurare le dipendenze tre due variabili sono usualmente il χ2 di Pearson die a fare è:
χ2 = Σ Σ (fij - f'ij)2 / f'ij = N (Σ Σ (fij/N - f'ij/N)2 / f'ij) = N Σ Σ ((fij/N - pij)2 / pij - i[ Σ Σ (fij/N - fij/N)2 / N]
Se c'è indiapindenza stocastica esso vale 0; altrimenti più crescene sono meno una.
Un indice normalizzato della dipendendenza è la V di Kremer, definite come:
V = N : min (r-4, c-4)
V &E(one; (E0; 1))
Per une tabella 2x2: vale χ2 = N(ad-bc)2/r2c1c2
Inálit:
χ2 = N Σ (fjf'ij - f'ij)2 / f'ij
= N Σ (Σ (fij - f'ij)2 /(fj + f'ij)= ≠ N (a2 / f1 + b2 / fe + c2 / fc
Modello di Regressione Non Lineare Semplice
Un modello non lineare presenta parametri in funzioni non lineari; se ammette si piega le variabili riportate con un'unica variabile esplicativa.
Per risolverlo ci sono leggi da parametri per quali volatore per "i residui" si fanno dei cambi di variabile per ottenere equazioni lineari nei parametri, e si applica, come per il modello dei minimi quadrati.
- Yi = Xiε = Log Y = logʸ + a log x = α (ε = log y, log x = α, y = z, log x = w)
∑n (Yi) ∑ Log X + β X i + ε
Oss: L'veata della varianza dei residui (ver(ε)) = (∑Xi) e' del coefficiente Rʹ (μ = Σi) / n
non forniscono risultati confrontabili con altri modelli lineari, inveca si deve usare questo:
AR(7) = ∑(Yi - Ȳi)/(n-1) ed Rʹ = Rʺ/VER(Y)
Oss: Per un modello lineare, l'invarianza si a sempre nei seguenti ipotesi:
- i) la media delle medie degli errori εi in Yi + ΒXi + εi
- ii) un inchiostiscotati degli verreri errore le varievarie costante (av_Σ Ei) = 0
α(t=βZ) Yi = fm(mor)-r = α tonu + uno componente erattica εi (es)
Oss: i residui Yi = Yi = Yi - Y̆i = Yi - Σi#B coef - a
la compamento erattica
.
.
Modello di Regressione Lineare Multipla
Un modello di regressione multipla espiega una varietà risposta y e partire de più variabili esplicative X₁, X₂, ..., Xk.
- Ȳi = β1X1 + β2X2 + ... + βkXi + Εi
- I coefficienti (β1, β2, ..., βk) cha si vogliono trovare come detti di regressione nerervi; le compannosi è robeliche i (μ) (βX2X1X21₂i) + @igh(t)= s
- in forma maricale X sia le matrici del dissimj (X)
- Y2 = β1X1 + β3X1 + X2 + ... + ... + Y2tsim
→ Y = X · (β) + ε = y(μ - ε)
.
Si vuole sora dei parametri β1, β2 ..., βk minimizzino le summe delle quessatoi degli occarti tra verdi ossanctao q e shelo y'ero
min ottennedo ... reessiom ... tommel't