Introduzione dati
Campionario, scelgo di sottoporre un parte di
questa parte
Il mio campione è rappresentativo della popolazione solo
quando questo è un campione casuale semplice!
- può essere con reinserimento
- può essere senza reinserimento
Viene campione seleziono il mio campione che numeri viene scelto
secondo un determinato criterio, un esso se non può
rappresentativo più rappresentativa per essere X - M e il mio
schema di comportamento.
Variabile
Variabile, caratteristica assunta da una unità statistica, può
essere qualitativa e quantitativa.
- qualitativa
- non misurabile
- namo o attenente
- nominali
- ordinali
- quantitativa
- misurabile
- discreta, quando derivata
- da un controllo presideniale
- solo valore ruteri
- continua, può avere qualsiasi
- valore all'interno di un
- determinato intervallo.
introduzione dati
campionamento, scelgo un sottoinsieme che mi permette di fornire delle conclusioni generalizzando a tutta la popolazione.
Il mio campione è rappresentativo della popolazione solo quando questo è un campione casuale semplice!
- può essere con reinserimento
- può essere senza reinserimento
Un campione seleziono e mi compone delle nuvole viene scelto rispondendo un determinato criterio, se esso sarà così può rappresentare in maniera accurata la popolazione.
Ogni campione può rappresentare un errore X-M è il mio errore di campionamento.
Variabile, caratteristica assunta da una unità statistica, può essere qualitativa e quantitativa.
- qualitativa
- non misurabile
- nome o etichetta
- nominali
- ordinali
- quantitativa (misurabile)
- discreta, può essere derivato da un conteggio possedendo solo val an ridotte
- continua, può avere qualsiasi valore all'interno di un determinato intervallo.
scale di misura
- scale nominale, prevede un'organizzazione dei dati in categorie che prevedono l'etichetta e il permesso di fare comparazioni; non esistono ordini, sono solo semplici nomi.
- scale ordinale, prevede di ordinare e categorizzare secondo un ordine crescente o decrescente, come si passa dallo storico al studente incredibile che ha maggiori capacità!
- scale di intervalli, prevede un'operazione che detta un valore che possa essere calcolato tra le differenze tra due campioni della scala di misura.
- scale di rapporti, prevede che i dati possano esprimere rapporti tra di loro, una persona dice che, per esempio una "0" è doppio del 1, tutte scale misurano con le stesse unità, con rapporti più costante lo zero cosa che non è presente nelle altre scale da misurare!
importante!!
Statistica Descrittiva
Media μ (pop) ̅ (campione)
Mediana
Moda
Rettilinea
Devianza
Varianza
Dev. St. o Comparare
Forme distribuzione
- determinare max e min
- calcolare range (max-min) di emissione
- calcolare intervallo [3,322log10]
- calcolare ampiezza
- costruire le classi
Quartili
Intervallo I Q = Q3-Q1
BartBi Outlier
Frequenza
Statistica descrittiva dati in classi
Media nelle classi
Xi: valore centrale classe
first + last / 2 = Xi
X̄ = Σ Xi · mi / Σ mi
- 2.4 - 4 - 9.6
- 3.2 - 4 - 12.6
- 3.9 - 1 - 3.9
- 2.7 - 3 - 8.1
Mediana nelle classi
Posizione Mediana m/2 + (m/2 + 1)
mediana valore = Li + (m/2 - F/fm) · l dove
- Li = limite inferiore classe Mediana
- F = somma frequenze delle classi inferiori oltre classe Mediana
- fm = frequenza classe Mediana
- l = ampiezza classe Mediana
Moda nelle classi
Si ricerca la classe modale ovvero la classe con la f più alte.
Statistiche campionarie
X̄, s, s²
Parametri della popolazione
μ, σ, σ²
Coefficiente di variazione
CV = S/X̄
Per campione
σ/μ
per popolazione
statistica descrittiva definiz. 1.2
Devianza
- ∑(xi - μ)2 per pop
- ∑(xi - x̄ )2 per campione
Varianza
σ2 = ∑(xi - μ)2 fi per pop/N
s2 = ∑(xi - x̄ )2 fi per campione/N - 1
Dev. st
σ = √∑(xi - μ)2 fi per pop/N
σ = √∑(xi - x̄ )2 fi per campione/N - 1
grafici di dati
Istogramma
sull'asse delle frequenze posso avere quelle relative Fi/totale o le frequenze in percentuale
F/totale x 100; osservazione breve su distribuzione dei dati, ottimo analisi rappresentativa
Poligono di Frequenza
spostato dei prende le ascisse in corrispondenza dei punti medi delle classi
Curva ogiva
grafico delle frequenze cumulate o curve ogiva; spostato lineare crescente; ci consigliare sulle frequenze anclie delle classi, posso osservare tale quanti valori sono un unitario valore
Diagramma Ramo-Foglia
- Ramo Cunità|Foglie [decimi]
3 | 2 9
4 | 4
5 | 9
6 | 3 3 4 7 8 8
7 | 0
Multiformato utile in campo probabilinte, utile suo verso poiché stabile ci su frequenze osservazione. In questo mandano le ante ;) metere alci dati, sono alcune cerozzioni per esempez
Diagramma a Torta
- Incendi
- Esui de Fuoco
- Veleno
- Incidenti
Diagrammi di Dispersione
diagramma in cui ogni punto dipende da 2 variabili, e se più trai posso una retta di correlazione. Perché si vedere qualcosa tra due due variabili si è pueda ni pi del corraleazione.
Redie, dev.st e varianza distribuzione probabilità
µ = ∑x · P(x)σ² = ∑(x - µ)² P(x)√ = √∑(x - µ)² · P(x)
µ, σ², √ binomiale
µ = m · pσ² = m · p · q√ = √m · p · q
p = probabilità di esito
q = probabilità evento contrario q = 1 - p
Probabilità binomiale
P(x) = mCx = m!/(m-x)! x! · px · qm-x
Distribuzione binomiale
Calcolare le probabilità con una distribuzione binomiale posso usar excel sulla variabile con calcolando le probabilità. Command su dei dati. X ≤ 3300 custodia!
Distribuzione Poisson
P(x) = µx · e-µ / x!
µ = µ(m · p)σ² = µσ = √µ
X indossa il numero di volte in cui si è verificato un evento in un determinato intervallo di tempo, spazio, volume, o t.zo.
Le probabilità di Poisson viene usato per il calcolo delle probabilità di tale evento io su determino intervallo specifico.
Distribuzione Normale
Trasformo una distribuzione normale in una distribuzione standard normale con processo come parallelizzare (μ=0 σ=1).
μ -> X
σ2 -> S2
σ -> S
Intervallo confidenza per media con T Stode.
X Medio Campionario
- E=Zα/2 · σ/√n
X - E
X + E
Estremo Intervallo Confidenziale
Excel Socio = INV.NORMS
Intervallo Confidenza per Media con σ (non nota)
Dato che non conosciamo sempre σ allora possiamo usare la s del campione per stimarlo, facendo ciò usiamo uno stimatore di un parametro "incertezza" per far ciò si crea un intervallo più ampio usando valore critico tα/2 invece che z di distribuzione normale t Student.
t = X̄ - N / s / √m
gradi libertà = m - 1
E = tα/2, s / √m
X̄ - E X̄ + E estremi intervallo
t ha m-1 gradi di libertà
α =
- 5,0% = 0,05
- 1,0% = 0,01
- 10,0% = 0,10
Scelta Distribuzione
σ nota?
- Sì
- proporzione nodale
- Sì - usare z distribuzione normale
- No - m>30?
- No
- proporzione nodale
- No
- proporzione nodale
- Sì - m>30?
- No - usare distribuzione t Student (rari fattori)
- proporzione nodale
dev.st delle medie campionare / √m n.del campione singolo
Federico T.
p̂= proporzione
m/ totale
E= zz/2 √p̂p̂/m
p̂: statistico p popolazione
q̂: statistico q popolazione= 1-q̂
zz/2 numerici solito
50%: = 1,96 1% valore assoluto
p̂-E p̂+E estremi intervallo confidenza.
Test statistico z per la media:
z calcolato= zz/2 = 1,96 (2=5%(0,05))
Test z = X̄-μ
σ/√m valori standard
Se
Test z > z calcolato
allora
rifiuto l'ipotesi nulla con una probabilità di errore inferiore al 5% (per esempio)
p value = area a destra o sinistra o entrambi ee
ht2 delle code dello statistic test
se p value ≤ 2 allora rifiuto Ho!!!
Test statistico t per le Medie/μ
σnon nota
α=0,05
test t: ⨯̄ - μ/S/√n errore standard
- se test t > t critico allora rifiuto e ipotesi H0
Test z per la differenza tra Medie
- z critico α=0,05 5% (z ≥ 1,96)
- test z: (⨯̄1 - ⨯̄2) - (μ1 - μ2)/√σ̄1²/N1 + σ̄2²/N2
μ1 - μ2 = 0 spesso
- se test z > z critico allora rifiuto e ipotesi H0
Test t per la differenza tra Medie
t critico α=0,05 5%
INVL.T(α,gl)
test t: (⨯̄1 - ⨯̄2) - (μ1 - μ2)/√S²p + S²p
gl = n1-1, n2-1 e il più piccolo tra i due gradi di
- se m1 ≠ m2 allora
- s²p = [m(1−d)s1² + (M2-1)s2²]
m1 + m2 - 2 = gl
- stima congiunta varianza
- se σ̄1 = σ̄2 se σ̄1 ≠ σ̄2
e non sono uguali?
test t: (⨯̄1 - ⨯̄2) - (μ1 - μ2)/√S²p + S²p
α=0,05 5%
- se test t > t critico allora rifiuto e ipotesi H0
Test t dati appaiati con σ non nota
t = d̄/Sd̄ calcolato con n = m - 1 gradi di libertà
d̄ = Σdi/m media delle differenze
Sd̄ = √(Σ(di - d̄)²/(m - 1))
t critico 2 o 0,05 5% = INV.T se Test t > t critico rifiuto H0!!!
Test z per una proporzione
Test z = p - π/√π(1-π)/m
Se Test z > Z critico rifiuto H0!!!
Test chi quadro χ² per l'indipendenza
Test per l'indipendenza di due variabili
d = 0,05 sono fisse ipotesi vale H0 e ipotesi alternativa H1
Statistica Test χ² = Σ(fo - fe)²/fe
χ² critico = 0,05 = INV.CHI
Se Test χ² > χ² critico allora rifiuto H0
Esempio
Tabella Frequenze Osservate
- Ramo SX 14 6 20
- Ramo DX 19 21 40
- Totali 33 27 60
Esempio
Tabella Frequenze Attese
- Totali 33 27 60
1) La distribuzione Chi-quadro è asimmetrica al contrario della distribuzione normale e t student.
2) I valori di una distribuzione chi-quadro possono essere o uguali o far apparire maggiore di 0.
3) La distribuzione chi-quadro è differente in base ai gradi di libertà, all'aumentare dei gradi di libertà essa si avvicina alla forma della normale.
Tutti i valori sono non negativi
Correlazione e regressione lineare semplice
Se due variabili sono quantitative continue, e non x ed y sono distribuite secondo una normale allora posso calcolare rs definito come correlazione lineare semplice di Pearson
rs = CoeV (x,y) / √(Dev(x) x Dev(y)) = ∑ (x - x̄) (y - ȳ) / √(∑ (x - x̄)2 x ∑ (y - ȳ)2)
r = 1 (perfect positive)r = -1 (perfect negative)
Correlazione (valore x; valore y)
- Positiva se ≈ vicino 1
- Negativa si ≈ vicino -1
- Nessuna correlazione se r uguale a 0.
Posso calcolare un test di ipotesi sul coefficiente che mi trovi se per valore di esso non è solo frutto del caso.
test t = r √(m-2 / 1-r2)
=TEST.T
tcritico =⍺ = 0,05 oppure 0,01 e m-2 gradi di libertà.
Se test t > tcritico rifiuto ipotesi nulla ovvero con la correlazione tra le due variabili x e y.
=TEST.T (valori X colonna; valori Y colonna; numero di coda; 1) dati opposti2) dati non opposti e stesso variabile3) dati non opposti e no stesso variabile)