Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Statistica
Nomenclatura:
- Fenomeni aleatori: L’oggetto di studio della statistica sono tutti i processi (naturali, tecnici) nei quali non vi è un modello matematico deterministico che li descriva completamente. Vi è invece una certa incertezza che li caratterizza (e il fenomeno può assumere diversi valori).
- Statistica: È la disciplina che ha lo scopo di studiare un fenomeno aleatorio. Studia come produrre e analizzare inferenze informative e comunicare.
- Statistica descrittiva (dal fenomeno ai dati): Descrive i dati attraverso operazioni di sintesi.
- Statistica inferenziale (dai dati al fenomeno): Indica un modello aleatorio adatto per il fenomeno considerato analizzando la "similitudine".
- Variabile aleatoria: È lo strumento formale che descrive il fenomeno aleatorio. Si indica con V.A. (ad esempio X al caso generico univoco). Se si parla del fenomeno in astratto si usa la lettera maiuscola X, Y, Z. Se si parla di dati osservati del fenomeno si usa la lettera minuscola x1, x2, x3, y1, y2, y3.
Le variabili aleatorie si possono classificare in questo modo:
- V.A. di tipo qualitativo (si esprimono attraverso proprietà che rappresentano qualità e giudizio)
- sconnesse (non vi è ragione di ordinare tra valori). Es: colore occhi.
- ordinate (c’è una relazione naturale tra valori. Natura tabulare). Es: qualità alimenti.
- dichotomica (c’è una relazione d’ordine dipendente dalla scelta intrinseche). Es: riuscire sull’esame/non cosa.
- V.A. di tipo quantitativo (si esprimono attraverso numeri)
- discreto (assume valori naturali e limitati, osservando da operazioni di conteggio). Es: # figli.
- continuo (assume valori presi in un insieme con va continuo). Es: temperatura.
Questa classificazione è utile anche per determinare gli strumenti da utilizzare e la complessità delle operazioni da svolgere.
- Popolazione: È l’insieme degli elementi che esprimono il fenomeno, attraverso cui il fenomeno è manifestato. (Si indica con X) Insieme di tutti gli elementi in studio.
- Campione: Elementi della popolazione osservabile su cui si studia il fenomeno per poi generalizzarlo quindi ciò.
Essere rappresentativo della popolazione (gli vocano X1, ..., Xn)
- Censimento: è la situazione in cui il campione coincide con la popolazione. È un'indagine molto costosa economicamente e di tempo, a volte è impossibile.
- Modalità: sono i diversi valori assunti da/v.a. una "moda" e un modo in cui si esprime il fenomeno.
- Spazio campionario: è l'insieme delle possibili "modalità" e si indica con R. X1 X in cui Xi è la v.a. con cui si indica la popolazione e X1, ..., Xn il campione di elementi.
- Analisi univariata: riguarda le variabili un'analisi unidimensionale per cui il fenomeno ha una sola proprietà.
- Analisi multivariata: riguarda le variabili più estorie multidimensionale per cui: si studiano più parametri sul fenomeno considerato es. peso e altezza, pressione di una persona.
- Distribuzione: è il modo in cui viene paramentrizzato un insieme di dati e rappresentato è una rappresentazione composita lo stesso termine si utilizza in probabilità ma in quel caso accanto ad "ottenere" diviene (un modello) da questi (dati).
- Nella creazione delle classi bisogna scegliere il numero di classi da prendere e l'ampiezza di una singola classe. I valori sperimentali che hanno due aleatorie di due classi a frequentiva variabile: non esiste un modo canonico per scegliere, dipende. si consiglia in parte
- Per confrontare le frequenze con origini alla classe i possiamo introduire una nuova quantità: densità (o intensità) (numero di)
- Di solito il numero di classi è più grande che 2, e per ammissioni il raggruppamento è di difficile interpretazione
Una volta che i dati sono stati eliminati tramite un paio attraverso distribuzioni si introduce la funzione di ripartizione empirica.
La funzione di ripartizione empirica si basa sui dati osservati e si definisce ordiniamento secondo una distribuzione con cui si lavora
-
Basata su distribuzione di frequenze
Inserire e l'exp non osservo elaboro Infatti nella cumare sono colletive solo alle modicchiahiosserviamo invic possio considerafi mi valora constanto i xeri Fmi(x) mi e come valore i duo parol sono su questa costruirana
Ho una funzione a gradinata
-
Basata su distribuzione in classi
Ogni cumulare è associata al suo corbello di Fei e messpera partendo da tutte le val: ci modo gradino relazione vi sono un sotto gruppo sicuramente mormero cercano vari vedendo il categorico un elemento di F, da Fa a
Ho una funzione lineare a tratti che collela le colletti F
Dotta la distribuzione in classi e puo seguiato tramite non quantitativi (gomini)
1) Consistenza o coerenza
M(i) è consistente ⇔ ∀ A ⊂ Rm A = {c, c, ..., c} allora Ψ(A) = c
Questa proprietà è assente da tutti i valori medi finora elencati (modo, mediana, media)
2) Monotonia
Det che siano A = (x1, ..., xm) B = (y1, ..., ym)si ordinano i dati fino ad ottenere A = (x(i)) e B = (y(i))
M(i) è monotono debole ⇔ M(A) ≤ M(B)
M(i) è monotono forte ⇔ M(A) < M(B)
Se m = m allora M(i) è monotono debole ⇔ M(A) ≤ M(B)
M(i) è monotono forte ⇔ M(A) < M(B)
OSSERVA:
- La mediana è monotona debole
- La moda non è monotona (forte o debole) infatti:
A = {23, 24, 27, 27}Moda (A) = 27
B = {25, 25, 28, 30}Moda (B) = 25
MA A ≰ₐ B
Se voglio tenere costante le superfici di m oggetti su cui la loro superficie totale è fissata.
Uso la funzione delle potenze delle loro aree quindi il valore medio corrispondente è la media quadratica.
Il valore medio si può ottenere anche come "centro" un baricentro intorno a cui ruotano dati che ho a disposizione.
Def:
A = (x1, ..., xm) campione (v.a. quantitative)
car(x) = 2/i=1 ∑ (xi - x)r si dice distanza di ordine r di A da un punto x
car si dice centro di ordine r di A
df dar(x) ≤ car(x) ∀ x ∈ R
Osserva
Al variare di r si ottengono diversi centri che interpretano come "medie" in quanto sintetizzano dati originali.
Se r=0
da(x) è la somma di ( | xi - x | ) r = 0
quindi la scelta più piccola si ottiene nel punto che appare più titoli tra possibili, questo è la moda:
problema: il valore si fa ottimale nel usando:
x0=moda
Se r=1 => x1=mediana (no uni)
Se r=2 => x2=media aritmetica
dm2(x) = 2/i=1 ∑ (xi - x)2 = m/i=1 ∑ (xi - x) - (x- - x + x - x)/i=1
= m/i=1(xi) + (x - x) + 2m/i=1(xi - x)(x - x)
= m/i=1 (xi) +... + 9 (xi - x)2
Osserva
- m/i=1((xi - x)2) = 0
- ma m/i=1((xi - x)2) ≠ 0
- xi - x- = ddf scarto dalla media