Statistica
Insieme di strumenti logici e matematico-probabilistici finalizzati all'analisi di dati. Formalmente: media gestione di dati per l'inferenza.
Insieme e campione
- Insieme - campione (estrazione) - dati osservati
- Matrice dei dati (tabella)
- Unità (sottoinsieme osservabili)
- Carattere (quale)
- Modalità del carattere (tipo di variabile)
x Caratteri: Qualitativi (attributi), Quantitativi (misure).
- Sconnessi (colonie di scimpanzé)
- Ordinati (titolo di studio)
- Attributi (qual)
- Misure (quant)
Statistica descrittiva univariata
Analisi di 1 solo carattere estratto dalla matrice dei dati.
- x Organizzati i dati → tabella → usando nozioni di frequenza
Simboli che usiamo:
- n: = n° unità statistiche
- k: = n° di modalità differenti
- Xi = singoli valori (i=1, 2, …, k)
- Xi = modalità distinte (i=1, 2 … k)
- ni = frequente
Frequenza assoluta = n che presentano data modalità 【ni】 (ni ≥ 0 interi). Frequenza relativa ≈ n nel totale dei presentati della modalità (Fi); Fi = ni / n, 0 ≤ Fi ≤ 1. Frequenza percentuale = pi = fi ⋅ 100%. Frequenza cumulata = numero e frazione di > n che presentano data modalità "inizio o uguale" alla corrispondente: Assoluta cumulata Nj = Σ Nj+1 = n; Σ F = 1.
N.B. Ha senso calcolare x caratteri quantitativi o quantitativi ordinabili. Se carattere presenta molte modalità, si possono accorpare in classi; che devono essere:
- Attenzione all'ampiezza delle classi
- Senza sovrapposizioni (distintive)
- Esaustive (cfr: contengono min e max)
- Disattendendo causì a destra (hi+1)
- → Densità di frequenza (di) = mi o fi / di o di dove ai = hi - hi-1
Grafici
- x Caratteri qualitativi ▪ diagrammi a torta ▪ diagrammi a rettangoli separati
- Quantitativi discreti / continui ▪ diagrammi a bastoncini ▪ istogrammi
- Grafici delle freq. cumulative ▪ Grafico a gradini
Indici di posizione
✦ Evidenziano caratteristiche essenziali sulla distribuzione del carattere → possibilità di confronti tra distribuzioni differenti. ✦ È una funzione dei dati.
Proprietà
- Interno forsine: L'indice di posizione deve essere compreso tra il Min e il Max valore osservato, xmin≤ xMED≤ xMax
- Omotomicità: Se una variabile statistica ha tutte le modalità
- Omolificanza: Se la modalità di una v.s. x sono tutte moltiplicate per una quantità g il valore dell'indice di posizione si moltiplica per quale variabile si può ottenere moltiplicando per c > indice x.
N.B. La proprietà 1 è irriducibile. ⚠️ Se oltre alla 1) valgono la 2) e la 3) si ha indice di posizione in senso stretto.
Statistica
Studio di statistiche sociali e naturali. Fornitura di mezzi per la gestione dei dati.
Matrice dei dati (Data Matrix)
- Unità statistiche o osservabili
- Caratteri
- Modalità dei caratteri
- Caratteri: Qualitativi (Attributi), Quantitativi (Misure)
- Quantitativi: Discreti (Insieme finito, numeri interi), Continui (Insieme infinito, numeri reali)
Statistica descrittiva univariata
Analisi di 1 solo carattere. x = organizzare i dati → tabella → usando nozioni di frequenza. Simboli che si usano:
- n = n° di unità statistiche
- k = n° di modalità differenti
- Frequenza assoluta: ni unità di carattere analizzato (ni ≥ 0, interi)
- Frequenza relativa: Fi = ni / N
- Frequenza percentuale: Pi = Fi • 100%
- Frequenza cumulata: Nk = N, Fk = 1
Se carattere presenta molte modalità, si possono accorpare in classi; devono essere:
- Senza sovrapposizioni (disgiunte)
- Esaustive
- Densità di frequenza (di) = mi / δi = fi / δi dove δi = hi
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.