Estratto del documento

Indagine statistica

Unità statistica: elemento sul quale viene effettuata la rilevazione (provino).

Popolazione: insieme delle unità statistiche.

Variabili

  • Quantitative: modalità = numeri reali, discrete (solo numeri naturali), continue (numeri con unità di misura).
  • Qualitative: modalità = attributi.

Scale di misura

Tipo di misurazione o insieme delle modalità adottato per l’osservazione di variabili:

  • Scala nominale: uso variabili nominali (binarie: sì/no o polinomiali) di modalità non ordinabile.
  • Scala ordinale: uso variabili ordinali di modalità ordinabile crescente/decrescente (nomi ordinabili).
  • Scala numerica:
    • Ad intervallo (variabili intervallari) se 0 non indica assenza del fenomeno (es. temperatura).
    • Di rapporto (variabili proporzionali) se 0 è univocamente definito (es. età).

Fasi indagine statistica

  • Definizione fonti dei dati: primarie (ex novo) o secondarie (da altri studi).
  • Definire tecnica d’indagine: intervista diretta, telefonica, questionari, dati amministrativi, osservazione diretta.
  • Selezione del campione: campionamento casuale estendendo risultati inferenza statistica (misuro precisione dati).
  • Rilevazione dati: rilevo e poi revisiono e faccio codifica dei dati.

Distribuzioni di frequenza

Descrivono come le variabili si distribuiscono nella popolazione:

  • Semplici: ho solo una variabile, ad ogni modalità faccio corrispondere la frequenza assoluta (numero di volte che la variabile si ripete).
  • Doppie: ho 2 variabili.
  • Multiple: ho più di 2 variabili.

Distribuzioni unitarie: elenco di tutti i valori osservati della variabile.

Frequenza relativa = frequenza assoluta / numerosità del collettivo.

Classi: intervalli di valori reali, per classificare le variabili quantitative.

Frequenza cumulata: assoluta o relativa, indica il peso della variabile minore o uguale a una certa soglia (il suo opposto è la retrocumulata).

Densità di frequenza = frequenza assoluta / ampiezza della classe.

Grafici

  • Per variabili quantitative continue: istogramma (classi-frequenza), poligono (classi-frequenza), ogiva (poligono cumulativo).
  • Per tutte le altre: diagrammi a barre, a torta, di Pareto (istogramma decrescente con sopra linea spezzata cumulata).

Sintesi e descrizione delle variabili mediante valori medi

Media aritmetica = Σ(xi*ni)/n oppure Σ(xi*fi) con fi = frequenza relativa, non va bene nel caso di valori estremi.

Mediana (Me) = valore centrale di un insieme di dati ordinati in modo crescente, per variabili quantitative e qualitative misurate su scala ordinale. Se n è dispari, la mediana si trova nella posizione (n+1)/2, se n è pari è la media tra n/2 e 1+n/2 se variabile quantitativa, se variabile qualitativa è uno dei due valori. Se ho le frequenze relative % cumulate allora la mediana è il valore con p% ≥ 50%.

Quantili: valori che dividono la distribuzione ordinata di una variabile quantitativa o qualitativa misurata su scala ordinale in un certo numero di parti di uguale numerosità (es. quartili: Q1, Q2, Q3, dividono la distribuzione ordinata in 4 parti).

Posizioni: Q1: (n+1)/4, Q2: (n+1)/2, Q3: 3(n+1)/4. Se ho le f% cumulate Q1 = valore con f% ≥ 25%, Q2 con 50%, Q3 con 75%.

Moda (Mo) = è la modalità cui corrisponde la frequenza assoluta o relativa più alta; la miglior misura di variabilità per la moda è la percentuale; minore è la % della moda, maggiore è la variabilità.

Nelle scale:

  • Scala nominale: uso moda.
  • Scala ordinale: uso moda, mediana, quantili.
  • Scala numerica: qualsiasi.

Forma di distribuzione:

  • Uniforme: quantili.
  • Asimmetrica: moda, mediana, quantili.
  • Simmetrica: media.
  • A J: mediana, quantili.
  • A U: quantili.

Descrizione delle variabili mediante misure di variabilità e studio di forma

Variabilità = tendenza delle unità statistiche osservate ad assumere modalità diverse.

Range = intervallo con estremi il valore osservato massimo e quello minimo, per variabili quantitative e qualitative in scala ordinale.

Range interquartile = Q3-Q1, ovvero intervallo dove ho il 50% dei valori osservati.

Varianza = misura di variabilità per variabili quantitative che sintetizza la dispersione dei valori osservati attorno alla media. Su popolazione N ho σ² = Σ(xi - x̄)² / N.

Varianza campionaria = varianza su un campione di n unità S² = Σ(xi - x̄)² / (n-1).

Deviazione standard = scarto quadratico medio = distanza media delle osservazioni dalla media aritmetica, σ = √[Σ(xi - x̄)² / N] per popolazione N.

Deviazione standard campionaria = S = √[Σ(xi - x̄)² / (n-1)] per campione di n unità statistiche.

Coefficiente di variazione = misura di variabilità per variabili quantitative indipendente dall’ordine di grandezza della variabile, CV% = (S / x̄) * 100.

Boxplot = per descrivere la tendenza centrale, la variabilità e la forma della distribuzione di una variabile quantitativa, è costituito da xmin, Q1, Q2, Q3, xmax.

Probabilità e distribuzione di variabili casuali

Probabilità

  • Impostazione classica: Pr = numero eventi favorevoli / numero eventi possibili, ho incertezze ripetibili ed equiprobabilità.
  • Frequentistica: non ho equiprobabilità.
  • Soggettivista: ho solo incertezza, non ripetibilità né equiprobabilità.

Modelli per variabili casuali quantitative

  • Discrete: binomiale, ipergeometrica, Poisson.
  • Continue: uniforme, esponenziale, normale.

Posso considerare un istogramma o un poligono come una approssimazione delle curve dei modelli teorici di distribuzione. Se in ordinata ho la densità di frequenza allora l’area sottesa dalla curva (detta funzione di densità di probabilità) mi dà la probabilità di osservare un certo valore.

Distribuzione normale: la funzione di densità di probabilità normale è f(x) = {e{(-1/2)*[(x-μ)/σ]²}} / √(2πσ²).

Regole empiriche per distribuzioni normali: μ ± σ corrisponde al 68.26% dei valori, μ ± 2σ al 95.44%, μ ± 3σ al 99.73%.

Distribuzione normale standardizzata: trasformo la generica variabile casuale normale (x) in una variabile casuale normale standardizzata (Z).

Anteprima
Vedrai una selezione di 4 pagine su 12
Riassunto statistica Pag. 1 Riassunto statistica Pag. 2
Anteprima di 4 pagg. su 12.
Scarica il documento per vederlo tutto.
Riassunto statistica Pag. 6
Anteprima di 4 pagg. su 12.
Scarica il documento per vederlo tutto.
Riassunto statistica Pag. 11
1 su 12
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze matematiche e informatiche MAT/07 Fisica matematica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher ing.fista di informazioni apprese con la frequenza delle lezioni di Metodi statistici e probabilistici per l'ingegneria e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Padova o del prof Arboretti Giancristofaro Rosa.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community