Anteprima
Vedrai una selezione di 10 pagine su 59
Statistica I, corso Pag. 1 Statistica I, corso Pag. 2
Anteprima di 10 pagg. su 59.
Scarica il documento per vederlo tutto.
Statistica I, corso Pag. 6
Anteprima di 10 pagg. su 59.
Scarica il documento per vederlo tutto.
Statistica I, corso Pag. 11
Anteprima di 10 pagg. su 59.
Scarica il documento per vederlo tutto.
Statistica I, corso Pag. 16
Anteprima di 10 pagg. su 59.
Scarica il documento per vederlo tutto.
Statistica I, corso Pag. 21
Anteprima di 10 pagg. su 59.
Scarica il documento per vederlo tutto.
Statistica I, corso Pag. 26
Anteprima di 10 pagg. su 59.
Scarica il documento per vederlo tutto.
Statistica I, corso Pag. 31
Anteprima di 10 pagg. su 59.
Scarica il documento per vederlo tutto.
Statistica I, corso Pag. 36
Anteprima di 10 pagg. su 59.
Scarica il documento per vederlo tutto.
Statistica I, corso Pag. 41
1 su 59
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Statistica

  1. La statistica descrittiva ha come oggetto di studio la popolazione di cui vengono raccolti ed analizzati dei dati.

Segue un processo di sintesi dei dati, ossia l'ordine dei dati dai quali si ricavano delle informazioni utilizzando appositi strumenti di sintesi.

Nozioni di Base

  • Popolazione (collettivo statistico): è l'insieme delle persone coinvolte nell'indagine, nonché l'insieme di riferimento per l'analisi.
  • Unità statistiche: è chiamato così il singolo individuale componente il collettivo statistico.
  • Carattere/variabile statistica: ogni aspetto che può essere oggetto di rilevazione/casuale fenomeno di interesse.
  • Modalità del carattere: i modi con cui i caratteri si presentano nelle unità statistiche del collettivo.

Es. Carattere: stato civile - "celibe-nubile, sposato-vedovo..."

Classificazione delle Variabili Statistiche

X: U = X ⊆ ≤

  • Qualitative - esprimono una qualità dell’unità statistica (modalità=valore verbale)
    • Nominali - permettono di affermare solo che una modalità è uguale o diversa dalle altre.
    • Ordinali - permettono di ordinare le modalità.
  • Quantitative - esprimono una quantità misurabile
    • Discrete - le modalità sono un numero finito o infinito numerabile.
    • Continue - le modalità sono un intervallo numerico.
Supporto (Spazio Campionario)

L'elenco di tutte le modalità possibili verificate al termine dell'indagine è un insieme finito.

Proprietà di Nχ(x)

  • Nχ(x) ≥ 0    ∀ x ∈ S
  • ∑ Nχ(x) = N

Frequenza relativa: viene indicata con Pχ(x) ed è l'applicazione che va dal supporto all'intervallo compreso da 0 ad 1

Proprietà di Pχ(x)

  • 0 ≤ Pχ(x) ≤ 1    ∀ x ∈ S
  • ∑ Pχ(x) = 1

Condizione di normalizzazione

P(X∈_ ) =

Perchè viene introdotto tale indicatore?

È utile per confrontare tra loro popolazioni aventi ampiezze differenti. Infatti in questo caso non è opportuno adottare la frequenza assoluta per indicare l'incidenza di una valore individuato; la frequenza relativa normalizza la frequenza assoluta, uso la rende indipendente dall'ampiezza della popolazione analizzata.

Operatore frequenza relativa P( ) prende il nome di PROPORZIONE (cioè mettendo un intervallo generico di valori della variabile) ed è dato dalla somma delle frequenze relative all'interno dell'intervallo.

Variabili Quantitative Continue Raggruppate in Classi

  • Quando le modalità del carattere sono numeriche

Xi [xi - xi+1); Pi; i = 1, 2, ..., k

Le frequenze assolute e relative non sono sufficienti a rappresentare in modo sensato il fenomeno. In questo caso deve essere aggiunta la densità di frequenza relativa.

I singoli valori delle freq. relative non si possono allacciare alla classe, ma i dati aventi valori più numerosi hanno quantitativamente f.i. relative più alte.

Si calcola dunque l’ampiezza della classe ai = ci - ci-1

E si rapporta fX(xi ci, xi+1) all’ampiezza ottenendo fX(x) perché la densità di f.i. relativa.

La densità così calcolata è rappresentata con grafico ad istogramma (convenzione)

L’area dell’istogramma è b x R ci = Pi/ai

e corrisponde dunque alla fi.

Proprietà

  1. fX(x) ≥ 0
  2. Condizione di Normalizzazione

fX(x) =

  • 0 x < xi
  • Pi/ai xi ≤ x < xi+1
  • 0 x ≥ xi

FX(x) = ∫ from -∞ to x (fX(t)) dt =

  • ∑ from j=1 to i Pj x < xi
  • Pi(x - xi) / xi+1 - xi xi ≤ x < xi+1

Il grafico è una retta spezzata che ha come coeff. angolare la densità di frequenza relativa

3. Media di una trasformazione di dati

T = g(x) E(T) = E(g(x))

Es. x = reddito in lire

  • xi Pi Ti s⋅Pi
  • 1 0,2 5 1
  • 2 0,5 4,5 2,5
  • 3 0,3 15 4,5

μ = 10,5

  • xi Pi 5⋅xi Pi
  • 1 0,2 5 1
  • 2 0,5 4,5 2,5
  • 3 0,3 4,5 9 μ = 10,5

Variabile disgreta

E(T) = Σi ti ⋅ Pi (L) = E(g(x)) = Σ g(xi) ⋅ P(xi)

Variabile continua

∫ t ⋅ f(t) dt = ∫ (x=c)

3a. Disuguaglianza di Jensen

T = g(x) con g(x) funzione convessa, cioè con tendenza un'unica verso l'altro

allora

E(g(x)) ≥ g(E(x))

se g(bx) è concava ε(g(x)) ≤ g(E(x))

se g(x) è lineare vale quanto segue

3b. Media di funzione costante

T=g(x) g(x)=a (variabile T è degeneri)

Σ[Ti] ⋅ Σ[g(xi)] media di una costante costante stessa

Dimostrazione

Σ[g(x)] = Σ g(x) Px(xi) - D =a Px(xi) = aΣ Px(xi) = a

per condizione di normalizzazione

Formule per il calcolo delle medie potenziate a seconda delle tipologie di variabili statistiche.

NB: Per le v.s. continue calcolo solo la media aritmetica.

  1. Dati grezzi (1/p) mg j= N ∑ xi N i=1
  2. v.s. discreta (1/p) mg j= K ∑ (ci) P(xi) i=1
  3. v.s. in classi (1/p) mg j= K ∑ (xi) Px i

* valore centrale delle classi

xc + xj+1 ───────────── 2

  1. v.s. continua

    Formula della media aritmetica ∫ +∞-∞ x β(x) dx

Indici di posizione

  • Mediana
  • Medie
  • Moda
  • Quantili

Tutti gli indici di posizione possono essere calcolati per le variabili quantitative.

Per quanto concerne le v. qualitative, invece, il discorso cambia,

Le variabili qualitative nominali hanno la moda come unico indice.

Le variabili " ordinale" hanno anche una mediana, ed è il valore che, in una distribuzione ordinata lascia a destra ed a sinistra lo stesso numero di valori.

Statistica Bivariata

Si prendono in esame le distribuzioni doppie, visione congiunta di due caratteri nelle unità statistiche del collettivo.

Simboli:

Distribuzione Statistica Doppia: { (xi, yj) }, nx, y (xi, yj), i = 1..R, j = 1..C

Distribuzione Congiunta → in una tabella, a doppia entrata, pongo x sulle righe e y sulle colonne.

  • x1, y1, x1, yr, ... yc, ni

Massima Dipendenza

Frequenza Congiunta Assoluta = Nxi, yj = Unità statistiche presentano congiuntamente la modalità xi e yj.

Proprietà:

  • μ=1R ∑j=1C Mxi, yj (xi, yr) = N

Distribuzione Marginale ni: conta il numero di volte in cui il presenta la modalità (xi), senza condizionale da l'esistenza dalle modalità avversi dall'altro variabile (y).

Proprietà:

  • j=1C Mxi, yj (xi, yr) = Mxi (significa sommo le Pi di xi e tj con la differenza che il la x tenuto ferma.)

Distribuzione Marginale Mj: conta le volte in cui il presenta la modalità (yj), a prescindere dalle modalità avversi dall'altra variabile (x).

Proprietà:

  • i=1R Mxi, yj (xi, yj) = (yj)
Dettagli
A.A. 2019-2020
59 pagine
1 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Alessia_Mandara di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università Politecnica delle Marche - Ancona o del prof Chelli Francesco Maria.