Anteprima
Vedrai una selezione di 9 pagine su 37
Statistica Pag. 1 Statistica Pag. 2
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Statistica Pag. 6
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Statistica Pag. 11
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Statistica Pag. 16
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Statistica Pag. 21
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Statistica Pag. 26
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Statistica Pag. 31
Anteprima di 9 pagg. su 37.
Scarica il documento per vederlo tutto.
Statistica Pag. 36
1 su 37
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Statistica Descrittiva

Variabili Statistiche:

  • Quantitative (Discrete o Continue)
  • Qualitative (Ordinali o Nominali)

Questionario - Intervista strutturata

  • Età: Quantitativa Discreta (anni interi continua)
  • Genere: Qualitativa Discreta
  • Ore di cui hai a disposizione: Quantitativa Continua
  • Ore che dedichi allo studio: Quantitativa Continua
  • Luogo dove studi: Qualitativa Nominale
  • Mezzo con cui viaggi: Qualitativa Discreta

Sintesi delle variabili osservate mediante

  • Tabelle (Distribuzioni di Frequenza)
    • Semplice
    • Doppia
  • Rappresentazioni Grafiche

Frequenza

  • Assoluta: Conteggio del numero di volte con cui una certa modalità si presenta

Frequenza Relativa:

  • fi = mi / N

Frequenza Cumulata

Frequenza Relativa o Assoluta in quella modalità più quelle precedenti, quindi corrisponde alla somma delle frequenze di quella modalità e delle modalità che precedono quella.

Ampiezza Classi

Differenza fra l'estremo superiore di classe e l'estremo inferiore di classe

Operatore Sommatore

Σ = un modo di rappresentare la somma di tanti addendi

  • N = Σ mi ; mi = m1 + m2 + ... + mk

Rappresentazioni Grafiche

  • Variabili Qualitative
    • Diagramma a Barre
    • Diagramma a Torta
  • Variabili Quantitative
    • Istogramma
    • Diagramma a Punti

Densità di Frequenza

di = mi / a

Variabili quantitativi discreti - Diagramma a punti

È possibile verificare anche in questo tipo di grafico forme di simmetria o asimmetria

Misure di sintesi

Misure di tendenza centrale

  • Media (aritmetica) = X media campionaria / μ media di popolazione
  • Mediana (n + 1 / n è la posizione della mediana)
  • Moda

Media > Mediana = Asimmetria positiva

Media < Mediana = Asimmetria negativa

Media = Mediana = Simmetria

Range o campo di variazione

R = Xmax - Xmin

Varianza

σ2 varianza di popolazione / s2 varianza campionaria

  1. σ2= 1/N ∑(xi - μ)2
  2. s2= ∑(xi - x̄)2 / (m-1)

Deviazione standard

σ = √σ2 / s = √s2

Standardizzazione

Z = (Xi - μ) / σ

La differenza tra il valore effettivo (yi) e il valore teorico che si trova sulla retta di regressione (yi) si chiama errore o residuo.

(ȳ = ȳ)

(ȳ)

y

(y - ȳ)

  • Devianza Totale
  • Devianza Residua (o dell'Errore)
  • Devianza di Regressione (o Spiegata)

In caso di assenza di correlazione lineare (pendenza nulla) la devianza di regressione (o spiegata) è nulla R = zero,

perciò la devianza totale è uguale alla devianza residua.

In caso di correlazione lineare perfetta (R = ± 1) non c'è devianza residua, infatti è uguale a zero,

perciò la devianza totale è uguale alla devianza di regressione.

Indice di determinazione lineare

R2 = Devianza di Regressione/Devianza Totale

Assume valore 1 in caso di correlazione lineare perfetta.

Assume valore zero in caso di assenza di correlazione lineare.

0 ≤ R2 ≤ 1

R2 = r2

Coefficiente di correlazione lineare

INDIPENDENZA IN MEDIA

DUE VARIABILI X E Y SONO INDIPENDENTI IN MEDIA (Y IN PARTICOLARE UNA VARIABILE Y QUANTITATIVA E INDIPENDENTE IN MEDIA DA X) SE TUTTE LE MEDIE (Y)-(CONDTIONATE(X AL Y) SONO UGUALI FRA LORO

SE HO INDIPENDENZA IN MEDIA NON NECESSARIAMENTE AVRO INDIPENDENZA STATISTICA

MA SE HO INDIPENDENZA STATISTICA HO INDIPENDENZA IN MEDIA

EVENTI DISGIUNTI E EVENTI INDIPENDENTI

SE DUE EVENTI SONO DISGIUNTI SONO FORTEMENTE DIPENDENTI QUINDI LA PROBABILITÀ CHE SI VERIFICHINO CONGIUNTAMENTE È ZERO

  • P(E ∩ F) = 0
  • P(E|F) = 0
  • P(F|E) = 0

SE DUE EVENTI SONO INDIPENDENTI, LA PROBABILITÀ DI P(E ∩ F)

  • P(E ∩ F) = P(E) · P(F)
  • P(E|F) = P(E)
  • P(F|E) = P(F)

Distribuzione campionaria della frequenza relativa (o proporzione)

La proporzione di unità statistiche che nella popolazione presentano una certa caratteristica (parametro π)

Statistica campionaria: Proporzione di unità con certe caratteristiche nel campione (P)

  1. π media: valore del campione selezionato

Formula

  • Proporzione di occupati: π = 2/3 (0,67)
  • Proporzione di non occupati: (1 - π) = 1/3 (0,33)

m = 3

010001011101227381227Distribuzione campionaria della proporzioneMP=2/3=(1,67)

P P(P)

  1. Si può utilizzare l'approssimazione normale quando il prodotto fra la dimensione del campione e la proporzione ed il suo complemento sia maggiore o uguale a 10

mπ(1-π) >= 10

Osservazione al contrario

Fissato il margine di errore E e il livello di confidenza per capire quanto dovrebbe essere il campione (m) per garantire l'uguaglianza

E = Zα/2. √ [(P (1-P)) / m]

E = 0.03

(1 - α) = 0.95 → zα/2 = 1.96

Quindi

m = [(Zα/2)² . P (1-P)] / E²

P = non sarebbe nota quindi cosa faremmo? Ci mettiamo nella situazione "peggiore" possibile e si pone P = 0.5

m = [(1.96)² . 0.25] / 0.03² = 1067.1112 si approssima a 1068

Lo possiamo fare anche per l'intervallo di confidenza della media

m = [(Zα/2)² . σ²] / E²

con deviazione standard nota

(Bisogna sostituire qualcosa a ; ma non esiste una regola generale come con la proporzione)

Esempio di test bilaterale

Spese medie mensili per telefonia mobile

M = 50,64

σ = 12

n = 12

z = 1,96

t = 2,69

x = 65,014

α = 0,05

H0 = 50,64

Z = 60,014 - 50,6418,49 /√122,69

Rifiuto l'ipotesi nulla

Approccio del P-value:

Area a destra di 2,69 = 0,0036

Area a sinistra -2,69 = 0,0036

Percentuale molto bassa = quindi rifiutol'ipotesi nulla

Collegamento con costruzione di un intervallo diconfidenza per M:

n-1=12-1=11

z = 1,96

t11(0.025)=2,201

x = 65,014

α = 0,05 (1-α = 0,95)

65,014 - 1,96 18,49√1259,5523 Limite inferiore65,014 + 2,201 18,49√1270,4757 Limite superiore

Non potremmo utilizzare l'intervallo di confidenza per “effettuareuna verifica di ipotesi.Posso confrontare un'ipotesi nulla con i valori plausibili:H0 : μ = 50,64

(59,5523 70,4757)

L'ipotesi nulla non E' compresa nell'intervallo quindi rifiutol'ipotesi nulla

Ovviamente questo collegamento tra intervallo di confidenzae verifica di ipotesi non vale per test unilaterali

Dettagli
Publisher
A.A. 2020-2021
37 pagine
2 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher marti.nicolai di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Pisa o del prof Pacini Barbara.