Anteprima
Vedrai una selezione di 10 pagine su 195
Appunti Probabilità e statistica Pag. 1 Appunti Probabilità e statistica Pag. 2
Anteprima di 10 pagg. su 195.
Scarica il documento per vederlo tutto.
Appunti Probabilità e statistica Pag. 6
Anteprima di 10 pagg. su 195.
Scarica il documento per vederlo tutto.
Appunti Probabilità e statistica Pag. 11
Anteprima di 10 pagg. su 195.
Scarica il documento per vederlo tutto.
Appunti Probabilità e statistica Pag. 16
Anteprima di 10 pagg. su 195.
Scarica il documento per vederlo tutto.
Appunti Probabilità e statistica Pag. 21
Anteprima di 10 pagg. su 195.
Scarica il documento per vederlo tutto.
Appunti Probabilità e statistica Pag. 26
Anteprima di 10 pagg. su 195.
Scarica il documento per vederlo tutto.
Appunti Probabilità e statistica Pag. 31
Anteprima di 10 pagg. su 195.
Scarica il documento per vederlo tutto.
Appunti Probabilità e statistica Pag. 36
Anteprima di 10 pagg. su 195.
Scarica il documento per vederlo tutto.
Appunti Probabilità e statistica Pag. 41
1 su 195
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

1/3/2022

La parola viene da "Stato" e si occupa della raccolta e dell'analisi dei dati.

La statistica descrittiva guarda e rappresenta dati.

STATISTICA DESCRITTIVA

Popolazione: insieme di elementi (persone, persone che appartengono ad una categoria es. studenti, animali, oggetti...)

della popolazione si vuole studiare una

Variabile: caratteristica della popolazione che si vuole esaminare

  • può essere
    • QUALITATIVE = qualità (no numeri)
    • QUANTITATIVE = valore numerico
      • DISCRETI: se possono assumere una quantità finita o numerabile di valori
      • es voti esame
      • CONTINUI: se possono assumere valori in un range continuo
      • es tempo di vita

Dati: Valori ottenuti nell'esperimento statistico

  • VARIABILI QUALITATIVE -> dati appartengono a categorie
  • VARIABILI QUANTITATIVE -> dati sono numeri

Un campione è un sottoinsieme della popolazione.

Obiettivo: raccogliere i dati di un campione della popolazione, analizzarli e dedurre informazioni sulla popolazione

È importante scegliere in modo opportuno il campione in modo più uniforme possibile per evitare BIAS ovvero distorsione delle informazioni dovuta a una cattiva scelta del campione.

La statistica descrittiva si occupa di rappresentare i dati raccolti usando tabelle e grafici e analizzarli utilizzando

grandezze che riassumono caratteristiche delle variabile in esame

RAPPRESENTAZIONE DI DATI

Tabella si rappresentano le frequenze dei valori assunti dai dati

  • FREQUENZA ↳ raggruppo i dati in CLASSI
    • variabile qualitativa ↳ classi: categorie o gruppi di categorie
    • variabile quantitativa
      • DISCRETA ↳ classi = possibili valori
      • CONTINUA
  • conto il numero di osservazioni che ricadono in una classe

Siano x1, ..., xn dati di un campione e v1, ..., vk i valori assunti (variabili qualitative → categorie, variabile quantitative → valori possibili) e fj del numero xi tale che xi = vj. fj viene detta frequenza assoluta del valore vj.

Definisco frequenza relativa del valore vj il numero pj = fj/n con n = ampiezza del campione.

∑j=1pj=1

∑j=1fj=n

OSS

pj ∈ [0,1]

∑j=1pj=1

Si usa anche scrivere le pj in percentuale: pj perc = pj * 100%

Misure di tendenza centrale

Moda

x1, ..., xn dati di un campione

v1, ..., vk valori possibili (variabili qualitative, variabili quantitative discrete)

f1, ..., fk frequenze assolute

Def Una moda è un valore vj tale che fj è massima (fj > fh ∀h)

Se tale valore è unico è la moda calcolata sui dati del campione (si può usare anche fj).

Oss Tipicamente la moda viene utilizzata per variabili qualitative perché le misure di tendenza centrale che definiremo dopo hanno bene senso per misure quantitative.

Caso delle misure quantitative continue

x1, ..., xn dati

I1, ..., Ik intervallo

f1, ..., fk frequenze assolute

d1, ..., dk densità di frequenze dj = fj/|Ij|

Def Una classe modale è una classe Ij tale che la densità di frequenza è massima: dj > dh ∀h

Se tale classe è unica si dice la classe modale.

Oss La definizione è la stessa se si usano le densità di frequenze relative perché queste sono proporzionali alle dj:

dj/n > dh/n dj > dh

È molto sensibile rispetto a dati anomali

Quartili, Percentili, Decili e Quantili

x1, ..., xn dati ordinati x1 ≤ x2 ≤ ... ≤ xn

Immaginiamo di posizionare i dati su un righello

media

mediana

Def Quartile

Q1 "primo quartile"

(n+1) ⋅ 1/4 = k1 + r1 con k1 ∈ ℕ

r1 ∈ {0, 1/4, 2/4, 3/4}

Q1 = xk₁ ⋅ (1 - r1) + xk₁+1 ⋅ r1

Q2 "secondo quartile"

(n+1) ⋅ 2/4 = k2 + r2 con k2 ∈ ℕ

r2 ∈ {0, 1/2}

Q2 = xk₂ ⋅ (1 - r2) + xk₂+1 ⋅ r2

Q2 è la mediana!

Q3 "terzo quartile"

(n+1) ⋅ 3/4 = k3 + r3 con k3 ∈ ℕ

r3 ∈ {0, 1/4}

Q3 = xk₃ ⋅ (1 - r3) + xk₃+1 ⋅ r3

Oss Il quartile inclusivo opera così:

Qi* = n-1/4 ⋅ i

Q2* = n-1/4 ⋅ 2

Q3* = n-1/4 ⋅ 3

Q3 = 100 · 3/4 = 75 → intervallo [ 15, 25 ]

Q3 = 100·3/4 = 60

Q3 = 0,3947

38

Q3 = 15 + 0,3947 ( 25 - 15 ) = 18,947

QUANTILI, PERCENTILI, DECILI

Considero α ∈ ( 0, 1 ). Il quantile di ordine α si calcola con la seguente procedura:

(n + 1)·α = k + r con k ∈ ℕ e r ∈ [0, 1)

qα = xk·(1 - r) + xk+1·r

ES

n = 10 α = 6/7

(n + 1)·α = 11 · 6/7 = 9 + 0,42857

OSS

Il primo quartile Q1 non è altro che il quantile di ordine 1/4 (α = 1/4), Q2 di ordine 2/4, Q3 di ordine 3/4.

Il j-esimo percentile pj è il quantile di ordine j/100

Ad es. p40 ha a sx circa il 40% dei dati del campione

L'h-esimo decile Dh è il quantile di ordine h/10

REGRESSIONE LINEARE

Un campione di dati è BIVARIATO se è composto da coppie di dati:

x1, x2, … xn → stessa ampiezza

y1, y2, … yn

L'obiettivo è cercare di capire se c'è una relazione tra i dati xi e i dati yi.

I dati di un campione bivariato si rappresentano in uno SCATTERPLOT (diagramma a dispersione)

Allo stesso modo ⎯⎯⎯⎯⎯⎯⎯=0

2=1/n−1ni=1(−⎯⎯⎯)/2=

1/n−1ni=1(−⎯⎯⎯2)=1/22=1

Allo stesso modo ⎯⎯⎯⎯⎯⎯⎯=1 dovrei togliere la media ma non c'è la media perché è zero

o ≤ S2=1

1/n−1ni=1(

1/n−1ni=12(2)=

posso inserire la media perché è 0

⎯⎯⎯2

=2x⎯⎯⎯⎯⎯⎯⎯⎯⎯−2Cov

Cov ⎯

= Cov/

Quindi Cov ⎯⎯⎯⎯=1−⎯⎯⎯⎯ ⎯⎯⎯⎯⎯=Ov y−1 Cov O

Quindi

r x⎯⎯≥0

O

2

Dettagli
Publisher
A.A. 2021-2022
195 pagine
1 download
SSD Scienze matematiche e informatiche MAT/06 Probabilità e statistica matematica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher marsgabriella di informazioni apprese con la frequenza delle lezioni di Probabilità e statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Politecnico di Bari o del prof Orlando Gianluca.