Anteprima
Vedrai una selezione di 4 pagine su 13
Appunti Statistica 1 Pag. 1 Appunti Statistica 1 Pag. 2
Anteprima di 4 pagg. su 13.
Scarica il documento per vederlo tutto.
Appunti Statistica 1 Pag. 6
Anteprima di 4 pagg. su 13.
Scarica il documento per vederlo tutto.
Appunti Statistica 1 Pag. 11
1 su 13
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

STATISTICA 1

TERMINOLOGIA

  • Popolazione totale dei casi in cui si manifesta il fenomeno oggetto di studio
  • Campione parte scelta della totalità dei casi
  • Unità statistica caso singolo - individuale
  • Carattere concentrazione, oggetto che rileviamo. Il carattere si può manifestare secondo modalità diverse
    • Qualitativo
      • Sconnesso (con nessun legame di qualità)
      • Ordinalabile (es. livello di istruzione)
    • Quantitativo
      • Discreto (quantità numerabile e ordinabile, scala unitaria) - Giorni
      • Continuo (quantità possono assumere tutti i valori e sono soggette a unità di misura) - In altezza
  • N = popolazione totale
  • Ni = frequenza assoluta
  • Ni+ = frequenza assoluta cumulata
  • Fi = frequenza relativa = N
  • Fi+ = frequenza relativa cumulata

RAPPRESENTAZIONI GRAFICHE: VARIABILI QUALITATIVE

  1. DIAGRAMMA A BARRE (rettangoli separati)
  1. DIAGRAMMA A TORTA

Per sapere il d° di ogni spicchio bisogna fare proporz. 360° ✕ Ni/Ntotale= α

RAPPRESENTAZIONI GRAFICHE: VARIABILI QUANTITATIVE

  1. Variabile discreta → Diagramma a bastoncini
  2. Variabile continua → Istogramma

Numero classi

  • ai = ampiezza classe

ai = numero atomi di frequenza

In questo modo rendiamo omogeneo il confronto. La distribuzione è visualizzata dall'area.

INDICI DI POSIZIONE

Parametro che sintetizza l'ordine e/o grandezza della distribuzione fattoriale.

I indici di P:

  • non analitici: moda, mediana e percentili
  • analitici: medie potenziate

PROPRIETÀ GENERALI

degli I.P.: g(x)

  • Principio di InternaLità di Cauchy ➔ min(x) ≤ g(x) ≤ max(x)
  • Moltiplicativa ➔ g(k ⋅ x) = k ⋅ g(x)
  • Monotonicità ➔ x > y ⇒ allora g(x) > g(y)
  1. MODA

    Il valore a cui è associata la frequenza maggiore

    • La posso calcolare sia x variabili quantitative sia x variabili quantitative
    • Nel caso di classi di intervallo, come procedo?
    • Scelgo la classe che ha densità di frequenza maggiore (=classe modale)
    • Come valore per convenzione ➔ scelgo il valore centrale

    NB: Può succedere ➔ 2 MODI di fi modai ➔ CARATTERE BINOMIALE

  2. MEDIANA

    = valore assunto dalla variabile x che divide una popolazione in

    2 parti uguali:

    • la mediana occuore la posizione centrale nella distribuzione di freq. ordinata
    • => si può calcolare solo x le variabili quantitative e qualitative ordinali

    - Osservazioni con N pari ➔ N/2 e N/2 + 1 Indlruolo le 2 posizioni centrali

    - Osservazioni con N dispari ➔ N/2 + 1 poszione centrale

    • Tabella ai frequenze:
      • ordino le modalità
      • calcolo la posizione detla mediana
      • individuo la "i" Ni > alla posizione della mediana ➔ trovo la mediana
    • Classi di intervallo:
      • calcolo le fi
      • calcolo le Fi
    • enter ce posizione sulla caluna Ni

    ESEMPIO

    • Xi - Xi-1 | Ni | fi | Fi
    • 1-4 || 50 | 0,25 | 0,25
    • 4-9 || 75 | 0,375 | 0,375
    • 9-15 || 75 | 0,875 | 0,875

    (15 Matt

    ➔ A = 15, l = 5 | = * : 0,75

    x = 1,461 => m = 4,461 * 12,461 = ⇒ Mediana

VARIANZA

σ2 = VAR(x)

quadrato dello scarto quadratico medio

σ = scarto quadratico medio

Per confrontare la variabilità tra caratteri quantitativi anche espressi con unità di misura differenti uso il coefficiente di variazione c.v. = σ/μ

Situazioni estreme:

  1. Minima variabilità → Tutte le N unità statistiche assumono lo stesso valore

σ2 = 0

  • x = {5,5,5,5,5}
  1. Massima variabilità → la variabilità aumenta se aumenta la distanza dei valori dalla media fissata

Si dimostra che

σ2max = (b - a)2(μ - a)

VARIANZA NORMALIZZATA

σ2N = σ22maxbassa variabilità alta variabilità

PROPRIETÀ OPERATORE VARIANZA

σ2x = VAR(x)

VAR(c) = 0

VAR(ax) = a2 VAR(x)

VAR(x + y) = VAR(x) + VAR(y)

[NB Media tot = 1a media (A) · Na + 2a media (B) · Nb]

VAR(x) > 0 sempre è non monotona

Regressione Lineare

Regredire: cercare una relazione funzionale tra variabili con metodi statistici

  • Studio della relazione di Y dipendente da X mediante una funzione

Funzione di regressione: è sperata che passi per se medie condizionate e rappresentata analiticamente da un polinomio completo di grado (n-1)

Studio:

  • Scelta del modello della funzione interpolante

Grado Polinomio = 0y = c

Grado Polinomio = 1y = cx

Grado Polinomio = 1y = a + bx

  • Scelta dei parametri in modo da rendere minima
  • Valutazione della bontà del modello con k parametri
  • Se il modello non è bene, lo cambio

Stima dei Parametri

I parametri sono scelti in modo da rendere minima la media dei quadrati degli scarti dei valori osservati y e quelli teorici y*

M[{y - y*}{y - y*}'] = min

y = a1 + bx

M[{y - a - bx}2] = min

{HL(y - a)2} = HL{y - y*}2a = y

Quando a,b e c trovo la miglior retta che minimizza l’errore quadratico

y = = My - b Mx

= COV(XY)σx2

Cosa è la Covarianza (Cov(XY))? È la media dei prodotti degli scarti di ogni variabile dalla propria media aritmetica

Cov(X,Y) = M(x - x)(y - y)= M(xy) - Mx My

! La covarianza può assumere valori + o – e fornisce informazioni sulla tipologia della relazione lineare esistente tra le variabili x e y

Dettagli
Publisher
A.A. 2019-2020
13 pagine
1 download
SSD Scienze matematiche e informatiche MAT/06 Probabilità e statistica matematica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher ludo.da di informazioni apprese con la frequenza delle lezioni di Statistica 1 e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Borrotti Matteo.