Anteprima
Vedrai una selezione di 10 pagine su 104
Statistica, prof Sebastiani Maria Rita Pag. 1 Statistica, prof Sebastiani Maria Rita Pag. 2
Anteprima di 10 pagg. su 104.
Scarica il documento per vederlo tutto.
Statistica, prof Sebastiani Maria Rita Pag. 6
Anteprima di 10 pagg. su 104.
Scarica il documento per vederlo tutto.
Statistica, prof Sebastiani Maria Rita Pag. 11
Anteprima di 10 pagg. su 104.
Scarica il documento per vederlo tutto.
Statistica, prof Sebastiani Maria Rita Pag. 16
Anteprima di 10 pagg. su 104.
Scarica il documento per vederlo tutto.
Statistica, prof Sebastiani Maria Rita Pag. 21
Anteprima di 10 pagg. su 104.
Scarica il documento per vederlo tutto.
Statistica, prof Sebastiani Maria Rita Pag. 26
Anteprima di 10 pagg. su 104.
Scarica il documento per vederlo tutto.
Statistica, prof Sebastiani Maria Rita Pag. 31
Anteprima di 10 pagg. su 104.
Scarica il documento per vederlo tutto.
Statistica, prof Sebastiani Maria Rita Pag. 36
Anteprima di 10 pagg. su 104.
Scarica il documento per vederlo tutto.
Statistica, prof Sebastiani Maria Rita Pag. 41
1 su 104
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

STATISTICA

Cos'è?

E' l'insieme delle procedure operative e delle metodologie quantitative che sono necessarie per raccogliere ed elaborare i dati sul fenomeno di interesse, al fine di produrre informazione statistica utile per prendere decisioni.

Informazioni espresse numericamente che rappresentano la sintesi dell'osservazione di un certo numero di dati.

CONCETTI CHIAVE

  • UNITÀ STATISTICA - E' l'entità o soggetto su cui si presenta il fenomeno di interesse. (A chi mi rivolgo?)
  • VARIABILE/CARATTERE - E' una caratteristica o aspetto che si può osservare su l'unità statistica. (Assegno un valore)
  • MODALITÀ - E' un particolare valore di una variabile (risposta dell'individuo alla domanda)

Esempio: Unità statistica ➔ individuo Variabile ➔ sesso Modalità ➔ maschio/femmina

  • CONFRONTO TRA UNITÀ STATISTICHE RISPETTO A UNA O PIÙ VARIABILI - Due unità statistiche sono uguali se presentano la stessa combinazione di modalità rispetto a una o più variabili.
  • POPOLAZIONE O COLLETTIVO STATISTICO - E' un insieme di unità statistiche che sono uguali rispetto a 1 o + caratteri. Può essere empirica, osservabile nella realtà, oppure teorica, rispetto a un'instanza, insieme di possibili misure.
  • NUMEROSITÀ DI UNA POPOLAZIONE - E' il numero di unità statistiche che compongono la popolazione. (N)
  • INDAGINE STATISTICA - E' un processo di raccolta dei dati sul fenomeno di interesse.
  • CAMPIONE - Sottinsieme della popolazione.

TOTALE - Riguarda tutta la popolazione. (Censimento)

Parziale - Riguarda solo una parte della popolazione. - minor costo - minor tempo - raggiunte le medesime risposte

numero di unità che fanno parte del campione

  • Ammontare totale di una variabile quantitativa trasferibile

la somma delle quantità di quel carattere che sono possedute

dalle unità della popolazione A

Classificazioni dei caratteri

Si classificano secondo la natura:

  • Qualitativi: hanno per modalità nomi, oggetti, numeri convenzionali,
  • nomi convenzionali, per cui non si effettuano operazioni.

Quantitativi: hanno per modalità numeri convenzionali che

esprimono una misura di una quantità

Quando si opera con essi, oltre che un'ordinata è possibile

di effettuare operazioni aritmetiche per confrontarle.

Quando è possibile calcolare (solo la differenza si parla di

scala a intervalli) qualsiasi è possibile calcolare anche

il rapporto tra modalità => scale di rapporti

Caratteri qualitativi

  • Ordinati

Hanno per modalità determinata.

gruppi qualitativi per cui

esiste un ordinamento naturale

(es. titolo studio, ceto sociale,

grado soddisfazione, anno di università)

questo tipo di carattere costituisce una scala ordinata.

Si propone perché è possibile dare

un ordine alle modalità in modo

da affermare che una modalità

precede un'altra

  • Sconnessi

Hanno per modalità determinate qualificate

ve per le quali non esiste un ordinamento

(esesso, religione, luogo di nascita, reddito ecc)

Ad es., non si può dire che il sesso maschile ha

una precedenza su quello femminile.

Unico confronto tra le modalità è uguaglianza

o diversità.

Questa caratteristica costituisce una scala nominale

perché per le sue modalità è possibile differenziare

se sono uguali o diverse

Caratteri quantitativi

  • Discreti

Le modalità sono effettuabili,

numerabili, sono numeri

interi (es. n' addetti, componenti

famigliare, ecc) Sono dei contabili.

  • Continui

Le modalità sono tutti i numeri compresi in

un intervallo (altezza, peso, reddito ecc)

i valori si succedono sopra scala continua.

  • Trasferibili

Quando un'unità perde parte

del carattere che era posseduto

da un'altra unità (es. reddito

n' di addetti)

  • Statistica inferenziale
  1. Schematizzazione (progettata)
  2. Selezione campione
  3. Raccolta dei dati
  4. Applico indici statistica per la
  5. descrizione del campione
  6. Inferenza statistica verifica
  7. se proposte su campioni
  8. sono utilizzabili all'intera
  9. popolazione

Secondo il numero di variabili utilizzate:

  • statistica univariata ⇒ distribuzione semplice (1 variabile)
  • statistica bivariata ⇒ distribuzione doppia (2 variabili)
  • statistica multivariata ⇒ distribuzione con 3 o + variabili

N.B. I coefficienti rimangono invariati.

Nella statistica descrittiva vediamo l'ELABORAZIONE DEI DATI.

  1. INDICI DI POSIZIONE / MEDIE
  2. INDICI DI DIVERSITA’ (INDICI DI DISPERSIONE O DI VARIABILITA’)
  3. INDICI DI FORMA

L'elaborazione segue la raccolta dei dati sotto elle o grafici:

  1. Calcolo delle medie per individuare le modalità o i valori tipici;
  2. caratteristiche che servono per descrivere l’ordine di grandezza del fenomeno sul collettivo osservato.

Il tipo specifico di elaborazione dipende dal tipo di variabile, distinguiamo una gerarchia delle variabili:

  1. VARIABILI QUANTITATIVE (espressione modelli equivalenti attraverso le esperienze aritmetiche)
  2. VARIABILI QUALITATIVE ORDINATE (indiciano ordine e livello di diversità)
  3. VARIABILI QUALITATIVE SCONNESSE (individuano sesso e tra diversità)

CASO: VARIABILE QUALITATIVA SCONNESSA

  • MODA ⇒ di una distribuzione è la modalità prevalente, più importante, più frequente. Nel caso di distribuzione a “giustizia”, la moda è la modalità con quanti più eletti.

CASO: VARIABILE QUALITATIVA ORDINATA ⇒ modalità ordinabili

  • MODA
  • MEDIANA ⇒ è la modalità che divide la distribuzione ordinata in due parti; ovvero a metà.

ITER: DISTRIBUZIONE PER UNITÀ

  • ordinare i dati in modo non decrescente
  • posto centrale della distribuzione

caso N pari: ho due posti centrali N/2 e N/2 + 1

caso N dispari: unico posto centrale (N+1)/2

RED CENTILE distribuzione in ordine

  • trovo 9 posto ordinario composto da 9
  • blocca N/9
  • (N*9 ≤ h ≤ N*9+1)

SECONDA PROPRIETÀ

Affermiamo che:

  • la media aritmetica è il baricentro di ordine 2 della distribuzione;
  • è quel valore che rende minima la distanza complessiva di ordine 2 tra le N osservazioni e il valore rappresentativo.

La somma degli scarti al quadrato dei valori x1, x2, ..., xN da una costante "c" è minima quando "c" è uguale alla media aritmetica.

Dati x1, x2, ..., xN e xmin, cN ≤ x ≤ xmax

per ciascuna delle N osservazioni calcolo il valore intermedio:

(x1 - x)2 (x2 - x)2 (xN - x)2

calcolo che il quadrato degli scarti (x1 - x)2 + (x2 - x)2 + ... + (xN - x)2

affinché U è quel valore che minimizza l'espressione

i=1N(xi - x)2

Qual è il senso e l'utilità?

Lo scopo è quello di rissumere le N osservazioni con un valore che è compresso tra il valore più piccolo e più grande osservato

xmin ≤ x ≤ xmax

Se come valore rappresentativo scelgo il valore centrale, è quello che federe quanto questo valore dista dalle N osservazioni delle N distanze tra quel valore e la distanza complessiva è la somma degli scarti.

Cerco il valore x per il quale è minima la distanza tra le N osservazioni

Distorta → xi - x = si dice d'ordine due perché (xi - x)2 è elevata al quadrato in modo da dare peso ai termini più fortunati

Individua minima la distanza complessiva di ordine 2 tra le N osserv. e il valore rappresentativo

es.

x1 = 1 x2 = 4 x3 = 10

Calcolo il valore centrale come valore rappresentativo

x = 4 + 10 = 5,5

2

calcolo la media

μ = 1 + 4 + 10 = 5

Calcolo gli "scarti" rispetto a il valore centrale

(xi - x)2

1 - 5,5 = - 4,5

4 - 5,5 = - 1,5

10 - 5,5 = 4,5

Calcola (xi - μ)2

1 - 5 = -4

4 - 5 = -1

10 - 5 = 5

New form:

Finale:

20,25

2,25

20,25

(42,75)

16

1

25

42

Notiamo che la media aritmetica ha un valore più piccola dei termini rispetto al quesù valore è più rappresentativo del valore centrale

Quando l'utlittà del sistema è più adatto per riassumere le N osservazioni

  • x = tdistortibile
  • x = misura con errore (1o proprietà)
  • ero quei valori rappresentativi (2o proprietà)

Il Metodo mi rimanda a tutto il numero

Dettagli
A.A. 2017-2018
104 pagine
9 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher saraproietti1396 di informazioni apprese con la frequenza delle lezioni di Statistica base e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma La Sapienza o del prof Sebastiani Maria Rita.