Anteprima
Vedrai una selezione di 10 pagine su 126
Statistica (teoria ed esempi) Pag. 1 Statistica (teoria ed esempi) Pag. 2
Anteprima di 10 pagg. su 126.
Scarica il documento per vederlo tutto.
Statistica (teoria ed esempi) Pag. 6
Anteprima di 10 pagg. su 126.
Scarica il documento per vederlo tutto.
Statistica (teoria ed esempi) Pag. 11
Anteprima di 10 pagg. su 126.
Scarica il documento per vederlo tutto.
Statistica (teoria ed esempi) Pag. 16
Anteprima di 10 pagg. su 126.
Scarica il documento per vederlo tutto.
Statistica (teoria ed esempi) Pag. 21
Anteprima di 10 pagg. su 126.
Scarica il documento per vederlo tutto.
Statistica (teoria ed esempi) Pag. 26
Anteprima di 10 pagg. su 126.
Scarica il documento per vederlo tutto.
Statistica (teoria ed esempi) Pag. 31
Anteprima di 10 pagg. su 126.
Scarica il documento per vederlo tutto.
Statistica (teoria ed esempi) Pag. 36
Anteprima di 10 pagg. su 126.
Scarica il documento per vederlo tutto.
Statistica (teoria ed esempi) Pag. 41
1 su 126
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

CAPITOLO 1: INTRODUZIONE

La statistica è l'arte di apprendere i dati. Esso si occupa della loro raccolta, descrizione ed analisi.

Alcune volte l'analisi statistica parte da un campione di dati ottenuto; in altri casi il lavoro dello statistico inizia prima che i dati siano stati ottenuti, e il suo primo obiettivo consiste nell'ideare un procedimento ottimale per la loro raccolta.

La parte della statistica che si occupa di illustrare e sintetizzare i dati è detta statistica descrittiva.

La parte della statistica che si occupa di trarre conclusioni su quali metodi siano più consoni è detta inferenza statistica.

Per poter giungere a conclusioni pienamente giustificate, è spesso necessario fare alcune assunzioni sulla probabilità che i dati da analizzare a misura assumano i diversi valori possibili. L'insieme di queste ipotesi è detto modello probabilistico per i dati.

A volte la natura dei dati suggerisce la forma del modello probabilistico da adottare.

L'inferenza statistica si basa sul presupposto che importanti aspetti del fenomeno sotto studio possano essere descritti in termini di probabilità.

La statistica è normalmente interessata ad ottenere informazioni su un insieme completo di oggetti detto popolazione. Si cerca di imparare qualcosa sulla popolazione scegliendo ed esaminando dei sottogruppi di essa, detti campioni. Quest'ultimo deve contenere informazioni sulla popolazione complessiva ed essere quindi rappresentativo di questa.

Ogni criterio di selezione non casuale finisce con il produrre campioni che sono automaticamente sbilanciati verso volontà particolari.

CAPITOLO 2: STATISTICA DESCRITTIVA

Quando i dati non sono numerici ma categorici è opportuno utilizzare il grafico a torta. Si costruisce tracciando un cerchio e suddividendolo in tanti settori circolari quante sono le categorie distinte dei dati, ogni settore con un angolo al centro è proporzionale alla frequenza della categoria corrispondente.

Raggruppamento di dati, istogrammi, olive e diagrammi stem and leaf: quando il campione presenta un numero di dati numeroso sorge spontanea l'idea di dividere i dati in gruppi di valori contigui, o classi, e poi presentare con grafici e tabelle il numero di dati che cadono nell'intervallo di valori assegnato a ciascuna classe. La scelta di quante classi adottare è un fattore importante, infatti da un lato se si prendono poche classi si perde troppe informazioni sulla posizione che avevano i dati all'interno degli intervalli di classe, dall'altro, con troppe classi le frequenze di ciascuna assumerebbero valori troppo piccoli e diventerebbe difficile riconoscere la forma della distribuzione. I bordi di una classe sono gli estremi del suo intervallo. Il grafico a barre delle frequenze delle classi prende il nome di istogramma. Un diverso tipo di rappresentazione di un insieme di dati è il grafico delle frequenze cumulative. Con ciò si intende una curva sul piano cartesiano per cui le ascisse rappresentano i possibili valori dei dati, e le ordinate indicano il numero la frazione di dati che sono minori o uguali a valori in ascissa. Una maniera efficiente di organizzare un numero non troppo grande di dati è il diagramma stem and leaf. Per costruirlo, occorre dividere le cifre di ogni dato numerico in due parti, una più significativa, (lo stem), e una meno significativa, (la leaf). Ad esempio se tutti i dati fossero numeri di due cifre, sarebbe naturale scegliere le decine come stem e le unità come leaf. Ad esempio il numero 62 diventa: STEM LEAF 6 2

Media, mediana e moda campionarie:

supponiamo di avere un insieme x1, x2,..., xn di n dati (o come anche si dice, un campione di ampiezza o numerosità pari a n). La media campionaria è la media aritmetica di questi valori. Si dice media campionaria e si denota con X̄, la quantità

X̄ = (1/n) ∑i,=1n Xi

Definizione

Si dice deviazione standard campionaria e si denota con la quantità:

S = sqrt((1/(n-1)) * Σ (xᵢ - x̄)²)

Percentili Campionari e Box Plot

Il percentile k-esimo di un campione di dati è un valore che è maggiore di una percentuale k dei dati e minore della restante percentuale 100-k. k è un numero tra 0 e 100.

Definizione

Sia k un numero intero, 0 < k < 100.

Assegnato un insieme di dati numerici, ne esiste sempre uno che è contemporaneamente maggiore o uguale di almeno il K percento dei dati, è minore o uguale di almeno il 100-K percento dei dati. Se il dato con queste caratteristiche è unico, esso è per definizione il percentile k-esimo nell'insieme dei dati considerato. Se invece non è unico, allora sono esattamente due, e in questo caso il percentile k-esimo è definito come la loro media aritmetica. Quindi per determinare il percentile k-esimo di un campione di numerosità n occorre trovare quello o quei dati tali che, detto p il rapporto K/100, almeno np tra tutti i dati del insieme siano minori uguali a loro almeno n(1-p) tra tutti i dati dell'insieme siano maggiori uguali a loro.

Per prima cosa disponiamo i dati in ordine crescente. Se il numero np non è intero, l'unico dato che soddisfa le richieste è quello che occupa la posizione data da np arrotondata all'intero successivo.

Esempio

n = 22 k = 80 p = k/100 = 0.8 np = 22 * 0.8 = 17.6 → Trovare un dato maggiore o uguale (≥) almeno 18 → Trovare un dato minore o uguale (≤) almeno 5

Esempio 2.3.8

Uso tabella pag. 29.

p = 0.1 Calcolo 10° percentile:

n = 25 np = 25 * 0.1 = 2.5 → Il dato nuovo più piccolo è 52.673.

Diagrammi di Venn ed Algebra degli Eventi

S (spazio degli esiti) contiene il resto della figura (ovvero gli eventi). Gli eventi da prendere in considerazione sono rappresentati da curve chiuse nel rettangolo S.

Leggi di De Morgan:

  • (E ∪ F)c = Ec ∩ Fc
  • (E ∩ F)c = Ec ∪ Fc

Assiomi di Probabilità

Se si ripete molte volte un esperimento nelle stesse condizioni, si verifica che la frazione dei casi in cui si verificherà un dato evento tenderà ad un valore costante.

Le probabilità dei vari eventi devono rispettare alcuni assiomi dal significato intuitivo.

  1. 0 ≤ P(E) ≤ 1
  2. P(S) = 1
  3. P(∪i=1n Ei) = Σi=1n P(Ei)   n = 1, 2,..., ∞

Notiamo dagli Assiomi 2 e 3 che E e Ec sono eventi disgiunti inflitti.

1 = P(S) = P(E ∪ Ec) = P(E) + P(Ec) ⟹ P(Ec) = 1 - P(E)

Per ogni evento E ⊆ S vale la relazione: P(Ec) = 1 - P(E)

La probabilità che un evento non si verifichi (Ec) è pari a 1 meno la probabilità che l'evento si verifichi (E).

EVENTI INDIPENDENTI

Nel caso in cui P(E|F) = P(E) diciamo che i due eventi sono indipendenti.

In formula: P(E|F) = P(E ∧ F) / P(F)

P(E ∧ F) = P(E) · P(F)

  • E e F sono indipendenti ⇔
  • Se E e F sono indipendenti lo sono anche E e Fc
  • I tre eventi E, F e G si dicono indipendenti se valgono tutte e quattro le seguenti equazioni:
  1. P(E ∧ F ∧ G) = P(E) · P(F) · P(G)
  2. P(E ∧ F) = P(E) · P(F)
  3. P(E ∧ G) = P(E) · P(G)
  4. P(F ∧ G) = P(F) · P(G)

Analogamente:

P(E ∧ (F ∪ G)) = P[(E ∧ F) ∪ (E ∧ G)]

= P(E ∧ F) + P(E ∧ G) - P(E ∧ F ∧ G)

= P(E)P(F) + P(E)P(G) - P(E)P(F ∧ G)

= P(E)[P(F) + P(G) - P(F ∧ G)]

= P(E) P(F ∪ G)

Dettagli
Publisher
A.A. 2016-2017
126 pagine
1 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher pael di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma La Sapienza o del prof Perone Pacifico Marco.