Anteprima
Vedrai una selezione di 4 pagine su 11
Riassunto esame Statistica, prof. Di Battista Pag. 1 Riassunto esame Statistica, prof. Di Battista Pag. 2
Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica, prof. Di Battista Pag. 6
Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica, prof. Di Battista Pag. 11
1 su 11
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

P(AUB)= P(A)+ P(B)

Il principio delle probabilità totali per eventi incompatibili può essere esteso a più di

due eventi.

La probabilità condizionata

Uno dei concetti più importanti del calcolo delle probabilità è la probabilità

condizionata ,ossia quando siamo interessati alla probabilità di un evento il cui

risultato è influenzato dal verificarsi di un altro evento.

Con P(A∩B)=P(A)P(B)

Indichiamo il principio delle probabilità composte per eventi indipendenti. Diremo che

due eventi A e B entrambi appartenenti allo spazio Ω sono stocasticamente

indipendenti se per essi vale il principio delle probabilità composte per eventi

indipendenti.

Il teorema di bayes

Un evento A di Ω si può esprimere, come :

A = A∩ Ω = A∩(U U U U,….,UU )

1 2 N

In definitiva la formula di Bayes sarà P U i P( A∨Ui)

( )

∑n

P(U|A)= P Ui P

( ) (A∨Ui)

i=1

Le variabili casuali

Il concetto di variabile casuale è una variabile quantitativa che associa a ogni

elemento W dello spazio Ω un numero reale.

i

Le variabili sono classificate in due grosse categorie:

- Discrete cioè costituite da un numero finito o infinità numerabile di valori

- Continue ovvero costituite da un numero infinito di valori compresi in un

intervallo di ampiezza finita o infinita.

Vengono definiti momenti ci permettono di definire dei parametri di una distribuzione

di probabilità.

La curtosi è la valutazione del comportamento della distribuzione di probabilità alle

code. Si avrà un valore alto della curtosi quanto più i valori nelle code distanti dalla

media hanno probabilità di verificarsi elevata.

Le scale di misura

Nominale, rappresenta un modo di categorizzare, la scala ditomica ha due soli valori, 1

e 0;mentre quella politomica vi sono più modalità

Ordinale, graduatorie d’ordine, relazioni di minoranza o maggioranza

Ad intervalli, stesse caratteristiche di una scala ordinale ma l’intervallo fra i valore

distribuiti rimane costante per tutta la sua estensione

Di rapporti partendo da 0 ci consente di determinare se una quantità è multipla di

un’altra.

Rilevazioni campionarie o parziali

La popolazione obiettivo di un indagine statistica è necessaria verificare la

disponibilità di base di campionamento che le corrisponda perfettamente.

La lista è un insieme ordinato di contrassegni delle unità delle popolazioni.

Un campione è casuale se tutte le unità della popolazione hanno probabilità non nulla

di essere incluse nel campione(probabilità di inclusione)

Campionamento probabilistico quando è possibile definire l’insieme C i tuti i campioni

distinti estraibili dalla popolazione ed a ciascun membro c(campione ) di tale insieme è

possibile assegnare a proori una probabilità di selezioni indicata con p(c).

Campioni non ragionati sono formati senza alcun ricorso a meccanismi di

casualizzazione

Campioni fortuiti formati da volontari o unità che transitano da passaggi obbligati

come frontiere.

Probabilità d’inclusione = campioni che includono l’i-esima unità ai quali si estende la

sommatoria probabilità semplice (o del primo ordine). Riferite alle coppie è definita

probabilità d’inclusione congiunta (o del 2° ordine) cioè che 2(i e j) siano inclusi nel

campione.

Approccio parametrico

Con approccio parametrico indichiamo l’attitudine a stimare i parametri sulla base dei

dati empirici osservati, in questo il modello teorico viene stabilito a priori seguendo

una predefinita ipotesi del comportamento del fenomeno reale, mentre con approccio

non parametrico la regolarità del fenomeno reale viene stabilita da una

approssimazione della distribuzione empirica utilizzando funzioni generiche o più in

generale curve che non rispondono a un ipotesi di comportamento.

Da un punto di vista formale le distribuzioni teoriche possono essere classificate in

diversi tipi

La distribuzione teorica è esplicitata da una funzione matematica del tipo y=f(x) e

dove il domino in cui è stato misurato il fenomeno reale tale che sia possibile

esprimere una legge che associa ad ogni valore del dominio, un valore reale in genere

espresso da una frequenza assoluta o relativa. Il dominio è espresso da una

successione infinita numerabile di modalità di misura a cui fa corrispondere un’altra

successione di valori reali.

Momenti di una distribuzione teorica

I momenti definiscono grandezze caratteristiche della distribuzione teorica e hanno la

capacità di riassumere in modo immediato e sintetico l’informazione relativa alla

distribuzione oggetto di studio.

Modello di Bernulli

Lo spazio di 2 misure è ripartibile tra due modalità successo e insuccesso

Assumendo che 0 sia la frequenza relativa del successo ovvero del verificarsi della

modalità A è immediato ricavare che 1-0 è la frequenza relativa dell’insuccesso, ossia

del verificarsi della modalità B. Una variabile quantitativa che rappresenti questo

schema può essere banalmente indicata:

X = x se si verifica l’evento A; x se si verifica l’evento B

i 1 2

La distribuzione teorica associata a questa variabile è:

xi 1-xi

f = 0 (1-0)

i

il cui unico parametro d’interesse è 0. Il modello bernoulliano lo indicheremo

x≈B(0).

La distribuzione binomiale

La distribuzione binomiale vfa’ riferimento ad uno schema teorico dove si deve

immaginare il fenomeno reale diviso in due gruppi,il primo misurabile con la

modalità A, il cui numero di unità è pari a ₥ , mentre l’altro misurabile con la

A

modalità B il cui numero di unità è pari a ₥ . Naturalmente la somma

B

rappresenta il complesso del fenomeno reale che è composto da un numero

finito di misure.

Distribuzione di Poisson(legge degli eventi rari)

Il fenomeno reale schematizzato dalla distribuzione binomiale dipende dalla

numerosità delle ripetizioni indipendenti indicato con ₥ e dalla frequenza

relativa 0 dei successi della misura di cui si vuole conoscere il numero degli

esiti favorevoli. La legge di poisson schematizza una variabile di fondamentale

importanza ed è utile per determinare il numero di volte in cui una misura

qualitativa d’interesse poco frequente si verifica in un dato intervallo di

tempo(o spazio).

Distribuzione normale o di Gauss

Il moello teorica più famoso per le moltelplici applicazioni sia a fenomeni reali è

il modello normale o curva di Gauss. Da un lato può essere utilizato come un

modello che pprossima molto verosimilmente una moltitudine di casi reali. La

maggior parte delle misure antropometriche si suppongono distribuirsi secondo

questo modello. Dall’altro suddetto modello assume un’importanza

fondamentale nell’ambito della teoria dell’inferenza statistica.

Variabile normale standardizzata

Quando si opera con il modello binomiale ci si accorge che il calcolo del

coefficiente binomiale è intrattabile da un punto di vista computazionale. Per

risolvere questo problema si ricorre ad un risultato asintotico dovuto a De

Monrvre che afferma quando P≈0,5 la distribuzione della binomiale è

simmetrica rispetto alla media.

Approccio inferenziale

L’approccio inferenziale assume che il fenomeno reale si costituito da un

numero finito, infinito o illimitato di repliche. In termini essenziali, l’approccio

inferenziale si articola in due parti:

Stima puntuale che rappresenta la procedura implementata per ottenere

- un valore rappresentativo di un parametro della popolazione

Stima intervallare che rappresenta la procedura con cui il ricercatore,

- ricava un intervallo di valori in cui si può ritenere sia contenuto il

parametro della popolazione.

Lo stimatore rappresenta un singolo valore, è una variabile casuale descritta da

una specifica distribuzione di probabilità.

La stima diretta è la media campionaria ,ossia la media della variabile casuale

doppia.

Proprietà degli stimatori

Abbiamo detto che la procedura di stima deve essere valutata per stabilire la

sua attendibilità. Una fase necessaria per raggiungere questo obiettivo è la

verifica delle proprietà auspicabili di un stimatore. In generale, le proprietà di

uno stimatore sono ricavate dalle caratteristiche della rispettiva distribuzione e

, dallo studio della sua sintesi e delle sue variabilità e forma.

Correttezza, ossia valutare il valore medio, cioè se la media della

- distribuzione coincide con il parametro della popolazione.

Consistenza, proprietà asintottica, deve verificare al crescere della

- numerosità campionaria. Si dice consistente se al crescere di

n(numerosità del campione) la distorsione diventa sempre più piccola e

tende a zero.

Efficienza, misura della variabilità della distribuzione di probabilità dello

- stimatore. Il prerequisito della correttezza di uno stimatore, è essenziale

in quanto si intuisce che uno stimatore con una bassissima variabilità

implica che la stragrande maggioranza dei campioni fornisce una stima

diversa dal reale parametro incognito della popolazione.

Stimatori con minimo errore quadratico medio

Un’utile prprietà di uno stimatore è quella dell’errore quadratico medio minimo.

Questa proprietà è utilizzata per valutare stimatori di parametri ottenuti

attraverso processi simulativi ossia quando si vuole tener conto sia della

variabilità dello stimatore(efficienza) sia del suo valor medio(correttezza).

Sufficienza, uno stimatore è sufficiente per 0 se esso riassume tutte le

informazioni presenti nella variabile n-pla campionaria.

Inferenza classica

L’inerenza classica è anche detta inferenza basata sulla verosimiglianza. Si

basa sul principio della stima dei parametri,ossia sul procedimento con cui da

campione osservato si traggono informazioni per assegnare a 0(0 ,0 ,0 …)un

1 2 3

insieme di valori. Si distinguono due casi, nel primo di parlerà di stima

puntuale, intendendo con essa il passaggio da un punto dello spazio

campionario ad un punto dello spazio parametrico.

Proprietà degli stimatori di massima verosimiglianza

Il metodo di stima di massima verosimiglianza fornisce uno stimatore puntuale

del parametro del modello decisionale studiato. Al variare dei possibili campioni

definendo a sua volta una distribuzione di probabilità. In questo contesto e per

la trattazione degli argomenti che seguino è necessario introdurre la funzi

Dettagli
Publisher
A.A. 2012-2013
11 pagine
3 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher ND64 di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli studi Gabriele D'Annunzio di Chieti e Pescara o del prof Di Battista Tonio.