Estratto del documento

Metodi statistici per il management

Richiami di inferenza statistica

Probabilità: è un qualsiasi processo di osservazione o misurazione.

Esperimento

È aleatorio quando di esso non si può predire con certezza il risultato (ad esempio, lancio di un dado o di una moneta).

Fenomeno

  • Evento elementare: indica uno dei possibili risultati della prova.
  • Evento non elementare: un evento che può essere a sua volta scomposto in più eventi elementari. Ad esempio, nel lancio di un dado, i possibili eventi elementari sono {1,2,3,4,5,6}; mentre un esempio di evento non elementare è 'esce un numero pari', che può essere scomposto in {2,4,6}.

Spazio campionario (Ω)

L'insieme degli eventi elementari di un esperimento.

Tipi di eventi

  • Evento certo: un evento che si deve necessariamente verificare; è rappresentato da tutti i punti dello spazio campionario.
  • Evento impossibile: un evento che non si può verificare; è definito dall’insieme vuoto Ø, che non contiene alcun punto campione.

La probabilità è un numero compreso tra 0 e 1 che misura il grado di incertezza sul verificarsi di un evento.

Algebra di Boole

Struttura matematica che definisce tutte le regole e le operazioni necessarie per un'algebra degli eventi. In questa struttura matematica sono definite tre operazioni fondamentali:

  • Negazione di un evento A: la sua negazione (o complemento) è data dall’evento 'A non si verifica'. P(Ā) = 1 - P(A).
  • Intersezione tra due eventi A e B: l'intersezione è data dall’evento in cui entrambi si verificano contemporaneamente. P(A∩B) = P(A) x P(B/A).
  • Unione tra due eventi A e B: l'unione è data dall’evento in cui almeno uno degli eventi si verifica. P(A U B) = P(A) + P(B) - P(A∩B).

Collezione di eventi e spazio campionario

Consideriamo la prova consistente nel lanciare una moneta due volte. L’insieme degli eventi elementari, nonché lo spazio campionario, è: {(TT), (TC), (CT), (CC)}. Possiamo definire la collezione di eventi EE come l'insieme dei sottoinsiemi di Ω:

  • Ø
  • {(TT)}
  • {(TC)}
  • {(CT)}
  • {(CC)}
  • {(TT), (TC)}
  • {(TT), (CT)}
  • {(TT), (CC)}
  • {(TC), (CT)}
  • {(TC), (CC)}
  • {(CT), (CC)}
  • {(TT), (TC), (CT)}
  • {(TT), (TC), (CC)}
  • {(TC), (CT), (CC)}
  • {(TT), (CT), (CC)}

Incompatibili

Due eventi, A e B, si dicono incompatibili se si verifica che A∩B = Ø, ossia i due eventi non possono verificarsi contemporaneamente.

Postulati

  • La probabilità è una funzione di insieme che associa a ogni evento un numero reale.
  • P(Ω) = 1.
  • Se A∩B = Ø, allora P(A U B) = P(A) + P(B).

Dal sistema di postulati sono deducibili vere proprietà, tra cui:

  • 0 ≤ P(A) ≤ 1
  • P(Ø) = 0
  • P(B c A) = P(B) - P(A)
  • P(Ā) = 1 - P(A)
  • Se A e B sono mutualmente esclusivi (A∩B=Ø), allora P(A U B) = P(A) + P(B)

Definizione classica di probabilità

La probabilità è data dal rapporto tra il numero dei casi favorevoli all’evento e il numero dei casi possibili, purché tutti ugualmente possibili.

Esempio: nel caso del lancio di un dado, ci sono sei eventi elementari, tutti ugualmente possibili, corrispondenti alle sei facce del dado. Se consideriamo come evento A, il presentarsi della faccia numero 5, la probabilità è P(A=5) = 1/6. Se avessimo definito l’evento A come il presentarsi di una faccia con un numero pari, i casi favorevoli ad A sarebbero stati 3 (i numeri 2,4,6) e la probabilità sarebbe stata 3/6 = 1/2.

Probabilità condizionate e indipendenza

In alcune situazioni si vuole valutare la probabilità di un evento, sapendo che si è già verificato un altro evento collegato.

Esempio: nel lancio di un dado, due eventi possibili:

  • Evento A: esce il numero 2, P(A)=1/6
  • Evento B: esce un numero pari, P(B) = 3/6 = 1/2

Ci poniamo questa domanda: qual è la probabilità che esca il numero 2 (evento A), se sappiamo che è uscito un numero pari (evento B)?

In questo caso P(B) = 1, P(A∩B) = P(A) = 1/6, e allora P(A/B) = (1/6) / (3/6) = 1/3. Si legge come probabilità condizionata di A dato B. Quando uno dei due eventi viene considerato certo, allora il numero dei suoi casi favorevoli è Ω, cioè l’insieme degli eventi elementari, ossia tutti i possibili risultati della prova.

Quindi: P(A/B) = P(A∩B) / P(B), viceversa: P(B/A) = P(B∩A) / P(A).

Eventi indipendenti

Due eventi sono indipendenti quando la probabilità del primo condizionata al secondo è uguale alla probabilità del primo non condizionata (e viceversa). Se P(A/B) = P(A) e P(B/A) = P(B), allora A e B sono indipendenti.

Se e solo se: P(A∩B) = P(A) x P(B), la probabilità che due eventi indipendenti si verifichino entrambi è uguale al prodotto delle loro probabilità.

Esempio: probabilità di fare testa due volte è data da probabilità di fare testa al primo lancio (0,50) x probabilità di fare testa al secondo lancio (0,50) = 0,50 x 0,50 = 0,25.

Esempi con dadi

DADO A DADO B
1 2
2 3
3 4
4 5
5 6
6 7

Evento E: punteggio minore di 6

P(E) = P(2) + P(3) + P(4) + P(5) = 1/36 + 2/36 + 3/36 + 4/36 = 10/36

Evento E2: punteggio minore di 6 o punteggio maggiore di 8

P(E2) = P(A U B)= P(A) + P(B) - P(A∩B), ma dato che P(A∩B) = 0, allora: P(A U B) = P(A) + P(B).

10/36 + [4/36 + 3/36 + 2/36 + 1/36] = 10/36 + 10/36 = 20/36 = 5/9.

Evento E3: punteggio pari o punteggio minore di 6

P(E3) = P(A U B) = P(A) + P(B) - P(A∩B)

18/36 + 10/36 - 4/36 = 24/36.

Evento E4: punteggio pari ∩ punteggio minore di 6

P(A∩B) = P(A) x P(B/A) = P(A) x 6/36 = 4/36.

Evento E5: dado A=1 e punteggio =7 (eventi indipendenti, regola del prodotto)

1/6 x 6/36 = 1/36.

Teorema della probabilità totale

Afferma che, dato un evento B e una partizione A1, A2, ..., An, possiamo scrivere la probabilità dell’evento B come:

P(B) = P(B/A1) x P(A1) + P(B/A2) x P(A2) + ... + P(B/An) x P(An).

Esempio: il 30% degli uomini fuma, rispetto al 40% delle donne. Se ci sono tanti uomini quante donne, qual è la probabilità che preso un individuo a caso sia fumatore?

B = fumatore, M = maschio, F = femmina

P(B) = P(B/M) x P(M) + P(B/F) x P(F) = 0,30 x 0,50 + 0,40 x 0,50 = 0,35 = 35%.

Variabili casuali o aleatorie

Una variabile casuale X è una funzione definita sullo spazio campionario che associa a ogni risultato elementare un unico numero reale. X: Ω → R (una variabile che attribuisce un valore reale ad uno dei possibili risultati della prova).

Esempio: nel lancio di un dado, si può associare all’esperimento una variabile casuale che assume valore 0 se esce una faccia pari e valore 1 se esce una faccia dispari.

Esempio: il numero di clienti che visitano un negozio in un intervallo di tempo costituisce una variabile casuale che assume valori discreti.

Variabile casuale discreta

Può assumere un insieme discreto (finito o numerabile) di numeri reali.

Variabile casuale continua

Può assumere tutti i valori compresi in un intervallo reale.

Se Ω è discreto, la variabile casuale sarà discreta, mentre se Ω è continuo, la variabile casuale può essere continua o discreta.

Consideriamo una prova consistente nell’osservare l’altezza di un individuo. In tal caso Ω è continuo perché contiene un’infinità non numerabile di eventi (tutte le possibili altezze). La variabile casuale X altezza (espressa per esempio in cm) è continua poiché può assumere, almeno in teoria, qualsiasi valore nell’intervallo (20,300). Se però consideriamo due eventi, E1 = altezza uguale o superiore ai 150 cm e E2 = altezza inferiore ai 150 cm, possiamo definire una variabile casuale X che assume valore 1 in corrispondenza di E1 e valore 0 in corrispondenza di E2. In tal caso, otteniamo una variabile casuale discreta.

In alcune situazioni potremmo essere interessati non alla probabilità che la variabile casuale X assuma uno specifico valore, ma alla probabilità che essa assuma un valore minore o uguale a un dato valore. In questo caso utilizziamo la c.d. funzione di ripartizione (esprime la probabilità che X non superi il valore di x).

Proprietà della funzione di ripartizione:

  • Monotona non decrescente.
  • Continua a destra.
  • F(-∞)=0, F(+∞)=1.

Per una variabile casuale X, la probabilità dell’intervallo [a,b] è data da: F(b) - F(a).

Valore atteso di variabili casuali

Il valore atteso E(X) di una variabile aleatoria X è definito come:

  • Se la variabile casuale è discreta: E(X) = ΣxP(x).
  • Esempio: X 2 3 4 5 6 7 8 9 10 11 12
  • P(X) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
  • E(X) = 2 x 1/36 + 3 x 2/36 + 4 x 3/36 + 5 x 4/36 + 6 x 5/36 + 7 x 6/36 + 8 x 5/36 + 9 x 4/36 + 10 x 3/36 + 11 x 2/36 + 12 x 1/36 = 7

Quando invece la variabile casuale è continua, E(X) è definito come: E(X) = ∫ x f(x) dx.

Varianza di variabili casuali

La varianza, indicata con V(X), è il valore atteso del quadrato dello scostamento della variabile casuale dalla sua media:

  • V(X) = E[(X - μ)2].
  • La varianza risulta nulla se X assume probabilità 1 in corrispondenza a un solo valore e probabilità 0 altrove, mentre è tanto più elevata quanto più alta è la dispersione intorno al valore atteso.

Deviazione standard

La deviazione standard è la radice quadrata della varianza.

Esempio: si consideri la distribuzione di probabilità connessa all’estrazione di una famiglia da un collettivo di 100 famiglie e all’osservazione del numero di figli presenti.

Numero di figli 0 1 2 3 4 5
Probabilità 0,20 0,35 0,25 0,12 0,06 0,02
  • E(X) = 0 x 0,20 + 1 x 0,35 + 2 x 0,25 + 3 x 0,12 + 4 x 0,06 + 5 x 0,02 = 1,55.
  • V(X) = 0,88.
  • SD(X) = √0,88 = 0,938.

Variabili casuali notevoli

Discreta

  • Binomiale: numero di successi in n prove.
  • Poisson: numero di eventi nel tempo.
  • Binomiale negativa: numero di tentativi per il primo successo.

Continua

  • Gaussiana: distribuzione utile per molti fenomeni.
  • Lognormale: in finanza per i livelli di prezzo.
  • Uniforme: per descrivere la massima incertezza.
  • Gamma: per fenomeni a valori positivi.
  • Beta: per fenomeni con supporto un intervallo (ad esempio, tasso % aleatorio).
  • Esponenziale: per descrivere il tempo tra eventi, morti, arrivi…

Statistica descrittiva e inferenza

Statistica: strumento conoscitivo atto ad analizzare in termini quantitativi un fenomeno collettivo.

Statistica descrittiva

Insieme di metodologie atte a descrivere e riassumere le caratteristiche della distribuzione di una o più variabili statistiche. L’obiettivo viene perseguito rilevando le variabili di interesse su un collettivo (popolazione).

Statistica inferenziale

Cerca di desumere dal campione un’informazione relativa all’intera popolazione. Come generalizzare dal campione all’intera popolazione.

Popolazione

La popolazione è l’insieme/collettivo delle unità statistiche, come: individui, famiglie, gruppi, città ecc. Una distinzione di base è quella tra popolazione finita e popolazione infinita. Una popolazione finita è un insieme costituito da N unità come per esempio, l’insieme di tutte le famiglie di una città. Dato un carattere X osservato su tutta la popolazione, i valori X1, X2, ..., XN, si possono calcolare i parametri della popolazione, ossia delle costanti che descrivono aspetti caratteristici della distribuzione del carattere nella popolazione stessa. I principali parametri utilizzati per descrivere una popolazione finita sono:

  • Media della popolazione: μ = ΣXi/N.
  • Varianza della popolazione: σ2 = Σ(Xi - μ)2/N.

Campione

Un campione è un sottoinsieme della popolazione. Se il nostro scopo è quello di ottenere informazioni sulla popolazione di interesse e non vogliamo o non possiamo effettuare un’indagine totale, allora lo strumento più adatto che abbiamo a disposizione è l’indagine campionaria. Questa consiste nell’estrazione e nello studio di un campione di unità della popolazione al fine di ottenere informazioni riguardanti alcuni parametri dell'intera popolazione. Si arriva in pratica a conclusioni sulla popolazione per mezzo dell’analisi di sole alcune unità della stessa popolazione, dette nel loro complesso campione.

Caratteristiche essenziali di un campionamento casuale

  • Tutte le unità della popolazione hanno uguale probabilità di fare parte del campione.
  • Ogni campione di ampiezza n ha la stessa probabilità di essere formato.

Statistica campionaria

Serve per lo studio dei dati raccolti. Statistiche di uso comune sono le seguenti:

  • Media campionaria: x̄ = Σxi/n.
  • Varianza campionaria: s2 = Σ(xi - x̄)2/(n-1).

Stima e stimatori

Lo stimatore è una variabile casuale utilizzata per stimare una caratteristica θ della popolazione e viene indicato con: ࠔΘࠔ. ࠒΘࠒ è una funzione che associa ad ogni possibile campione un valore del parametro da stimare. La stima è il valore numerico che lo stimatore assume in corrispondenza di un campione osservato. T è una variabile casuale e come tale è caratterizzata da una distribuzione campionaria.

Proprietà auspicabili per uno stimatore

  • Correttezza o non distorsione: Uno stimatore T è corretto di θ se E(T) = θ, altrimenti si dice distorto. La distorsione (bias) di uno stimatore T è uguale a: B(T) = E(T) - θ. Quindi T è corretto di θ, se e solo se la sua distorsione è uguale a 0.
  • Efficienza: Il nostro desiderio è che la stima sia il più possibile vicina al vero valore di θ. Tuttavia, poiché θ è ignoto, è impossibile stabilire di quanto T dista da θ. Quello che però possiamo richiedere è che, con alta probabilità, lo stimatore T presenti valori prossimi a θ. Chiamiamo quindi errore quadratico medio (MSE) una misura della possibilità di uno stimatore di avvicinarsi a θ. Quanto più elevata la probabilità che T assuma valori vicini a θ, tanto più piccolo sarà il valore di MSE(T). MSE(T) = E[(T - θ)2].
  • Consistenza: Possiamo dire che uno stimatore è consistente se la sua precisione aumenta all’aumentare della numerosità campionaria. Un stimatore T di un parametro θ è asintoticamente corretto se: limn→∞P(|T - θ| < ε) = 1 per ogni ε > 0.

Strategie per la costruzione di stimatori

  • Analogia: le stime sono calcolate sul campione trattandolo in modo analogo alla popolazione.
  • Metodo dei momenti: le stime sono calcolate uguagliando i momenti campionari ai momenti della popolazione.
Anteprima
Vedrai una selezione di 5 pagine su 20
Riassunti metodi statistici per il management Pag. 1 Riassunti metodi statistici per il management Pag. 2
Anteprima di 5 pagg. su 20.
Scarica il documento per vederlo tutto.
Riassunti metodi statistici per il management Pag. 6
Anteprima di 5 pagg. su 20.
Scarica il documento per vederlo tutto.
Riassunti metodi statistici per il management Pag. 11
Anteprima di 5 pagg. su 20.
Scarica il documento per vederlo tutto.
Riassunti metodi statistici per il management Pag. 16
1 su 20
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-P/08 Economia e gestione delle imprese

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher trovich di informazioni apprese con la frequenza delle lezioni di Metodi statistici per il management e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma Tor Vergata o del prof Borra Simone.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community