Anteprima
Vedrai una selezione di 6 pagine su 25
Appunti di lezione di statistica aziendale  Pag. 1 Appunti di lezione di statistica aziendale  Pag. 2
Anteprima di 6 pagg. su 25.
Scarica il documento per vederlo tutto.
Appunti di lezione di statistica aziendale  Pag. 6
Anteprima di 6 pagg. su 25.
Scarica il documento per vederlo tutto.
Appunti di lezione di statistica aziendale  Pag. 11
Anteprima di 6 pagg. su 25.
Scarica il documento per vederlo tutto.
Appunti di lezione di statistica aziendale  Pag. 16
Anteprima di 6 pagg. su 25.
Scarica il documento per vederlo tutto.
Appunti di lezione di statistica aziendale  Pag. 21
1 su 25
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Mediana

In una lista ordinata, la mediana è il valore centrale (50% sopra e 50% sotto). Non è influenzata da valori estremi. Se il numero di valori è dispari, la mediana è il valore centrale. Se il numero di valori è pari, la mediana è la media dei due valori centrali. La mediana può essere calcolata solo se i dati sono ordinabili. Quando si hanno tanti dati (200), si calcola la cumulata delle frequenze (Fi). La mediana è il valore nel quale Fi supera 0.5. Se un valore della cumulata è 0.5, la mediana è la media tra quel valore e quello successivo.

Media aritmetica

La media aritmetica è la misura centrale più comune. È la somma dei valori diviso il numero di valori. È influenzata da valori estremi. Proprietà della media aritmetica:

  • Il valore è sempre compreso fra i due estremi
  • La somma degli scarti è zero
  • Proprietà della linearità

La media è usata in generale, a

Meno che ci siano valori estremi (outlier). La mediana è usata spesso siccome non è influenzata da valori estremi.

La FORMA DELLA DISTRIBUZIONE descrive come i dati sono distribuibili; può essere SIMMETRICA o ASIMMETRICA:

  • Obliqua a sinistra quando la media < mediana
  • Obliqua a destra quando la mediana < media
  • Simmetrica mediana = media

Oltre alla Mediana si possono calcolare altri due valori, i QUARTILI che dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori:

  • Il primo quartile Q1, è il valore per il quale il 25% delle osservazioni sono minori e 75% sono maggiori di esso.
  • Il secondo quartile Q2, è il valore che coincide con la mediana.
  • Il terzo quartile Q3, è il valore per il quale il 75% delle osservazioni sono minori e il 25% sono maggiori di esso.

MISURE DI VARIABILITÀ: Ci dicono se i dati sono fra loro simili o molto diversi. Forniscono informazioni sulla dispersione o variabilità.

dei valori.

CAMPO DI VARIAZIONE è il più semplice ed è la differenza fra il massimo e il minimo dei valori osservati.

I suoi svantaggi sono:

  • Ignora il modo in cui i dati sono distribuiti
  • È sensibile agli outlier

DIFFERENZA INTERQUARTILE

Con essa possiamo eliminare il problema degli outlier.

È la differenza fra il terzo quartile (Q3) e il primo quartile (Q1).

IRQ = Q3 - Q1

Elimina i valori osservati più alti e più bassi e calcola il campo di variazione del 50% centrale dei dati.

VARIANZA DELLA POPOLAZIONE

È la media dei quadrati delle differenze fra ciascuna osservazione e la media. È indicata con sigma quadro.

VARIANZA CAMPIONARIA

È la media approssimata dei quadrati delle differenze fra ciascuna osservazione e la media. Si indica con quadro.

Proprietà della varianza:

  • È sempre positiva o nulla (tutti i valori della distribuzione sono uguali)
  • Posso farla anche come media dei valori di x quadro meno la media
di x elevata al quadrato.
SCARTO QUADRATICO MEDIO DELLA POPOLAZIONE O MEDIAZIONE STANDARD DI POPOLAZIONE
Misura la variabilità comunemente usata e mostra la variabilità rispetto alla media.
Ha la stessa unità di misura dei dati originali.
Si indica con sigma.
SCARTO QUADRATICO MEDIO CAMPIONARIO O MEDIAZIONE STANDARD CAMPIONARIA
Misura la variabilità comunemente usata e mostra la variabilità rispetto alla media.
Ha la stessa unità di misura dei dati originali.
Si indica con S.
PROPRIETA’ DELLA VARIANZA
1- è sempre positiva o nulla (tutti i valori della distribuzione sono uguali)
2- posso farla anche come media dei valori di x^2 meno la media di x elevata al quadrato
Vantaggi della varianza e dello scarto quadratico medio:
- Calcolati usando tutti i valori nel set di dati
- Valori lontani dalla media hanno più peso poiché si usa il quadrato delle deviazioni dalla media
TEOREMA DI CHEBYSHEV
Per ogni popolazione con media, scarto quadratico

e k > 1, la percentuale di osservazioni che appartengono all'intervallo "µ (media) ± k σ (scarto quadratico)" è almeno 100[ 1- (1/k )] %

Indipendentemente da come i dati sono distribuiti, almeno (1 - 1/k ) dei valori cadranno entro k scarti quadratici medi dalla media (per k > 1)

LA REGOLA EMPIRICA

Se la distribuzione dei dati ha una forma campanulare, allora l'intervallo:

  • µ (media) ± 1σ (scarto quadratico) contiene circa 68% dei valori della popolazione o del campione
  • µ ± 2σ contiene circa 95% dei valori della popolazione o del campione
  • µ ± 3σ contiene circa il 99.7% dei valori della popolazione o del campione

COEFFICIENTE DI VARIAZIONE

Misura la variabilità relativa, è sempre in % e mostra la variabilità relativa rispetto alla media.

Può essere usato per confrontare due o più set di dati misurati con unità di misura diversa.

CV =

(S/X) * 100% S= deviazione standard X= media Si calcola allo stesso modo sia per il campione che per la media La MEDIA PESATA viene usata quando i dati sono già raggruppati in n classi, con wi valori nella i-esima classe. La COVARIANZA CAMPIONARIA misura la forza della relazione lineare tra due variabili. Riguarda solo la forza della relazione e non implica un effetto casuale. Si indica con COV. Covarianza fra due variabili: Cov (x,y) >0 x e y tendono a muoversi nella stessa direzione Cov (x,y) < 0 x e y tendono a muoversi in direzioni opposte Cov (x,y) = 0 x e y non hanno relazione lineare COEFFICINETE DI CORRELAZIONE Misura la forza relativa della relazione lineare tra due variabili. Coefficiente di correlazione della popolazione è indicato con ρ = Cov (x,y) / σ σ Coefficiente di correlazione campionario è indicato con r= Cov (x,y) / s sx y Le caratteristiche sono: - non hanno unità di misura - campo di

Variazione fra -1 e 1: quanto più è vicino a 1, tanto più è forte la relazione lineare positiva; quanto più è vicino a 0, tanto più è debole la relazione lineare.

CALCOLO DELLE PROBABILITÀ

Esperimento aleatorio: un processo che porta ad un risultato incerto (es. tiro del dado)

Evento elementare: un possibile risultato di un esperimento aleatorio (es. esce il 6)

Spazio Campionario: l'insieme di tutti i possibili risultati di un esperimento aleatorio (es. {1,2,3,4,5,6})

Evento qualsiasi: sottoinsieme di eventi elementari di uno spazio campionario (es. esce un numero pari)

L'intersezione di eventi: se A e B sono due eventi in uno spazio campionario S, allora l'intersezione è l'insieme di tutti gli elementi elementari in S che appartengono sia ad A, sia a B.

A e B sono eventi mutuamente esclusivi se non hanno in comune alcun evento elementare, quindi l'insieme A intersecato a B è

vuoto.

L'unione di eventi se A e B sono due eventi in uno spazio campionario S, allora l'unione (A U B) è l'insieme di tutti gli eventi elementari di S che appartengono ad A oppure a B.

Gli eventi sono collettivamente esaustivi se compongono interamente lo spazio campionario.

L'evento complementare di un evento A è l'insieme di tutti gli eventi elementari nello spazio campionario che non appartengono ad A. L'evento complementare è indicato con A (con il trattino sopra).

La PROBABILITÀ è la possibilità che un evento incerto si manifesti (sempre tra 0 e 1).

Se è = 1 è CERTO (esce un numero tra 1 e 6).

Se è = 0 è IMPOSSIBILE (es. esce un numero > di 6).

Ci sono 3 approcci per valutare la probabilità di un evento certo:

- Probabilità CLASSICA che è calcolato come "numero degli eventi elementari che soddisfano la condizione dell'evento" / "numero

complessivo di eventi elementari dello spazio campionario”

Ipotizza che tutti i risultati dello spazio campionario siano ugualmente possibili- Interpretazione FREQUENTISTA che è calcolata come “numero di eventi nellapopolazione che soddisfano l’evento A” / “numero complessivo di eventi nellapopolazione”

Probabilità SOGGETTIVA che è un’opinione o credenza individuale circa la probabilità del verificarsi di un evento certo.

ASSIOMI DELLA PROBABILITA’

  1. se A è un qualunque evento nello spazio campionario S, allora la probabilità deve essere sempre compresa fra o e 1.
  2. Sia A un evento di S e indichiamo con O gli eventi elementari allora P(A) è la somma della probabilità degli eventi elementari che compongono l’evento A.
  3. P(S) = 1

REGOLE DELLA PROBABILITA’

  1. regola dell’evento complementare P(A) = 1- P(A)
  2. regola dell’evento nullo P(0) = 0
  3. regola additiva

La probabilità dell'unione di due eventi è P(A U B) = P(A) + P(B) - P(A intersecato B)

PROBABILITÀ CONDIZIONATA

La probabilità che si verifichi un evento dato che se ne è verificato un altro.

P(A/B) = P (A intersecato B) / P(B)

P(B/A) = P (B intersecato A) / P(A)

INDIPENDENZA STATISTICA

Due eventi sono statisticamente indipendenti se e solo se P(A intersecato B) = P(A) P(B)

Sono indipendenti quando la probabilità di un evento non è influenzata dall'altro evento

Se A e B sono indipendenti allora

P(A/B) = P(A) se P(B)>0

P(B/A) = P(B) se P(A) > 0

PROBABILITÀ CONGIUNTE E MARGINALI

La probabilità di un evento congiunto si calcola facendo "numero di eventi semplici che soddisfano Ai e Bj" / "numero complessivo di eventi elementari"

Guardando la tabella, la probabilità marginale è la somma di tutte le congiunte di una riga o di una colonna.

GLI ODDS

Sono dati dal rapporto tra la

'interno di un intervallo. Es. altezza di una persona o temperatura ambiente. Le distribuzioni di probabilità descrivono la probabilità di ottenere i diversi valori di una variabile aleatoria. Esistono diverse distribuzioni di probabilità, tra cui la distribuzione uniforme, la distribuzione normale e la distribuzione di Poisson. La distribuzione uniforme è caratterizzata da una probabilità costante per ogni valore all'interno di un intervallo. Ad esempio, se lanciamo un dado equo, ogni faccia ha la stessa probabilità di uscire. La distribuzione normale, o distribuzione gaussiana, è una delle distribuzioni più comuni. È caratterizzata da una forma a campana e ha una media e una deviazione standard che determinano la sua posizione e dispersione. La distribuzione di Poisson è utilizzata per modellare eventi rari che si verificano in un intervallo di tempo o spazio. Ad esempio, il numero di telefonate ricevute in un call center in un'ora può seguire una distribuzione di Poisson. Queste sono solo alcune delle distribuzioni di probabilità più comuni. Ogni distribuzione ha le sue caratteristiche e viene utilizzata per modellare diversi tipi di dati.
Dettagli
A.A. 2022-2023
25 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher ilanovantanove di informazioni apprese con la frequenza delle lezioni di Statistica aziendale e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università Politecnica delle Marche - Ancona o del prof Capogrossi Chiara.