Media
La media è la somma di valori diviso il loro numero. È un indice di statistica descrittiva e segue il principio di anteriorità. Il valore della media è compreso tra il minimo e il massimo dei dati; se fosse ripetuta in modo costante, manterrebbe invariata la somma. Il fenomeno si discosta per fattori accidentali di … Unità di misura: …
Nel momento in cui calcoliamo la media campionaria, calcoliamo la stima dell’ignoto valore della media della popolazione. La media calcolata su un campione si può interpretare come variabile aleatoria media campionaria. Se il campione fosse la popolazione, la media sarebbe il peso delle confezioni se avessero tutte lo stesso peso.
Mediana
Formula di calcolo per n pari: ((n/2) + (n/2 + 1)) / 2
Formula di calcolo per n dispari: (n + 1) / 2
La mediana nel campione in esame si trova in posizione … rispetto al campione ordinato non decrescente. Questo valore divide il campione in due parti di uguale frequenza. Il 50% delle osservazioni riporta un valore < a …, la restante parte valori >.
Moda
La moda è un indice di posizione per fenomeni qualitativi o al più discreti. Ammontare spesa: fenomeno continuo.
Distribuzione simmetrica e asimmetrica
Media e mediana restituiscono stessi valori: distribuzione nel campione simmetrica, senza valori anomali.
Media e mediana restituiscono diversi valori: distribuzione asimmetrica, valori anomali; l'uso della mediana è preferibile come indice di sintesi dell’ordine di grandezza del fenomeno.
Stima della variabilità
Stima della variabilità dei pesi delle confezioni: stima corretta di sigma: s=radice quadrata della sommatoria delle differenze tra xi e media campionaria alla seconda, diviso n-1. VAR.C.
Stima della variabilità della media campionaria: SE: s/radice quadrata di n.
Teorema centrale del limite (TCL)
Campioni grandi (probabilistici): la forma di distribuzione della v.a. media campionaria è legata alla v.a. normale oppure standardizzare N(0,1). Campioni piccoli: t di Student con n-1 gradi di libertà: solo se la distribuzione è normale, sigma ignoto e stimato da s corretto, ovvero calcolo sul campione con n-1 al denominatore.
Distribuzione v.a scostamento standardizzato media campionaria: con n piccolo, sigma ignoto e stimato da s. No TCL. Assunzione che consente di applicare t di Student con n-1 g è la normalità dell’universo. Nel caso di linea produttiva, le differenze tra le osservazioni sono accidentali e l'universo normale. T di student. Se non conosciamo la distribuzione, no T di Student.
Intervallo di confidenza
Intervallo di confidenza per la media in piccoli campioni: Pr(Xsoprassegnato-ty/2 per s/radice di n <= mu <= Xsoprassegnato-ty/2 per s/radice n) = 1-y
No ragionevole distribuzione normale: le spese sostenute dai consumatori; le differenze tra i valori della spesa non sono dovute al caso o accidentalmente. Fattori asimmetrici che determinano una distribuzione asimmetrica come è solito per fenomeni aziendali.
Matrice classi
Argomento della funzione che definisce le classi di intervallo. “confidenza.t” calcola il risultato del prodotto tra t gamma/2 ed s/radice(n); oppure possiamo utilizzare “analisi dati” “statistica descrittiva” “livello di confidenza per la media” che implementerà automaticamente la formula di calcolo con la t di Student.
CONFIDENZA.T: per campioni piccoli, l’output dà il prodotto tra errore standard e percentile, ovvero l’ampiezza dell’intervallo che dobbiamo sommare o sottrarre alla media campionaria per ottenere gli estremi superiori e inferiori dell’intervallo. (gamma, deviazione standard e dimensioni campione).
CONFIDENZA.NORM
Per campioni >100, l’ampiezza dell’intervallo, prodotto tra percentile e errore standard, che bisogna sommare o sottrarre alla media campionaria per ottenere intervallo superiore e inferiore. (gamma, deviazione standard, dimensioni).
INV.T.2T
Percentile T di Student per due code. Probabilità e gradi di libertà.
Frequenza relativa
La frequenza relativa è il rapporto tra il numero di volte in cui si verifica un evento in un’indagine statistica e il numero totale di eventi. P: 392/1000. Numero di volte che un valore (quantitativo) o una categoria (qualitativo) è osservato in un dataset. Numero di volte che la modalità è presente nella variabile.
Excel: frequenza. matrice_dati: input dei valori originari del fenomeno su cui si vuole calcolare la distribuzione di frequenze. Matrice_classi: zona che contiene gli estremi superiori delle classi. Intervallo di confidenza per la frequenza relativa: frequenza relativa o percentuale dell’universo. P: frequenza relativa nel campione p: fenomeno che vogliamo stimare/n° del campione.
E(P): pi greco. Deviazione standard: (P): (pi greco(1-pi greco))/n. Caso di grandi campioni N(0,1): DISTRIBUZIONE DI P Z(P):P-pi greco/sigma(P). PERTANTO: Pr: (-zy/2 <= Z(P) <= zy/2) = 1-y. p: stima puntuale di pi greco. Stima di sigma (P), ossia il suo errore standard dato da s(P) = radice(1-p)/n.
Intervallo di confidenza per la frequenza relativa dell’universo pi greco. Pr(p-zy/2 per s(P) <= pi greco <= p+zy/2 per s(P)) = 1-y.
Frequenza relativa: quota di mercato di un prodotto (raggiungimento di un target); percentuale aderenti a una promo; probabilità che un consumatore aderisca a una promo.
Quantili
1° Quartile: è il valore che divide il campione/una graduatoria in 2 parti. Il 25% a sinistra e 75% a destra. Q1: 0,25:25%. La funzione esc. Percentile implementa la formula: posto d’ordine: k(n+1), nel campione in esame. La funzione inc. percentile calcola il posto d’ordine: k(n+3). Bisognerà fare la media del primo e terzo posto per ricavare il valore del primo quartile.
Esc. Percentile non include gli estremi dell’intervallo (0,1); la funzione restituisce un errore. Inc. percentile non dà errore ma è privo di senso poiché divide un campione di 7 in 100 parti.
3° Quartile: il 75% dei presenti …
-
Appunti Statistics for management
-
Statistics for experiments
-
Statistics for stochastic processes
-
Appunti statistics for finance