vuoi
o PayPal
tutte le volte che vuoi
QUANTILI:
Il primo quartile è il valore che divide il campione o una graduatoria in due parti: il 25% a sinistra e il 75% a destra. Viene indicato come Q1 e corrisponde al 25% del campione.
La funzione esc. Percentile implementa la formula del posto d'ordine: k(n+1) nel campione in esame. La funzione inc. percentile calcola il posto d'ordine: k(n+3). Per ottenere il valore del primo quartile, è necessario fare la media tra il primo e il terzo posto.
La funzione esc. Percentile non include gli estremi dell'intervallo (0,1) e restituisce un errore. La funzione inc. percentile non restituisce un errore, ma è priva di senso poiché divide un campione di 7 in 100 parti.
Il terzo quartile, indicato come Q3, rappresenta il 75% dei dati del campione che presenta un valore inferiore, mentre la restante parte ha un valore superiore. Le funzioni di Excel, inc. percentile e esc. percentile, implementano rispettivamente le formule k(n+3) e k(n+1). La differenza tra le due funzioni è che inc. percentile include gli estremi dell'intervallo (0,1), mentre esc. percentile non li include.
L'errore standard è una stima della variabilità della media campionaria.
SE:S/RADICE DI NNel caso in cui il campionamento venisse ripetuto infinite volte, ci si aspetta che la media campionaria (prezzo medio) differisca dalla vera media (valore atteso della media campionaria) del valore dell'errore standard. Se n cambia, cambia il denominatore dell'errore standard. Se n è 250 e lo trasformiamo in 25, l'errore standard aumenterà di 5 volte.
DEVIAZIONE STANDARD DEL CAMPIONE: s: radice quadrata della sommatoria delle differenze di xi e la media campionaria al quadrato, diviso n-1.Il risultato è la differenza media tra gli scarti dei valori osservati e la media campionaria. Stessa unità di misura del fenomeno e stima lo scostamento quadratico medio del valore degli acquisti sull'intera popolazione dei consumatori. Dev.st.c o dev.st.p. indice di dispersione statistico.
Distribuzione di frequenza: matrice_classi definisce la funzione classi di intervallo. Come? CTRL+SHIFT+INVIO perché l'output fornito
dalla funzione "frequenza" deve essere ottenuto su più celle in forma di matrice, una per ogni classe di frequenza. Definisco soggettivamente gli estremi delle classi e scrivo nelle celle gli estremi di queste classi. Funzione: frequenza. Per variabili discrete, non continue. Altrimenti distribuzione di frequenza è 1. Intervallo chiuso della classe: si indicano sia il limite minimo che il limite massimo (estremo inferiore e superiore). Intervallo aperto della classe: indichiamo l'intervallo inferiore e lasciamo aperto l'intervallo superiore. 10>. Si illustrino le differenze nella procedura quando l'ultima classe è aperta. È necessario scrivere i valori superiori delle classi chiuse ed omettere la classe aperta. Si seleziona un numero di celle di output pari al numero delle classi chiuse + 1 e si imposta la funzione frequenza utilizzando la combinazione ctrl+shift+invio. Una volta ottenuto l'output basta rinominare laclasseaperta.Mediana: indice di ordine di grandezza statistico, varianza: indice di variabilità dei dati: var.p, var.cla varianza campionaria sigma quadro/n: valutare le possibili differenze dell'ammontare delle possibili realizzazioni della v.a. media campionaria. Unità di misura al quadrato. Intervallo di confidenza per la media di grandi campioni: Pr(-zy/2 ≤ Z(Xsoprassegnato) ≤ zy/2) = 1-y. Funzioni inverse di excel che danno i percentili della funzione di ripartizione: INV.NORM.S. Intervallo di confidenza media della popolazione: obiettivo: determinare gli estremi dell'intervallo all'interno del quale, con probabilità prefissata, sia contenuto il valore incognito del parametro dell'universo. Pr(Xsoprassegnato-zy/2 per s/√n ≤ mu ≤ Xsoprassegnato+zy/2 per s/√n) = 1-y. "confidenza.t" o "confidenza.norm." la quale calcola ilrisultato del prodotto è trattato come gamma diviso 2 ed s diviso radice di n; oppure possiamo usare "analisi dati" "statistica descrittiva" "livello di confidenza per la media" che implementerà automaticamente la formula di calcolo con la t di Student. Dopo aver ottenuto la deviazione standard campionaria quindi s, quindi DEV.ST.C. posso ottenere l'errore standard della media campionaria s diviso radice quadrata di n. VERIFICA D'IPOTESI: attenzione focalizzata su un parametro vero o falso. Risultato verifica ipotesi: dato da una decisione sulla veridicità del valore ipotizzato. Verificare se l'universo da cui si è estratto un campione presenta una caratteristica ipotizzata a priori. H0 è l'ipotesi che vogliamo sottoporre a verifica. H0: mu = mu (popolazione). Zona di accettazione o rifiuto sulla base delle osservazioni campionarie e considerando la distribuzione campionaria della statistica test. Assumendo H0 vera. Zona di rifiuto: se ilvalore dell'indice statistico calcolato nel campione cade nella zona di rifiuto si respinge l'ipotesi nulla e si accetta quella alternativa. Zona di accettazione di H0 comprende i valori restanti. ). Errore 1° specie: rifiuto ipotesi nulla quando è vera; probabilità di commettere errore di 1° specie LIVELLO DI SIGNIFICATIVITÀ y, che si fissa basso per contenere errore; errore 2° specie: accetto ipotesi nulla quando è falsa. Livello di significatività osservato: p-value: probabilità di ottenere valori più estremi della statistica test Z sopra segnato quando H0 è vera. Excel: DISTRIB.T DISTRB.T.DS. DISTRIB.2T ottengo direttamente il p-value. Oppure DISTRIB.NORM.STÀ Z è il valore della statistica test, cumulativo 1. P-value: somma delle due probabilità. Tanto più p-value piccolo, maggiore evidenza campionaria contro H0. Verifica di ipotesi media caso di grandi campioni: campione proviene da ununiverso con media uguale a mu0. H0: mu=mu0. (per verifica d'ipotesi ricorso a v.a. media campionaria). TCL è N(0,1). H1: mu diverso da mu0. Livello di significatività y. Per rifiutare l'ipotesi nulla è sufficiente scostamento standardizzato nel campione z(x̄) = (x̄ - mu0) / radice di n. Se il valore di z(x̄) cade nella zona di rifiuto, quindi per z(x̄) < -zy/2 o z(x̄) > +zy/2 allora si rifiuta H0 al livello di significatività y. Differenza x̄ e mu0: sistematiche. Se invece z(x̄) cade nell'intervallo di accettazione: -zy/2 < x̄ < +zy/2. Differenze x̄ e mu dovute al campionamento. Ipotesi alternativa: H1: (vero parametro diverso da teta con 0). H1: mu campionario diverso da mu; H1: mu campionario > mu popolazione; bilaterale: la probabilità di errore di prima specie è suddivisa tra le due code:
z<-zy/2 e z>zy/2. Oppure unilaterale: z(xsoprassegn.)<-zy/2 oppurez(xsoprassegn.)>+zy/2. Se il problema è decisionale prendiamo alternativa bilaterale.
H1:mu campionario<mu popolazione.
Statistica test media: il valore dello scostamento standardizzato nel caso di campioni indipendentixsoprassegnato-mu/ó/radice n. Formula che sulla base dellecon varianza ignota e diversa.osservazioni campionarie ci permette di accettare o rifiutare l'ipotesi nulla. Se la statistica test cadenella zona di accettazione accetto. Utilizziamo N(0,1) se n è grande e piccolo e s è noto. Se n piccoloe s non notoà t(n-1). Devo trovare dopo la statistica t il percentile e costruire zona di rifiuto eaccettazione.
EXCEL: TESTT Tipo: è il tipo di test t da eseguire: appaiato = 1, a due campioni a varianza identicaa due campioni = 2, varianza dissimile a due campioni = 3.
P value: probabilità di ottenere valori più estremi della statistica test
situazione, si può utilizzare un test di ipotesi sulle medie di due universi. Per verificare se le due medie sono uguali, si utilizza il test t a due code. Il p-value viene calcolato come la somma delle due probabilità: Pr(z(xsoprass.) < -statisticatest) + Pr(z(xsoprass.) > +statisticatest). Se il p-value è maggiore di 0.1, non vi è evidenza contro l'ipotesi nulla (H0). Se il p-value è compreso tra 0.10 e 0.05, vi è una debole evidenza contro H0. Se il p-value è compreso tra 0.05 e 0.01, vi è una discreta evidenza contro H0. Se il p-value è compreso tra 0.01 e 0.001, vi è una forte evidenza contro H0. Se il p-value è inferiore a 0.001, vi è una fortissima evidenza contro H0. Per verificare se le due medie sono diverse, si utilizza il test t a una coda. Il p-value viene calcolato come Pr(z(p) > statistica test) = 1 - DISTRIB. NORM. ST. Ricorda che il p-value è un indicatore della probabilità che l'ipotesi nulla sia vera.città. Confronto di medie di 2 campioni. Ipotesi nulla: H0: mu1=mu2. (media del primo gruppo uguale alla media del secondo gruppo). Scelta ipotesi H1: mu1test.σπμγerrore standard: ripetendo il campionamento infinite volte, ci aspettiamo che i valori della spesacalcolati sui diversi campioni differiscano mediamente dal valore della vera media campionariadi..scostamento quadratico medio: deviazione standard.
Perche la media può essere considerata realizzazione di v.a.? Trattandosi di un campione di n=scelto casualmente, prima della rilevazione i valori della spesa mensile dei consumatori delcampione non sono noti e possono essere considerati come variabili aleatorie, così come la loromedia. Dopo la rilevazione, il valore medio osservato nel campione è quindi la realizzazione dellavariabile aleatoria media campionaria dell’ammontare della spesa mensile.
Perche l’obiettivo deve essere verificato attraverso verifica d’ipotesi? La differenza tra mediacampionaria e media dell’universo/valore target potrebbe essere dovuta al campionamentocasuale. Inoltre trattandosi di una precedente
Ricerca di marketing: bisogna che il parametro ipotizzato a priori dall'azienda sia verificato per la sua veridicità.
Regressione lineare semplice: 2 variabili: