vuoi
o PayPal
tutte le volte che vuoi
VARIANZA: per variabile binomiale
ki=0 X∑( )2 Ω2( )−μ =σ = ¿E XDistribuzioni di probabilità discrete: (dette anche DI MASSA) sono associate a uno spazio campionario discreto –X ( )≤0 ≤ Pr X=x 1contiene un numero finito o un’infinità numerabile di eventi elementari – con la seguente proprietà: se peri=1❑∑ ( )=1{ } Pr X=x∀ ∈x Ω= X allora x −∞ +∞ΩNella distribuzione normale, il dominio è l’intero insieme dei numeri reali tra e e la sua funzione didensità è quella riportata nella tabella sopra.Per quanto concerne le distribuzioni di probabilità, gli istogrammi ci permettono di visualizzare come sono distribuiti i diversivalori di una variabile relativamente al campione successivamente l’istogramma può essere sintetizzato ad una curva dicurva di probabilità. Il vantaggio di
una :a. Ci permette di visualizzare la probabilità relativa anche a quei valori non presenti nel campione
b. La curva non è limitata alla grandezza dei segmenti scelti per l'istogramma
c. Pur non avendo un alto numero di valori è possibile calcolare una curva approssimativa
In generale, entrambi sono distribuzioni
LA DISTRIBUZIONE NORMALE: (detta anche gaussiana o bell curve) è simmetrica e il suo centro è sempre posto sul valore medio (o mediano). σ
La larghezza della curva è data dalla deviazione standard. Per poter costruire una distribuzione normale bisogna conoscere il valore centrale e la deviazione standard (se curva è larga = - probabilità) x-μ=Z
I PUNTI Z: nei test è utile trasformare i punteggi grezzi in punteggi più interpretabili trasformati in punti z: σ
dove la media e la devianza si riferiscono a quelle della popolazione. L'idea dietro i punti z è che essi
indicano quante deviazioni standard (e in che direzione) dista il punteggio ottenuto dalla media dei punteggi della popolazione.
Nel caso in cui la distribuzione dei punteggi sia approssimativamente normale, i punti z possono essere utilizzati per interpretare direttamente le prestazioni dei soggetti.
INFERENZA: si utilizzano i dati campionari per giungere alla conoscenza della popolazione che verosimilmente gli ha generati.
All'interno delle indagini statistiche la popolazione assume il ruolo di variabile aleatoria e, per indicare la variabile oggetto di studio nella popolazione si scrive θX f(x, θ), dove f rappresenta una distribuzione e è un parametro che specifica le caratteristiche della variabile casuale. Se X è una variabile discreta f(X) è una funzione di probabilità; se X è una variabile continua f(X) è una funzione di densità. L'insieme di valori che può assumere è detto θ
campione casuale di dimensione n estratto da una popolazione con media μ e deviazione standard σ, al crescere della dimensione campionaria n, la distribuzione campionaria della media campionaria X̄ si avvicina sempre di più ad una distribuzione approssimativamente normale, con i seguenti parametri: σ/√n = μ e σ n ≥ 30 perché si possa avvicinare alla norma necessario. Mentre, se la distribuzione da cui è tratta la radice quadrata di X̄ è una distribuzione bernulliana allora si chiede che: Inoltre, per una popolazione Bernulliana: la media campionaria rappresenta la proporzione di successi: Y=X̄ dove Y è il numero di successi nel campione, pertanto, la media campionaria di una popolazione n θ bernulliana riceve il nome di PROPORZIONE CAMPIONARIA e viene indicata con p̂. In questo senso, la media e la varianza della proporzione campionaria.
Sono: θ(1- θ) ^ ^( ) ( ) = θ = E θ ; Var θ . Quando tale variabile rispetta i parametri per essere associata ad una distribuzione.
Quando calcoliamo i parametri su delle popolazioni di n elementi, dobbiamo ricordare che tali parametri sono STIMATI: n rappresentano una stima della popolazione. Ma possiamo affermare che più n è maggiore, più la stima sarà verosimile.
HYPOTHESIS TESTING - TEST DELLE IPOTESI: quando a seguito di un primo esperimento otteniamo determinati risultati, sulla base di questi possiamo formulare un'ipotesi, la quale però deve essere verificata, ripetendo l'esperimento. Siccome l'ipotesi si basano sui dati di un primo esperimento, questa potrebbe essere stata diversa per ogni "primo esperimento" possibile, quindi: Prendiamo come ipotesi quella secondo cui non vi è differenza tra due elementi misurati e chiamiamo tale ipotesi -> HIPOTESI NULLA. Se i dati producono forti
evidenze contro allora si rifiuta l’ipotesi nulla. Quello che ci si chiede è quanto essere sicuri che iorisultati siano corretti?
Il P-VALUE: detto anche livello di significatività. È un numero tra 0 e 1 che determina con quanta certezza possiamo affermare che l’ipotesi nulla sia rifiutata indica la probabilità di ottenere dati diversi dal valore del test statistico.
Ha. P-value vicino a 0: maggiore sicurezza nel rifiutare o Hb. P-value lontano da 0: maggiore sicurezza nell’accettare o
Vi sono + forme possibili di ipotesi:
- H : μ=μo
- Ipotesi alternativa bidirezionale: detta test a due code H :μ ≠ μ1
- H : μ ≤ μ H : μ ≥ μo
- Ipotesi alternativa unidirezionale dx e sx: detta test a una coda oppure > <H :μ μ H :μ μ1
Inoltre, bisogna tenere conto, che, nello svolgimento dell’indagine ci sono due errori principali: Pr (α rifiutare H I H è
- ERRORE DI I TIPO (il + grave): la probabilità viene fissata a priori e determina il livello di significatività Hα. In statistica se p-value minore di α allora H0 è rifiutata, se no si fallisce nel rifiutare H0.
- ERRORE DI II TIPO: Un test d'ipotesi è una regola istituita sullo spazio campionario per discriminare i campioni che, se osservati, portano al rifiuto di H0 (un'ipotesi statistica riferita alla popolazione) da quelli che, se osservati, portano ad accettare H0.
FORMULARIO PSICOMETRIA
Calcolo del p-value: sono dati dalla somma delle probabilità. Per calcolarlo dobbiamo essere a conoscenza delle probabilità di successo per ogni elemento del campione si compone infatti di: probabilità che si verifichi evento considerato + probabilità che si verifichi un evento con uguale probabilità.
osservare qualcosa di più raro , dove→ 1 2 3( ) ( ) ( ) ( )=Pr < ( ) + ( )Pr E E Pr E Pr E p-value=Pr z ≤ z Pr z ≥ ze . x bidirez.→1 2 3 1-2 oss oss( )z ≥ z p-value=Pr z ≥ zIn alternativa, anziché basare la decisione sul p-value, possiamo basarla sul valore della statistica test.Ipotesi alternativa unidirezionale a destra: rifiuto se→ →oss 1-∝ ossREGOLA DI DECISIONE BASATA SULLO SPAZIO CAMPIONARIO: utilizzando la distribuzione della statistica-test, si puòidentificare un intervallo di valori di quella statistica test che verosimilmente non si presentano se l'ipotesi nulla è vera. Tale distribuzione è divisa in due regioni: una regione di rifiuto e una di accettazione. Questa divisione si traduce in una regola fondataPer diversi motivi è uso usare statistiche test standardizzate piuttosto che definire→Tsu : x̄-μn =t=t x̄∈CT H , si usa la sua trasformazione in
punto z: · Se non si rifiuta → ossoss σn o o x́∉CT H · Se si rifiuta → n o o Le due regioni sono delimitate da uno o + valori detti valori critici. Usando la statistica test z, i valori critici sono simmetrici. La x́−μ o−k H≤ ≤k>0k verifica d’ipotesi basata su una soglia è definita come: se allora non si rifiuta. la√ o