Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
NB IJ DISTRIBUZIONE PER CLASSI AL POSTO DI XI ANDRÀ XC
il valore assoluto è necessario altrimenti il risultato sarebbe 0, viene anche chiamato modulo
VARIANZA: più precisa SSM indice quadratico con dati lineari
Formula
La DEVIAZIONE STANDARD indica che maggiore sia la deviazione maggiore sia la dispersione.
Formula:
RECAP ED ESEMPI
. Distribuzione di frequenza
. Distribuzione di frequenza per classi
DEVIANZA: numeratore della varianza.
Per distribuzione semplice: (xi - media) ^2
Per distribuzione di frequenza: (xi -media) ^2 *fi
COEFFICIENTE DI VARIAZIONE:
Indice di variabilità relativa dato dal quoziente tra la deviazione standard e il valore assoluto della media aritmetica.
Essendo che sia la media aritmetica e sia la deviazione standard sono espresse nella medesima unità di misura il coefficiente di variazione non ha più bisogno di
essere espresso nell’ unità del fenomeno studiato.
Viene utilizzato per calcolare la variabilità dello stesso fenomeno in U diverse oppure la variabilità di fenomeni diversi
Se le medie sono diverse non può essere usato come indice di confronto , si deve pertanto annullare l’effetto della media sul coefficiente
Formula ed esempio:
I PUNTI Z:
I risultati di una analisi o ricerca per essere comandati e interpretati rispetto agli outcome di altri studi e ricerche su diverse distribuzioni devono essere
necessariamente standardizzati, ovvero devono trasformarsi in quelli che sono punteggi standard.
Possiamo pertanto dire che i risultati ottenuti da analisi e studi vengono definiti dati grezzi, L attributo grezzo sta a indicare la necessità di un ut,errore
elaborazione dei dati per poterli comparare agli esiti ottenuti da analisi svolta da soggetti diversi o da medesimi
Il punto Z o standardizzato e in grado di definire la posizione di un soggetto all interno della sua distribuzione in termini di scarti superiori o inferiori alla media a
seconda del punto in cui si trova il soggetto.
Definiscono la performance dei dati e la loro formula di calcolo è: z= X-media/s
Essi permettono di confrontare i dati di diverse e distribuzioni
Se il punto Z è negativo il valore grezzo sarà al di sotto della media,se è positivo sarà il contrario.
Se Z si avvicina allo 0 il punto grezzo si avvicinerà alla media.
In qualsiasi distribuzione dei punti Z la media e pari a 0 mentre la deviazione pari a 1
I punti Z sono in grado di permettere di confrontare la posizione di un qualsisia soggetto con quella del medesimo soggetto all interno di una distruzione
differente o soggetti diversi di diverse distribuzioni.
Quando i punti Z si standardizzano si crea una particolare curva du media 0 e s 1 che prende il nome di GAUSSIANA O DISTRIBUZIONE NORMALE STANDARD.
Esempio: se Stefano e Daniela conseguono rispettivamente i voti 26 e 24 nell’esame di statistica partecipando ad appelli diversi chi tra loro avrà avuto la
performance migliore?
Dando un primo sguardo a quelli che sono i dati grezzi potremmo affermare che Stefano abbia ottenuto un risultato migliore rispetto a Daniela tuttavia i dati
appartengono a distribuzioni differenti e pertanto non possono essere comparati direttamente in quanto hanno deviazione standard e media differenti
Media di Daniela: 22, deviazione standard: 1
Media di Stefano: 25, deviazione standard: 2
In questo caso per comparare i dati dobbiamo standardizzarli
Stefano: (26-25)/2: 0,5
Daniela: (24-22)/1: 2
Possiamo affermare pertanto che Stefano ha ottenuto un risultato pari a 0,5 deviazioni standard superiori rispetto agli studenti del suo appello ovvero è stato più
bravo del 69% degli studenti (0,5 nella tabella della gaussiana corrisponde a 19,15 sommato al 50% da come risultato il 69%)
Tuttavia Daniela ha ottenuto un risultato migliore dei due deviazioni standard rispetto agli studenti del suo appello.
Potendo quindi comparare i punti Z originati dalla trasformazione standardizzazione dei dati grezzi possiamo affermare che avendo Stefano ottenuto una
deviazione standard migliore dello 0,5 mentre invece Daniela ha ottenuto il risultato migliore di due deviazioni standard Daniela ha avuto una performance
migliore rispetto rispetto a Stefano.
La formula inversa dei punti Z è: X= X media più ZS
Vantaggi e svantaggi dei punti Z:
Vantaggi
-Se il valore è al al di sotto della media Z ha valori negativi se il valore è al di sopra della media Z a valori positivi se il valore è uguale alla media Z a valore zero
I punti Z utilizzano la stessa unità di misura della distribuzione e della deviazione standard
I punti Z sono disposti su una scala di intervalli e pertanto è possibile condurre operazioni matematiche su di essi
Svantaggi:
-il segno può essere una complicazione nei calcoli
-Non è possibile comparare i punti Z per quelli che sono distribuzioni che hanno medie differenti e dispersioni differenti
-La deviazione standard è un valore molto molto ampio
I PUNTI T: punti che assegnano alla distribuzione il valore di 50 per la media e il valore si 10 alla deviazione standard
La formula è : T= xmedia+ZS
Ovvero 50+10(x-media/s)
LA GAUSSIANA O DISTRIBUZIONE NÓRMALE STANDARDIZZATA.
CARATTERISTICHE:
Ha forma campanulare
I honrilla di flesso sono in corrispondenza della prima deviazione standard, rappresentano il punto in cui
la curva da concava diventa convessa
Le code asintotiche si trovano in concomitanza della quarta deviazione standard, sono composte da valori che si avvicinano sempre più allo 0 ma che non lo
toccano mai
Moda mediana e media coincidono dividendo in due metà uguali la curva.
La gaussiana è una curva che prevede che la media sia sempre pari a 0 e la deviazione standard pari a 1. La regola empirica ritiene che le porzioni dell area all
interno ella curva abbiano valori fissi
Da 0 a 1 34,13
Da 1 a 2 13, 59
Da 2 a 3 2,14
Da 3 a 4 0,13
Alcuni esempi con la gaussiana:
Calcoli:
Calcoli
INDICE DI CURTIS
ku misura il peso delle code asintotiche, più piatte sono più i valori tendono verso le code e più appuntite sono più i valori vertono verso la media.
Tre tipi di curva:
Leptocurtica: ku maggiore di 0
Normodurtica ku = 0
Platocurtica ku < 0
Indici di asimmetria:
Se curva asimmetrica verso sinistra mediana e moda sono maggior di media
Se curva e media simmetrica allora moda mediana e media coincidono
Se curva a simmetrica verso destra mediana e moda sono minori di media
Secondo la teoria delle probabilità una distribuzione di probabilità simmetrica quando la sua funzione di probabilità o la sua densità di probabilità sono
simmetriche ad un valore.
In questo caso alcuni esempi di distribuzioni simmetriche sono le distribuzioni uniformi su sistemi simmetrici
L’indice di simmetria mette in rilevo ciò che manca alla curva per essere simmetrica.
Quando si passa dallo studio di un fenomeno locale alla generalizzazione di un fenomeno mondiale è bene prelevare un campione rappresentativo e
probabilistico della popolazione n in modo che i risultati siano conformi alla popolazione stessa.
Per fare ciò ricorriamo a quelli che sono gli INTERVALLI DI FIDUCIA
In statistica quando parliamo di parametro non è sufficiente affidarci ad un unico valore, ed è per questo che alla stima del parametro stesso è opportuno
affiancare un intervallo di valori probabili per il parametro
Tale intervallo viene chiamato intervallo di confidenza o di fiducia al quale viene associato un valore di probabilità cumulativa che ne definisce l’ampiezza rispetto
ai valori massimi che la variabile aleatoria può assumere.
Tale intervallo misura la probabilità che il fenomeno caratteristico dello studio della variabile aleatoria ricada all interno di tale intervallo di fiducia.
La formula per il calcolo dell intervallo di fiducia è:
Media- Z*ES < media totale < media + Z *ES
MEDIA: calcolo matematicamente sul campione di riferimento
ES: errore standard dato dalla differenza tra la popolazione e il campione standard, più è alta la differenza più l’errore è alto
La formula dell’ERRORE STANDARD È:
S (O sigma) / radice di N
NB: quando la deviazione standard non è nota co N minore di trenta la Z viene sostituita dalla T
Essendo un ambito di probabilità il risultato non sarà mai esatto al cento per cento e questo a causa del fatto che sono sempre presenti delle percentuali che si
scostano dalla generalizzazione
Esistono due percentuali di errore standard che corrispondono a:
Alfa 0,05 corrisponde a una S di 5 e prevede un punto Z di 1,96 e una certezza del 95%
Alfa 0,01 corrisponde a 1 deviazione standard e un punto Z di 2,58 con una certezza del 99%
SONO PERCENTUALI E VALORI FISSI.
ESEMPIO CONCRETO:
STATISTICA BIVARIATA:
è frequente rilevare due o più caratteri congiunti su n d’unità statistiche, l’obiettivo della statistica in questo caso è verificare l’eventuale presenza di legami tra i
caratteri rilevanti.
In questa fase ci occuperemo solo della rilevazione di due variabili Sun unità statistiche ma esistono altri strumenti che ne ore disco Iñigo il calcolo di maggiori, in
questo caso ci concentriamo sul rilevare i legami presenti tra i caratteri.
Indici predisposti per il calcolo di due o più variabili:
Indice chi quadrato di Pearson normalizzato
Dipendenza in media ed età quadro
Coefficiente di correlazione di pearson che permette di rilevare il livello dic correlazione lineare per variabili quantitative.
Uno strumento fondamentale per la statistica bivariata sono le tabelle a doppia entrata o di contingenza.
Presumendo che X e y siano due variabili rilevate sulle medesime unità statistiche e che x1 y1 XI y i e Xn yn siano i dati grezzi rilevati.
Supponiamo che X e y si manifestino attraverso h e k modalità distinte per cui x1… h e y1…..k e che alcuni valori si ripetano.
In questo caso un apri,a sintesi fondamentale dei dati viene data dalle tabelle di contingenza o doppia interata in cui nij rappresenta la somma delle frequenze
assolute congiunte nonché il numero di unità statistiche presentate dalle due modalità XI e yj
Nell’ ultima colonna ritroviamo i= 1 h che simboleggia le frequenze marginali di x, ni rappresenta i caratteri che all interno della distribuzione assumono modalità
XI tra i caratteri x
Nell ultima riga ritroviamo j= 1 k nonché frequenze marginali di y, nj rappresenta i caratteri che assumono la modalità yj tra i caratteri X
Esempio concreto tabella doppia entrata k * h
La somma delle frequenze assolute congiunte è pari alla somma delle frequenze assolute marginali nonché pari al numero della numerosità campionaria.
Esempio concreto:
In questo caso 20 rappresenta la numerosità campionaria
La formula nij/n ra