Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
INDICI DI POSIZIONE
Gli indici di posizione identificano la modalità più rappresentativa della distribuzione dei dati. Essi sono:
- la Moda Campionaria;
- la Mediana Campionaria;
- la Media Campionaria;
- Percentili e Quartili Campionari.
MODA CAMPIONARIA
La moda campionaria fa parte degli indici di posizione, che servono per dare una modalità di riferimento per una distribuzione di dati. Quindi gli indici di posizione definiscono la posizione dei dati attraverso un unico valore che può essere presente o meno nel nostro set di dati. La Moda Campionaria (Mo) di un insieme di dati, se esiste, è l'unico valore che ha frequenza massima. Se non vi è un unico valore con frequenza massima, ciascuno di essi è detto Valore Modale. Caratteristiche:
- è l'unico indice di posizione che può essere definito per tutte le scale di misura (anche per quella nominale);
- una distribuzione può avere più di una moda (multimodalità);
- non sempre è un valore centrale.
MEDIA CAMPIONARIA
Si dice Media Campionaria e si denota con , la quantità:
Caratteristiche:
- ha senso solo per variabili quantitative
- se si dispone della distribuzione di frequenza, il calcolo diventa:
Queste due sono uguali solo se ho variabili di tipo discreto, se ho variabili di tipo continua non ottengo una equivalenza, ma una approssimazione ed è sbagliato.
Proprietà La somma degli scarti della media è 0
Se abbiamo la distanza euclidea, il valore della media campionaria minimizza questa distanza. Se, comunque prçse due costanti a e b, si considera la seguente trasformata allora:
Vantaggi:
- è il più comune tipo di media;
- è facile da calcolare;
- è facile da comprendere;
- si presta a manipolazioni algebriche.
Svantaggi:
tale indice tende ad essere "attratto" da valori eccezionali (detti anche outliers ovvero eccezionalmente grandi o piccoli) anche se questi sono poco numerosi. Ovvero se ho un valore molto più grande degli altri, o molto più piccolo, la media è attratto da esso e quindi il nostro indice di posizione(media)non descrive bene la distribuzione di dati.
MEDIANA CAMPIONARIA
Assegnato un insieme di dati di ampiezza n, lo si ordina dal minore al maggiore. Se n dispari, si dice Mediana Campionaria (Me) il valore del dato in posizione (n + 1)/2; se n pari si dice Mediana Campionaria (Me) la media dei dati che occupano le posizioni n/2 ed n/2 + 1.
Caratteristiche:
- ha senso solo per variabili quantitative;
per le variabili 50% alla sua destra (bipartisce la distribuzione);
valore mediano a causa della presenza di più osservazioni con stesso valore.
Vantaggi:
Per le piccole numerosità campionarie, facile da calcolare;
non è influenzata dalla presenza di valori eccezionali(valori o troppo elevati o troppo bassi) (differentemente dalla Media), ovvero è un indice robusto.
Svantaggi:
L’ordinamento può essere oneroso per n grande;
Si basa sulle frequenze;
esente sempre uno che contemporaneamente maggiore o uguale di almeno il k
percento dei dati, e minore di almeno il 100 – k percento dei dati.
Se esso non è unico, allora sono esattamente due, in questo caso il Percentile k-esimo dato dalla loro media aritmetica.
Ciò definisce una percentuale di quelle che sono le frequenze che la precisa modalità di riferimento lascia alla sua sinistra e destra.Quindi se la modalità in k%, alla sua destra lascerà un 100 -k% a destra. ES la mediana lascia 50% a sinistra e 100-50%=50% a destra.
Procedura per il calcolo:
1 Ordinare i dati in modo crescente
x(1) < x(2) < ... < x(n)
2 Calcolare p = nk/100:
dove p appartiene ad N indica gli interi
QUARTILI CAMPIONARI
Sono dei particolari percentili.
Il 25-esimo percentile è detto Primo Quartile (Q1);
il 50-esimo percentile è detto Secondo Quartile (Q2) o Mediana (Me);
Il 75-esimo percentile è detto Terzo Quartile (Q3).
Essi dividono la distribuzione in quattro parti:
- prima di Q1,
- tra Q1 e Q2,
- tra Q3 e Q2
- ed infine dopo Q3 cade il 25% della distribuzione
INDICI DI VARIABILITA
Gli indici di variabilita’ danno informazioni sull’attitudine di un fenomeno quantitativo ad assumere diverse modalità. Danno informazioni cio’ su qual’’ la dispersione dei dati intorno alla media. Gli indici piu’ utilizzati sono:
- l’Escursione Campionaria;
- la Varianza e Deviazione Standard Campionaria;
- il Coefficiente di Variazione;
- la Differenza interquartile.
ESCURSIONE CAMPIONARIA
L’Escursione Campionaria o anche Range è definita come
EC = max(X) – min(X) (e la differenza tra minimo e massimo)
Vantaggi
- Facile da calcolare e quindi di facile uso;
- è un indice di dispersione attendibile in caso di piccoli campioni (n minore o uguale 10).
Si definisce Insieme una collezione di oggetti. Gli oggetti che costituiscono un insieme si chiamano Elementi.
Un insieme può essere individuato:
mediante semplice elencazione (se il numero degli elementi non è troppo grande)
A = {1, 2, 3, 4, 5};
esplicitando una caratteristica o una proprietà comune a tutti i suoi
elementi
B = {numeri interi positivi}.
Per rappresentare graficamente un insieme si ricorre ai Diagrammi di Venn
Insiemi particolari
S detto Spazio;
∅ : il c.d. Insieme vuoto
Si dice che l’insieme B` e un sottoinsieme dell’insieme A se ogni elemento di B` e anche elemento di À.
Se B` è un sottoinsieme di À allora B` è incluso in A in simboli B ⊂ A
Si definisce unione di due insiemi À e B, un terzo insieme C i cui elementi appartengono ad Á o B o ad entrambi.
in simboli C = A∪B
Proprietà:
1 A∪A = A; 2 A∪S = S; 3 A∪∅= A; 4 se B ⊂ A, allora A∪B = A; 5 A∪B = B∪A (commutatività);
6 (A∪B)∪C = A∪(B∪C) (associatività); 7 (A∩B)∪C = (A∪C)∩(B∪C) (distributività rispetto
all’intersezione).
Si definisce intersezione di due insiemi À e B, un terzo insieme C i cui elementi appartengono
contemporaneamente sia ad A che a B. in simboli C = A∩B
Proprietà:
1 A∩A = A; 2 A∩S = A; 3 A∩∅ = ∅; 4 se B ⊂ A, allora A∩B = B; 5 A∩B = B∩A (commutatività);
6 (A∩B)∩C = A∩(B∩C) (associatività); 7 (A∪B)∩C = (A∩C)∪(B∩C) (distributività rispetto all’unione).
Dato uno Spazio S ed un insieme À di tale spazio, si definisce insieme complementare dell’insieme A (rispetto ad
S), l’insieme degli elementi di S che non appartengono ad A. in simboli A'
Particolari:
S` = ∅ mentre ∅` e S;
A∪A` = S mentre A∩A` = ∅.
Leggi di De Morgan:
A∩B =' A` ∪B`;
A∪B = A` ∩ B`.
L’esperimento e` una prova il cui esito è caratterizzato da incertezza.
Esempi:
lancio di una moneta;
lancio di un dado;
prova della durata di una lampadina.
Definition
Assegnato un certo esperimento, si definisce Spazio Campionario (S), l’insieme di tutti i possibili risultati derivanti da una singola esecuzione dell’esperimento stesso.
Esempi:
per il lancio di una moneta, S = {testa, croce};
per il lancio di un dado,
S = {faccia1, faccia2, faccia3, faccia4, faccia5, faccia6};
per la prova della durata di una lampadina,
S ={numeri reali non negativi}.
Definition
Si definisce evento un qualunque sottoinsieme di S.
Tipi di Eventi:
l’evento certo che corrisponde ad S;
l’evento Impossibile che corrisponde a ∅;
ogni altro evento è un sottinsieme proprio di S. Ad esempio per
S = {faccia1, faccia2, faccia3, faccia4, faccia5, faccia6}, l’evento
A = {faccia1, faccia6}.
Definition
a seguito di un esperimento, gli eventi possono essere:
compatibili: due insiemi A e B sono compatibili all’interno di un esperimento sono degli eventi