Anteprima
Vedrai una selezione di 7 pagine su 30
Appunti di Statistica Pag. 1 Appunti di Statistica Pag. 2
Anteprima di 7 pagg. su 30.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 6
Anteprima di 7 pagg. su 30.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 11
Anteprima di 7 pagg. su 30.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 16
Anteprima di 7 pagg. su 30.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 21
Anteprima di 7 pagg. su 30.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 26
1 su 30
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

INDICI DI POSIZIONE

Gli indici di posizione identificano la modalità più rappresentativa della distribuzione dei dati. Essi sono:

  • la Moda Campionaria;
  • la Mediana Campionaria;
  • la Media Campionaria;
  • Percentili e Quartili Campionari.

MODA CAMPIONARIA

La moda campionaria fa parte degli indici di posizione, che servono per dare una modalità di riferimento per una distribuzione di dati. Quindi gli indici di posizione definiscono la posizione dei dati attraverso un unico valore che può essere presente o meno nel nostro set di dati. La Moda Campionaria (Mo) di un insieme di dati, se esiste, è l'unico valore che ha frequenza massima. Se non vi è un unico valore con frequenza massima, ciascuno di essi è detto Valore Modale. Caratteristiche:

  • è l'unico indice di posizione che può essere definito per tutte le scale di misura (anche per quella nominale);
  • una distribuzione può avere più di una moda (multimodalità);
  • non sempre è un valore centrale.

MEDIA CAMPIONARIA

Si dice Media Campionaria e si denota con , la quantità:

Caratteristiche:

  • ha senso solo per variabili quantitative
  • se si dispone della distribuzione di frequenza, il calcolo diventa:

Queste due sono uguali solo se ho variabili di tipo discreto, se ho variabili di tipo continua non ottengo una equivalenza, ma una approssimazione ed è sbagliato.

Proprietà La somma degli scarti della media è 0

Se abbiamo la distanza euclidea, il valore della media campionaria minimizza questa distanza. Se, comunque prçse due costanti a e b, si considera la seguente trasformata allora:

Vantaggi:

  • è il più comune tipo di media;
  • è facile da calcolare;
  • è facile da comprendere;
  • si presta a manipolazioni algebriche.

Svantaggi:

tale indice tende ad essere "attratto" da valori eccezionali (detti anche outliers ovvero eccezionalmente grandi o piccoli) anche se questi sono poco numerosi. Ovvero se ho un valore molto più grande degli altri, o molto più piccolo, la media è attratto da esso e quindi il nostro indice di posizione(media)non descrive bene la distribuzione di dati.

MEDIANA CAMPIONARIA

Assegnato un insieme di dati di ampiezza n, lo si ordina dal minore al maggiore. Se n dispari, si dice Mediana Campionaria (Me) il valore del dato in posizione (n + 1)/2; se n pari si dice Mediana Campionaria (Me) la media dei dati che occupano le posizioni n/2 ed n/2 + 1.

Caratteristiche:

  • ha senso solo per variabili quantitative;

per le variabili 50% alla sua destra (bipartisce la distribuzione);

valore mediano a causa della presenza di più osservazioni con stesso valore.

Vantaggi:

Per le piccole numerosità campionarie, facile da calcolare;

non è influenzata dalla presenza di valori eccezionali(valori o troppo elevati o troppo bassi) (differentemente dalla Media), ovvero è un indice robusto.

Svantaggi:

L’ordinamento può essere oneroso per n grande;

Si basa sulle frequenze;

esente sempre uno che contemporaneamente maggiore o uguale di almeno il k

percento dei dati, e minore di almeno il 100 – k percento dei dati.

Se esso non è unico, allora sono esattamente due, in questo caso il Percentile k-esimo dato dalla loro media aritmetica.

Ciò definisce una percentuale di quelle che sono le frequenze che la precisa modalità di riferimento lascia alla sua sinistra e destra.Quindi se la modalità in k%, alla sua destra lascerà un 100 -k% a destra. ES la mediana lascia 50% a sinistra e 100-50%=50% a destra.

Procedura per il calcolo:

1 Ordinare i dati in modo crescente

x(1) < x(2) < ... < x(n)

2 Calcolare p = nk/100:

dove p appartiene ad N indica gli interi

QUARTILI CAMPIONARI

Sono dei particolari percentili.

Il 25-esimo percentile è detto Primo Quartile (Q1);

il 50-esimo percentile è detto Secondo Quartile (Q2) o Mediana (Me);

Il 75-esimo percentile è detto Terzo Quartile (Q3).

Essi dividono la distribuzione in quattro parti:

  • prima di Q1,
  • tra Q1 e Q2,
  • tra Q3 e Q2
  • ed infine dopo Q3 cade il 25% della distribuzione

INDICI DI VARIABILITA

Gli indici di variabilita’ danno informazioni sull’attitudine di un fenomeno quantitativo ad assumere diverse modalità. Danno informazioni cio’ su qual’’ la dispersione dei dati intorno alla media. Gli indici piu’ utilizzati sono:

  • l’Escursione Campionaria;
  • la Varianza e Deviazione Standard Campionaria;
  • il Coefficiente di Variazione;
  • la Differenza interquartile.

ESCURSIONE CAMPIONARIA

L’Escursione Campionaria o anche Range è definita come

EC = max(X) – min(X) (e la differenza tra minimo e massimo)

Vantaggi

  • Facile da calcolare e quindi di facile uso;
  • è un indice di dispersione attendibile in caso di piccoli campioni (n minore o uguale 10).

Si definisce Insieme una collezione di oggetti. Gli oggetti che costituiscono un insieme si chiamano Elementi.

Un insieme può essere individuato:

mediante semplice elencazione (se il numero degli elementi non è troppo grande)

A = {1, 2, 3, 4, 5};

esplicitando una caratteristica o una proprietà comune a tutti i suoi

elementi

B = {numeri interi positivi}.

Per rappresentare graficamente un insieme si ricorre ai Diagrammi di Venn

Insiemi particolari

S detto Spazio;

∅ : il c.d. Insieme vuoto

Si dice che l’insieme B` e un sottoinsieme dell’insieme A se ogni elemento di B` e anche elemento di À.

Se B` è un sottoinsieme di À allora B` è incluso in A in simboli B ⊂ A

Si definisce unione di due insiemi À e B, un terzo insieme C i cui elementi appartengono ad Á o B o ad entrambi.

in simboli C = A∪B

Proprietà:

1 A∪A = A; 2 A∪S = S; 3 A∪∅= A; 4 se B ⊂ A, allora A∪B = A; 5 A∪B = B∪A (commutatività);

6 (A∪B)∪C = A∪(B∪C) (associatività); 7 (A∩B)∪C = (A∪C)∩(B∪C) (distributività rispetto

all’intersezione).

Si definisce intersezione di due insiemi À e B, un terzo insieme C i cui elementi appartengono

contemporaneamente sia ad A che a B. in simboli C = A∩B

Proprietà:

1 A∩A = A; 2 A∩S = A; 3 A∩∅ = ∅; 4 se B ⊂ A, allora A∩B = B; 5 A∩B = B∩A (commutatività);

6 (A∩B)∩C = A∩(B∩C) (associatività); 7 (A∪B)∩C = (A∩C)∪(B∩C) (distributività rispetto all’unione).

Dato uno Spazio S ed un insieme À di tale spazio, si definisce insieme complementare dell’insieme A (rispetto ad

S), l’insieme degli elementi di S che non appartengono ad A. in simboli A'

Particolari:

S` = ∅ mentre ∅` e S;

A∪A` = S mentre A∩A` = ∅.

Leggi di De Morgan:

A∩B =' A` ∪B`;

A∪B = A` ∩ B`.

L’esperimento e` una prova il cui esito è caratterizzato da incertezza.

Esempi:

lancio di una moneta;

lancio di un dado;

prova della durata di una lampadina.

Definition

Assegnato un certo esperimento, si definisce Spazio Campionario (S), l’insieme di tutti i possibili risultati derivanti da una singola esecuzione dell’esperimento stesso.

Esempi:

per il lancio di una moneta, S = {testa, croce};

per il lancio di un dado,

S = {faccia1, faccia2, faccia3, faccia4, faccia5, faccia6};

per la prova della durata di una lampadina,

S ={numeri reali non negativi}.

Definition

Si definisce evento un qualunque sottoinsieme di S.

Tipi di Eventi:

l’evento certo che corrisponde ad S;

l’evento Impossibile che corrisponde a ∅;

ogni altro evento è un sottinsieme proprio di S. Ad esempio per

S = {faccia1, faccia2, faccia3, faccia4, faccia5, faccia6}, l’evento

A = {faccia1, faccia6}.

Definition

a seguito di un esperimento, gli eventi possono essere:

compatibili: due insiemi A e B sono compatibili all’interno di un esperimento sono degli eventi

Dettagli
Publisher
A.A. 2020-2021
30 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher simomansi di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Salerno o del prof De Feo Giuseppe.