Anteprima
Vedrai una selezione di 13 pagine su 58
Statistica primo anno Pag. 1 Statistica primo anno Pag. 2
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Statistica primo anno Pag. 6
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Statistica primo anno Pag. 11
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Statistica primo anno Pag. 16
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Statistica primo anno Pag. 21
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Statistica primo anno Pag. 26
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Statistica primo anno Pag. 31
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Statistica primo anno Pag. 36
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Statistica primo anno Pag. 41
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Statistica primo anno Pag. 46
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Statistica primo anno Pag. 51
Anteprima di 13 pagg. su 58.
Scarica il documento per vederlo tutto.
Statistica primo anno Pag. 56
1 su 58
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

CAPITOLO 33 "DALLE TENDENZE CENTRALI ALLA VARIABILITÀ"

Le proprietà degli indici di posizione sono:

  • Proprietà moltiplicativa: qualora una variabile statistica x presenti un cambiamento di "scala" anche l'indice di posizione comporta un uguale cambiamento;
  • Proprietà di monotonicità: se una variabile statistica y presenta valori corrispondenti maggiori o uguali a quelli di una variabile statistica x, allora l'indice di posizione di y non è inferiore a quello di x;
  • Proprietà di linearità: se una variabile statistica z è legata ad altre variabili da una relazione lineare, allora l'indice di posizione gode della proprietà di linearità.

Un aspetto importante della mediana è la sua capacità di essere resistente alla presenza di valori atipici, eccezionali, errati. Essa è un indice per decisioni che implicano costi da minimizzare, infatti minimizza la somma degli scarti.

assoluti. La media è un indice di equilibrio generale, e minimizza i rischi complessivi minimizzando i quadrati degli scarti, attribuendo particolarmente rilievo agli estremi rispetto ai valori centrali. Per un'analisi esaustiva di una distribuzione bisogna calcolare tuttavia la variabilità del fenomeno, come il campo di variazione e la varianza. Questi indici descrivono la variabilità con un unico valore che ne sintetizza le caratteristiche e ci dicono in che modo essi sono disposti intorno all'indice di tendenza centrale. La variabilità di un fenomeno è la sua attitudine ad assumere differenti modalità. Tra gli indici di variabilità si considera: - il campo di variazione = max(X) - min(X). Esso è influenzabile anche da un solo valore atipico, ed è quindi un po' grossolano. L'indice più importante per misurare la variabilità è dato dalla varianza.

CAPITOLO 34 "MISURE DI VARIABILITÀ"

Principali misure di variabilità Le misure di variabilità (o dispersione) sono: - Campo di variazione (o range) - Differenza interquartile (quartili e altri indici di posizione: decili, percentili) - Scostamento semplice medio - Varianza e deviazione standard (scarto quadratico medio) - Coefficiente di variazione Il range si ottiene facendo la differenza tra il minimo e il massimo (calcolabile solo su scala metrica). Es.: risultati senza farmaco = 2,2,3,4,5,5,7; range: (7-2)=5; con farmaco = 1,1,1,1,8,8,8; range: (8-1)=7 Limiti: prende in considerazione solo i valori estremi senza tenere conto dei valori intermedi e delle frequenze. Es. 2,2,3,4,5,5,7,20; range=18 Range parziale: calcolato togliendo gli outliers (anomali rispetto alla distribuzione). Es. 2,2,3,4,5,5,7 (tolgo 20 perché outlier); range=5 DIFFERENZA INTERQUARTILE I quartili corrispondono ai valori che dividono in quattro parti la distribuzione dei dati.

Di sotto del primo quartile (Q1) c'è il 25% dei casi.

Al di sotto del secondo quartile (Q2) c'è il 50% (è la mediana!).

Al di sotto del terzo quartile (Q3) c'è il 75%.

Calcolando la differenza tra il terzo e il primo quartile si ottiene la differenza interquartile (DI = Q3 - Q1).

Tra i suoi limiti: la bassa considerazione di casi centrali ed estremi.

2 Misure di deviazione della media

È possibile calcolare la deviazione (o scarto) di ciascun valore dalla media e poi trovare il valore medio di tali deviazioni, dividendo la somma di tutti gli scarti per il numero delle nostre osservazioni. La somma di tutti gli scarti dalla media risulta sempre uguale a zero (la M è il baricentro della distribuzione).

Es. 3, 5, 6, 7, 9 Media = 6

Calcolo dello scostamento semplice medio (le differenze sono in valore assoluto):

(3-6=3) + (5-6=1) + (6-6=0) + (7-6=1) + (9-6=3) = 8:5 = 1,6

La varianza è la media degli scarti al quadrato tra i dati e la M.

È nulla quando i dati sono tutti uguali (non)

c'è variazione) e aumenta al crescere della variabilità. Maggiore è la σ, più i casi sono dispersi attorno alla M, minore è la σ più i casi sono concentrati attorno alla M. Es. 3,5,6,7,9 Media = 6 Calcolo di σ (3-6=3)² + (5-6=1)² + (6-6=0)² + (7-6=1)² + (9-6=3)² = 20 / 5 = 4 La varianza fornisce la misura sintetica di quanto le unità differiscono dalla media aritmetica. LIMITE: è espressa nell'unità di misura del fenomeno elevata al quadrato. Essa non possiede un significato fisico ma è solo un importante indice utile per fini statistici. CAPITOLO 35 "MISURE DI VARIABILITÀ E INDICI DI DISPERSIONE" I rapporti statistici: Il rapporto statistico di composizione si ottiene dividendo il valore rilevato in una data circostanza per l'analogo valore rilevato per l'intera popolazione (es. distribuzione relativa della popolazione residente tra giovani, adulti e anziani).

adulti e anziani);

I rapporti statistici di derivazione si ottengono dividendo la modalità di un fenomeno per quella corrispondente di un altro valore che sul piano logico e/o temporale ne costituisce causa o presupposto logico (esempio i nati e i morti sono influenzati dalla popolazione residente);

I rapporti di coesistenza concernono il rapporto tra la frequenza di una modalità rispetto a quella corrispondente di un'altra modalità (esempio l'indice di vecchiaia definito come il rapporto tra gli over 65 ed under 15);

I rapporti di densità concernono il rapporto tra la dimensione globale di un fenomeno e quella spaziale a cui esso fa riferimento (esempio la densità di una sostanza inquinante nell'aria).

I rapporti statistici sono misure statistiche elementari finalizzate al confronto tra i dati stessi. I numeri indici sono rapporti statistici che misurano la variazione di un fenomeno rilevato in tempi e circostanze diverse. In sintesi la

La statistica insegna a individuare i modi in cui un fenomeno si manifesta e varia nel tempo, a descriverlo sinteticamente e a trarne da esso conclusioni più generali di fenomeni più ampi.

CAPITOLO 36 "TASSI DI INCREMENTO"

L'inflazione al consumo è un processo di aumento del livello generale dei prezzi dell'insieme dei beni e servizi destinati al consumo della famiglia, esso è un indice che viene misurato dall'istituto nazionale di statistica (ISTAT). È uno strumento statistico che misura le variazioni nel tempo dei prezzi di un insieme di beni e servizi, chiamato paniere, rappresentativo degli effettivi consumi delle famiglie in un specifico anno.

L'Istat produce tre diversi indici dei prezzi al consumo: per l'intera collettività aziendale (NIC), per le famiglie di operai e impiegati (FOI) e l'indice armonizzato europeo (IPCA).

Il NIC rappresenta per lo Stato il parametro di riferimento per la realizzazione

delle politiche economiche (esempio i rinnovi dei contratti collettivi). Il FOI è l'indice usato per adeguare periodicamente i valori monetari (esempio gli affitti o gli assegni dovuti al coniuge separato). L'IPCA è assunto come indicatore per verificare la convergenza delle economie dei paesi membri dell'unione Europea, ai fini dell'accesso e della permanenza in esso. Attraverso i numeri indice possiamo comparare facilmente delle grandezze economiche rispetto all'anno x (pari a 100); con i tassi di incremento si misurano le variazioni anche in rapporto al mese/anno precedente. Se compariamo i tassi di inflazione rispetto all'anno precedente si parla di comparazioni tendenziali, altrimenti, se rispetto al mese precedente, di comparazioni congiunturali. Lo stesso vale, ad esempio, per il PIL. Se compariamo i tassi d'inflazione rispetto all'anno precedente si parla di comparazioni tendenziali. Se li compariamo rispetto al mese precedente.si parla di comparazioni congiunturali. La deflazione è una diminuzione del livello generale dei prezzi.

CAPITOLO 37 "IL COEFFICIENTE DI CORRELAZIONE E LA COVARIANZA"

La covarianza tra le componenti della variabile statistica (X, Y) è la media dei prodotti degli scarti delle variabili X e Y dalle rispettive medie aritmetiche M(X) e M(Y). La covarianza può essere:
  • POSITIVA: Quando X e Y variano tendenzialmente nella stessa direzione, cioè al crescere della X tende a crescere anche Y e al diminuire della X tende a diminuire anche Y.
  • NEGATIVA: Quando due variabili variano tendenzialmente in direzione opposta, cioè quando al crescere di una variabile l'altra variabile tende a diminuire e viceversa.
  • NULLA: Quando non vi è alcuna tendenza delle due variabili a variare nella stessa direzione o in direzione opposta. Quando Cov(X,Y) = 0 si dice anche che X e Y sono non correlate o nonlinearmente indipendenti.
La correlazione indica il grado dellarelazione tra variabili, e per mezzo di essa si cerca di determinare quanto bene un'equazione lineare o un'altra equazione qualsiasi descrivano o spieghino tale relazione tra variabili. Se tutti i valori delle variabili soddisfano esattamente ad un'equazione, si dice che le variabili sono perfettamente correlate.

CAPITOLO 38 "CORRELAZIONE ILLUSORIA E SPURIA"

Non sempre un valore elevato di r corrisponde un effettivo legame tra i due caratteri quantitativi considerati.

  1. Una correlazione non reale si ha quando uno dei caratteri comprende l'altro (esempio mortalità infantile e mortalità generale, prezzo dei pneumatici e della vettura, tra studenti universitari e quelli di Economia).
  2. Una correlazione "mal posta" si ha quando altri fattori variabili influiscono più o meno fortemente su quelli presi in considerazione (per esempio in caso della correlazione positiva nel tempo di varie coppie di prodotti agricoli che può

essere dovuta all'influenza delle condizioni meteorologiche).

Altra correlazione è quella illusoria o priva di senso.

CAPITOLO 40 "LA REGRESSIONE LINEARE"

Le relazioni tra variabili importanti nell'analisi della realtà economico-aziendale possono essere matematicamente espresse come: Y = f(x) dove la funzione f può assumere varie forme, lineari o non lineari, e può non essere conosciuta in modo preciso.

L'analisi della regressione viene impiegata per creare un modello del fenomeno in grado di fornire una spiegazione al comportamento di due o più variabili legate da una relazione di causa ed effetto:

  • Una variabile Y sarà dipendente o effetto di una variabile X detta variabile indipendente o causa.
  • La misura della dipendenza avviene con lo studio della regressione.

L'obiettivo è dato due variabili X e Y, si è interessati a comprendere come la variabile Y (dipendente o risposta) sia influenzata.

dalla X

Dettagli
A.A. 2023-2024
58 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher ernestofiorillo di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Universita telematica "Pegaso" di Napoli o del prof Natale Maria.