Programma di riferimento
Estratto dal sito www.economia.unimib.it/GRESELIN
1. Introduzione alla statistica
2. Partizioni della statistica
- Statistica descrittiva
- Statistica induttiva
3. Elementi di base della statistica descrittiva
- Formazione dei dati statistici
- Formazione e rilevazione dei casi statistici
- Spoglio dei casi rilevati
- Preparazione dei dati e delle tabelle statistiche
- Trattamento statistico-matematico dei dati
4. I rapporti statistici
- Definizione ed utilità
- I rapporti statistici di: composizione, densità, derivazione, coesistenza.
- I numeri indici
5. Statistica descrittiva univariata
- Le frequenze: assolute, relative, cumulate, retrocumulate e specifiche
- Rappresentazione grafica delle distribuzioni di frequenze
- Le medie: la moda, la mediana e i quantili, la media aritmetica, la media armonica, la media quadratica e la media geometrica
- Le medie secondo il principio di invarianza di Chisini
Con riferimento al testo consigliato: Zenga M. (2007), Lezioni di statistica descrittiva, Giappichelli, gli argomenti in programma riguardano:
- Capitoli 1, 2, 3, 4 e 5 fino a pag 147 (compresa), ad esclusione di:
- caso dei dati raggruppati in classi (nel paragrafo 5.2.2.5, da metà pag 102 a 106)
- seconda proprietà della media geometrica (nel paragrafo 5.2.4.2)
Elenco delle dimostrazioni
- La relazione fra numeri indici a base fissa e numeri indici a base mobile
- Le proprietà delle frequenze relative
- La formulazione unificata della mediana mediante la spezzata di graduazione
- La mediana e i quartili nel caso delle distribuzioni di frequenza dei caratteri quantitativi continui
- Le proprietà della media aritmetica
- La proprietà della media geometrica relativa ai logaritmi
Introduzione
Capitolo 1: Significati del vocabolo statistica
Statistica:
- Indica, nel linguaggio corrente, un insieme di dati relativi ad uno o più fenomeni
- Indica, inoltre, la disciplina che studia i metodi per l'esame dei fenomeni della natura
Origine della statistica
Si pensa che il vocabolo statistica abbia origine dalla parola stato. Infatti, attorno al 1600, in alcuni corsi universitari svolti in Germania si descrivevano alcuni aspetti degli stati quali: superficie, popolazione e ricchezza. Tali lezioni erano tenute da Ermanno Conring, insegnante di diritto pubblico, e diedero luoghi a trattazioni autonome denominate "staats-kunde".
I seguaci di Conring descrivevano i fenomeni riguardanti gli stati in forma sempre più quantitativa mediante l'uso di tabelle. Si affermò così l'esigenza di pubblicare e raccogliere i dati più importanti di stati, regioni e comuni. Oggi tali funzioni sono svolte da uffici nazionali, regionali, provinciali, comunali. (Ricordiamo l'ISTAT -1926, Corrado Gini: istituto che raccoglie e pubblica dati sullo stato).
Altro approccio alla statistica si ebbe con John Graunt (1662) che, partendo da dati elementari (quali bollettini di natalità/mortalità della città di Londra), ha messo in evidenza regolarità di interesse sociale e demografico. Il metodo di Graunt fu perfezionato da molti altri studiosi tra cui il tedesco Sussmilch (1707-1767), fondatore della demografia. Tali metodi sono stati successivamente estesi al campo assicurativo.
Un notevole impulso allo sviluppo della statistica si ebbe con B. Pascal (Francia) che ha introdotto il calcolo delle probabilità per risolvere alcuni problemi legati ai giochi di sorte. Altri importanti contributi allo sviluppo del metodo statistico si ebbero con:
- L'avvento dei calcolatori
- L'introduzione della rilevazione campionaria
A chi serve la statistica?
I metodi proposti dalla statistica per l'esame dei fenomeni della natura sono diffusi:
- Nelle ricerche delle scienze empiriche
- Nelle analisi di fenomeni, fatte con finalità operative
Scienze empiriche e statistica
Le scienze si dividono in: scienze deduttive (non empiriche) e scienze empiriche.
- Scienze deduttive: usano come metodo di indagine, per ricavare le proprie leggi, la deduzione. Esempio: la logica o la matematica.
- Le scienze deduttive procedono nelle loro ricerche nei seguenti modi:
- Si parte da asserzioni iniziali (assiomi) che vanno ritenute vere
- Con l'uso di altre regole si deducono delle conseguenze (teoremi)
- Per verificare la veridicità dei teoremi basta controllare che le regole deduttive siano applicate correttamente (non bisogna analizzare i fatti della natura)
- Se le regole deduttive vengono applicate correttamente anche i teoremi si ritengono veri.
- Scienze empiriche: usano come metodo di indagine l'induzione o la deduzione. Esempio: la fisica, la sociologia o l'economia.
Le scienze empiriche hanno il compito di: esplorare, descrivere, spiegare e prevedere i fatti del mondo reale. Le leggi proposte dalle scienze empiriche devono essere avallate da prove empiriche. La dipendenza dalle prove empiriche è ciò che distingue le scienze empiriche da quelle non empiriche o deduttive.
Attività operative e statistica
Nelle attività operative l'analisi dei fatti serve a:
- Aiutare a prendere decisioni
- Raggiungere particolari obiettivi di tipo utilitaristico
Esempi: grado di soddisfazione della clientela alberghiera, tasso di disoccupazione, rilevazione contabile a campione.
Partizioni della statistica
Capitolo 2: Introduzione al concetto di popolazione
- Popolazione: insieme delle unità statistiche che si intende esaminare;
- Popolazione in demografia: insieme delle persone che vivono in una certa area geografica a una determinata data. Esempio: 55.996.000 = popolazione in Italia al censimento del 21.10.2001
- Popolazione in statistica: ha un significato più ampio poiché le unità statistiche possono essere di varia natura. Esempio:
- Popolazione degli alberghi della provincia di Milano nel 2005. (Alberghi = unità statistica)
- Studenti iscritti al corso di laurea in ecocom al 2012. (Studenti = unità statistica)
Il concetto di popolazione ha un ruolo importante nella partizione della statistica. La statistica si suddivide in: statistica descrittiva e statistica induttiva.
La statistica descrittiva
Statistica descrittiva: descrive con opportuni metodi le caratteristiche più salienti dei fenomeni oggetto di indagine rilevabili sulle singole unità statistiche. Tali descrizioni si ottengono con processi di sintesi effettuati sui dati ricavati dalle singole unità statistiche a disposizione. I processi di sintesi forniscono grandezze più maneggevoli della totalità dei dati. Se la sintesi si effettua utilizzando una parte (=campione) delle unità statistiche della popolazione di interesse si ottengono valori (medi) che non coincidono con il valore (medio) che si dovrebbe ottenere utilizzando tutti i dati della popolazione di interesse.
La statistica induttiva
Statistica induttiva (o inferenza statistica): predispone i metodi che permettono di estendere le sintesi campionarie a tutta la popolazione di interesse. La statistica induttiva in particolare insegna a:
- Determinare la numerosità del campione
- Scegliere le unità statistiche della popolazione che devono far parte del campione
- Valutare il grado di attendibilità delle sintesi campionarie
Questa parte della statistica impiega concetti legati al calcolo delle probabilità.
Statistica descrittiva
Capitolo 3: La statistica descrittiva
La statistica descrittiva, come detto in precedenza, si occupa di descrivere con opportuni metodi le caratteristiche più salienti dei fenomeni che si intende esaminare sulle unità statistiche della popolazione di interesse. La descrizione che viene effettuata passa attraverso due fasi:
- Formazione dei dati statistici
- Trattamento statistico-matematico dei dati
Formazione dei dati statistici
Con tale fase si raccolgono i dati di fatto (reali) riguardanti i fenomeni da esaminare. Per raccogliere i dati di fatto bisogna individuare la popolazione di interesse ovvero raccogliere le unità statistiche che la compongono. Dalle unità statistiche bisogna ricavare i dati statistici. La formazione dei dati statistici passa attraverso quattro fasi:
- Formazione dei casi statistici
- Rilevazione dei casi statistici
- Spoglio dei casi rilevati
- Preparazione dei dati e delle tabelle statistiche
1. Formazione dei casi statistici
Dopo aver precisato la popolazione di interesse bisogna determinare i fenomeni (=i caratteri, le caratteristiche) da rilevare. Dopo aver determinato i caratteri da considerare bisogna prevedere le modalità con cui si possono presentare i caratteri. Nell'individuare la lista delle modalità di un carattere bisogna fare in modo che:
- Le modalità siano incompatibili tra loro
- La lista sia esaustiva
Proprietà dell'incompatibilità tra le modalità: prese due qualsiasi modalità l'una deve escludere l'altra in modo che sarà possibile assegnare una sola modalità ad ogni unità statistica della popolazione. (Per un carattere vi possono essere diverse modalità).
Tipi di caratteri
Nella tradizione statistica i caratteri si distinguono in:
- Caratteri quantitativi: le modalità sono espresse con numeri che indicano il risultato di una misurazione o di un conteggio. Questi si distinguono, a loro volta, in:
- Caratteri quantitativi discreti: le modalità assumono un numero finito di valori e sono ottenute soprattutto mediante un conteggio
- Caratteri quantitativi continui: le modalità sono ipoteticamente tutti gli infiniti valori compresi in un intervallo (a,b): b>a
- Caratteri qualitativi: le modalità indicano categorie e/o attributi e sono espresse, in generale, con vocaboli o con espressioni verbali.
Scale di misurazione
Uno studioso costruisce una scala di misurazione del carattere quando:
- Fissa la lista delle modalità di un carattere
- Indica i criteri di appartenenza alle stesse
Per un carattere vi possono essere diverse scale di misurazione. Le scale di misurazione si differenziano in base al tipo di carattere:
- Caratteri qualitativi: scala nominale, scala ordinale.
- Caratteri quantitativi: scala di intervalli, scala di rapporti.
- Scala nominale: tra le modalità del carattere non si può istituire nessun ordinamento. (modalità poste in ordine qualsiasi)
- Scala ordinale: le modalità hanno un ordine naturale e quindi fra le stesse modalità si può istituire la relazione di maggiore o minore.
- Scale di intervalli e di rapporti: le modalità dei caratteri quantitativi sono espresse con numeri che indicano il risultato di una misurazione o di un conteggio.
Scale di intervalli: adottano uno zero convenzionale che non significa assenza del fenomeno. Esempio: temperatura di un corpo in gradi centigradi. La temperatura di un corpo si può misurare con la scala Celsius (gradi centigradi °C). Nel caso dei gradi centigradi C=0 è la temperatura del ghiaccio fondente. Infatti la temperatura uguale a zero non sta ad indicare assenza di temperatura poiché possono esistere temperature negative come -10°C.
Scale di rapporti: adottano uno zero assoluto che significa assenza del fenomeno. Esempio: temperatura di un corpo in gradi kelvin. La temperatura di un corpo si può misurare con la scala Kelvin. Nel caso dei gradi Kelvin K=0 è lo zero assoluto dei fisici e sta ad indicare assenza di calore e si ha per C=-273°C. Per la temperatura si ha anche la scala Fahrenheit che assegna lo zero a un punto convenzionale. I gradi Fahrenheit sono legati ai gradi centigradi: la temperatura 0°Fahrenheit coincide con -17,7°Celsius.
Prese due unità statistiche, due temperature in questo caso, è possibile affermare:
- Se le modalità sono uguali o meno (come nella scala nominale)
- Se le modalità non sono uguali: si può indicare quale sia minore
- La differenza tra le due modalità
Non è però possibile effettuare il rapporto tra due modalità, siccome lo zero è convenzionale. Esempio: confronto tra due temperature. Temperatura di un corpo A: 30°C. Temperatura di un corpo B: 60°C. Differenza: C2-C1= 60°C-30°C= 30°C. Rapporto: = 2 non ha senso affermare che la temperatura di B sia il doppio di quella di A.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.