Che materia stai cercando?

Anteprima

ESTRATTO DOCUMENTO

-istituzionale

-funzionale

LIVELLI DI UNITà DI ANALISI TERRITORIALI

Sono stati individuati 7 livelli di possibili unità di analisi territoriali a cui sono disponibili dati statistici:

nazione

regioni Eurostat

regione

provincia

comune

sezione di censimento

livelli intermedi di zonizzazione

I primi 6 sono in ordine gerarchico, l’ultimo è un livello intermedio.

LE AREE ISTITUZIONALI ITALIANE

Principali raggruppamenti territoriali in Italia:

grandi ripartizioni ( centro – nord e Mezzogiorno )

macro regioni ( nord – ovest, nord-est, centro, sud, isole)

regioni ( 20 di cui 5 a statuto speciale )

provincie ( 110 )

comunità montane

enti locali che raggruppano più comuni montano della stessa provincia

comuni

sezioni di censimento

LA NOMENCLATURA DELLE AREE A LIVELLO COMUNITARIO

L’ UE h istituito una nomenclatura statistica comune delle unità territoriali denominata NUTS. Questo permette

la rilevazione, compilazione e diffusione di statistiche regionali nell’ UE.

Perché le statistiche regionali possano essere messe a confronto c’è che le zone geografiche siano a livello di

popolazione e dimensioni confrontabili. Inoltre bisogna precisare la situazione politica, amministrativa e

istituzionale.

NOMENCLATURA DELLE UNITà TERRITORIALI PER LA STATISTICA ( NUTS ).

E’ stata elaborata da Eurostat più di 25 anni fa.

Scopo = ripartizione unica e uniforme delle unità territoriali per la compilazione di statistiche per l’ UE.

NOMENCLATURA NUTS: OBIETTIVI E PRINCIPI DI BASE

Obiettivi =

Raccolta, elaborazione, armonizzazione delle statistiche regionali comunitarie.

Analisi socio-economiche delle regioni

Inquadramento delle politiche regionali comunitarie.

Principi di baee =

Privilegia le partizioni istituzionali

Privilegia unità regionali di carattere generale

È una classificazione gerarchica a 3 livelli

CRITERI DI COSTRUZIONE DELLA CLASSIFIZACIONE

Le unità comparabili vengono raggruppate in ogni livello della NUTS e questo implica l’istituzione per ogni Stato

membro di un altro livello regionale. Questo corrisponde a una struttura amministrativa meno importante o inesistente.

SOGLIE ADOTTATE

LIVEL MINIM MASSI

LO O MO

NUTS 3 7 milioni

1 milioni

NUTS 800.00 3 milioni

2 0

NUTS 150.00 800.000

3 0

LA CLASSIFICAZIONE NUTS:

È gerarchica perché suddivide ogni Stato membro in 3 livelli: NUTS1, NUTS2, NUTS3. 2° e 3° livello sono

rispettivamente suddivisioni del 1° e 2° livello.

Per determinare a quale livello appartiene un’unità amministrativa di tiene conto di soglie demografiche

Es. per l’Italia  NUTS 1: 5 ree ( nord-ovest, nord-est, centro, sud, isole)

NUTS2 : regioni

NUTS3 : provincie

La classfificazione NUTS è importante per la ripartizione dei fondi strutturali.

METADATI PER L’ANALISI STATISTICA TERRITORIALE

Metadati = dati relativi a dati statistici che permettono di descrivere le caratteristiche fondamentali dei dati

statistici.

2 gruppi di utenti usano i metadati:

Produttori dei dati statistici  usano i metadati dei propri processi produttivi per garantirne la riproducibilità nel

tempo

Utenti dei dati statistici  usano i metadati per la ricerca

TIPOLOGIA DI INFORMAZIONI

1° distinzione  soggetti ai quali le statistiche si riferiscono:

Famiglie

Imprese

Pubbliche amministrazioni

2° distinzione  presenza e residenza dei soggetti rilevati

LE PROPRIETà FONDAMENTALI DELLE FONTI

L’attendibilità delle informazioni statistiche dipendono da:

Precisione delle rilevazioni

Accuratezza con cui vengono rilevati i dati

I PROBLEMI DELLE FONTI AMMINISTRATIVE

Vi sono diversi giacimenti informativi gestiti da varie istituzioni per fini non proprio statistici. I problemi che nascono

dall’uso di queste fonti sono:

Accuratezza delle rilevazioni

Campo di osservazione può avere delle caratteristiche che nascono dallo scopo dell’attività amministrativa

COMPARABILITà E COMPLETEZZA

Problema della comparabilità dei dati è la possibilità di affiancare le informazioni con altre che provengono da altre

fonti.

La completezza dei dati territoriali riguarda:

Lacune e omissioni nella costruzione delle informazioni

Copertura geografico delle informazioni che non sempre sono disponibili per tutto il territorio nazionale.

LE FONTI INFORMATIVE PER L’ANALISI STATISTICA DEL TERRITORIO

ISTAT  istituto nazionale di statistica, ente di ricerca pubblico, nato in Italia nel 1926.

Principale produttore di statistica ufficiale.

Opera in autonomia e interazione con il mondo accademico e scientifico.

Dal 1989 ha un ruolo di indirizzo, assistenza, coordinamento nel sistema statistico nazionale

SISTAN = sistema statistico nazionale.

Rete di soggetti pubblici e privati che dà al Paese e agli organismi internazionali l’informazione statistica

ufficiale. È nato per razionalizzare la produzione e diffusione delle informazioni, ottimizzare le risorse destinate

alla statistica ufficiale

Comprende :

ISTAT

Enti e organismi pubblici di informazione statistica

Uffici territoriali del Governo, Regioni, Provincie autonome, provincie delle camere di commercio, dei comuni.

EUROSTAT = ufficio statistico dell’ Unione Europea

È una direzione generale delle commissione europea

Raccoglie ed elabora dati dagli stati dell’ UE

La sua missione è dare all’UE informazioni statistiche di alta qualità con dati comparabili a Paese e regioni

Coopera con: (ONU) Nazioni Unite, altri paesi non dell’ UE

Importante l’attività che mira a migliorare la capacità statistica dei paesi in via di sviluppo del :

Mar Mediterraneo

Africa

Caraibi

Pacifico

America Latina

Asia

I PRINCIPALE DOCUMENTI A DIMENSIONE NAZIONALE

Fattori che contribuiscono a definire le modalità di formazione delle caratteristiche strutturali e dinamiche dei fenomeni:

Fattori che agiscono in maniera quasi uniforme sul territorio

Fattori che anche se incidono su tutto il territorio hanno ricadute diverse a livello locale

Fattori che nascono in aree limitate ma che si trasmettono ad altre aree

Fattori di natura esclusivamente locale

I DOCUMENTI A CARATTERE NAZIONALE CUI FARE RIFERIMENTO

Relazione generale sulla situazione economica del paese

Relazione previsionale e programmatica

Vengono prodotte ogni anno e presentate al Parlamento dal Ministro dell’Economia e delle Finanze

Rapporto annuale sulla situazione del Paese

Rapporto sull’economia del Mezzogiorno

I CENSIMENTI

Sono una fonte statistica che permette di avere il massimo dettaglio delle analisi territoriali dei fenomeni. In italia

vengono fatti su 3 settori:

Agricoltura

Popolazione e abitazioni

Industria e servizi

CENSIMENT AGRICOLTURA

I dato danno informazioni sulla struttura del sistema agricolo e zootecnico a livello nazionale, regionale e locale.

Le informazioni descrivono dettagliatamente il mondo agricolo: numero di aziende, titolo di possesso dei terreni,

utilizzazione dei terreni, consistenza allevamenti, manodopera impiegata.

CENSIMENTO DELLA POPOLAZIONE E DELLE ABITAZIONI

Principali obiettivi:

Conteggio della popolazione e rilevazione caratteristiche

Aggiornamento e revisione delle anagrafi

Determinazione popolazione legale

Raccolta informazioni sul numero e sulle caratteristiche strutturali delle abitazioni e degli edifici.

CENSIMENTO PERMANENTE

Introdotto nel 2012

Obiettivo  produrre dati ogni anni e non ogni 10 su un campione della popolazione.

Permette:

Riduzione costi per il censimento

Alleggerimento disturbo per le famiglie

CENSIMENTO INDUSTRIA E SERVIZI

Danno un quadro esaustivo delle dimensioni e delle caratteristiche del sistema economico aziendale

ALCUNI INDICATORI CHE POSSONO ESSERE CALCOLATI DAI DATI DEL CENSIMENTO IDUSTRIA E SERVIZI

Distribuzione percentuale per settore di attività economica

Distribuzione per classe dimensionale

Dimensione media

Livelli di presenza dell’artigianato

Indici di specializzazione

ALTRE FONTI

Camere di commercio la cui rete dispone di molte informazioni grazie al registro delle imprese

INPS

2° ARGOMENTO

L’INDAGINE CAMPIONARIA E I PRINCIPALI METODI DI CAMPIONAMENTO SPAZIALE.

IL CAMPIONAMENTO: CHE COS’è.

L’INDAGINE CAMPIONARIA

Nell’indagine statistica l’informazione può essere acquisita osservando tutte le unità statistiche che compongono la

popolazione o solo una parte di esse.

1° caso indagine completa o totale

2° caso indagine parziale o campionaria

INDAGINE TOTALE = l’indagine rileva tutte le caratteristiche delle unità della popolazione.

INDAGINE CAMPIONARIA = l’indagine rileva le caratteristiche delle unità di un sottoinsieme della popolazione.

Obiettivo estendere i risultati campionari attraverso la stima di una o più caratteristiche della popolazione.

Campionamento = insieme delle operazioni che consistono nella selezione degli appartenenti ad una popolazione con

lo scopo di studiare una parte della popolazione stessa.

IL CAMPIONAMENTO : perché

Indispensabile perché nessun censimento può riguardare l’intera popolazione;

Prevede operazioni di conteggio su un numero limitato di aree campione ( unità di campionamento ) dell’area di

studio;

Dà un’ indicazione statistica dello stato della popolazione;

Se il campione è scelto in modo adeguato i risultati possono essere generalizzati all’intera popolazione;

È economico ( costi e tempo limitati )

DEFINIZIONI DI POPOLAZIONE, UNITà E CAMPIONE STATISTICO

Popolazione statistica = insieme di tutti gli elementi oggetto di indagine

Unità statistica = ogni elemento della popolazione statistica

Campione statistica = un qualsiasi insieme di unità statistiche prese da tutta la popolazione.

L’UNITà DI RILEVAZIONE:

unità assunta come riferimento quando si selezionano i soggetti sui quali si conduce una indagine, un test, ecc.

non sempre coincide con l’unità statistica. Ad esempio nel censimento della popolazione se l’unità di rilevazione è la

famiglia, l’unità statistica rimane il singolo individuo che la compone.

I CONCETTI DI POPOLAZIONE E CAMPIONE

Termine popolazione = usato per indicare l’insieme delle unità che si possono riconoscere per un elemento comune e

che vengono usate come unità di rilevazione a prescindere se la rilevazione riguarda ogni unità statistica o solo una

parte.

Campione = insieme delle unità selezionate fra tutte quelle che compongono la popolazione allo scopo di

rappresentarla.

FASI DEL CAMPIONAMENTO

Individuazione popolazione di riferimento

Specificazione unità di campionamento

Definizione lista di campionamento

Determinazione numerosità campionaria

Scelta del metodo di campionamento

Selezione del campione

Stima dei parametri della popolazione a partire dai dati del campione

TIPI DI CAMPIONAMENTO

Pro balistici  formati da unità la cui probabilità di estrazione è nota. Hanno 2 proprietà: rappresentatività e stima

dell’errore di campionamento

Non probabilistici formati da unità la cui probabilità di estrazione è ignota. Vantaggi: più facili da usare, minore

investimento. Svantaggi: non generazzibilità, non si può quantificare l’errore di campionamento.

METODI DI CAMPIONAMENTO USATI IN AMBITO SPAZIALE

Campionamento casuale

Campionamento sitematico

Campionamento stratificato

Campionamento a grappolo

Campionamento a più stadi

CAMPIONAMENTO CASUALE

Più semplice e più usato

Campionamento sistematico : viene scelto un intervallo k per creare una griglia uniforme sullo spazio di

riferimento

Campionamento stratificato : creata una griglia all’interno della quale in campionamento viene fatto random. Si

usa quando si può fare a priori una distinzione delle caratteristiche ambientali, quando cioè la specie è

distribuita in modo irregolare per differenze ambientali tra le aree.

Campionamento a grappolo: selezionati gruppi di unità dette cluster che sono dati individuati artificialmente.

Campionamento casuale semplice CCS : tecnica che da la stessa probabilità di selezione ad ogni insieme di n

unità distinte dalla popolazione. Con questa tecnica si seleziona un campione di numerosità n da una

popolazione di N elementi senza o con ripetizione, così ogni campione può avere probabilità di essere estratto

Caratteristiche del CCS :

Unità di campionamento sono uguali all’unità di rilevazione

Ogni unità ha la possibilità di essere inclusa nel campione

CCS VANTAGGI E SVANTAGGI:

Vantaggi  non ha errori di selezione, è semplice, non c’è bisogno di informazioni a priori della popolazione

Limiti  non adeguato per specie molto mobili, non adeguato se la distribuzione nello spazio è eterogenea, può non

essere “ rappresentativo”

CAMOIONAMENTO SITEMATICO

Si usa quando le unità che compongono l’universo sono numerabili progressivamente. Consiste nell’estrarre delle

unità di campionamento distanziate da un intervallo costante

1  calcolare il “ passo di campionamento”

k=N/n

N = dimensione popolazione

n = campione

K = si arrotonda all’intero

2  estrarre a caso un numero r compreso tra 1 e K. Il campione sarà formato dalle unità che corrispondono alle

posizioni della lista

r; r+k; r+2k; r+3k+…+r+(n-1)k

3  il numero r identifica la prima unità. Dopo se ne estraggono 1 ogni k. Se k è tale che si arriva alla fine della lista di

N senza aver raggiunto le n unità campionarie si può ricominciare daccapo.

Metodo usato dall’ ISTAT per estrarre dalle liste anagrafiche

Se il modo in cui le unità sono elencate nella lista si può dire casuale, il campionamento sistematico si può

considerare uguale al campionamento casuale semplice

L’area di studio viene divisa in modo sistematico attraverso una griglia o dei transetti che possono avere un

passo variabile o costante e si individuano i punti di campionamento

IL CAMPIONAMENTO STRATIFICATO

Si usa quando si può distinguere a priori caratteristiche ambientali che determinano una significativa variazione della

distribuzione spaziale degli individui. Vuol dire che la specie è distribuita in modo irregolare dettato da differenze

ambientali tra le aree.

Le caratteristiche ambientali sono degli “ strati” entro cui la popolazione si distribuisce in modo casuale e i

campionamenti si possono distribuire fra gli strati.

Procedimento di stratificazione consiste nel:

Raggruppare le unità della popolazione in strati il più possibile omogenei al loro interno rispetto al carattere

investigato

Estrarre casualmente un certo numero di unità campione da ogni strato

Gli strati sono omogenei

La stratificazione si effettua sulla base di uno o più caratteri noti su tutti gli elementi della popolazione e lati al

carattere indagato

Lo strato h, con h = 1, 2, …, H, contiene N elementi.

h

Da ogni sottogruppo viene estratto in modo indipendente un campione di numerosità nh

Obiettivi della stratificazione:

Aumentare la precisione delle stime rispetti al campionamento casuale semplice, se i sottogruppi sono

omogenei al loro interno e disomogenei tra di loro

Facilitare e razionalizzare il campionamento

Esempio :

Indagine ISTAT su struttura e produzione aziende agricole

Regolamento stabilisce che : disegno di campionamento deve essere casuale e stratificato e la stratificazione

deve essere effettuata per dimensione e tipologia dell’azienda agricola

Popolazione divisa in 2 insiemi. Da questi insieme sono stati estratti 2 campioni disgiunti e indipendenti. Il primo

criterio di stratificazione è rappresentato dalle 21 ripartizioni territoriali ( NUTS2). Le altre variabili usate per la

stratificazione:

Orientamento tecnico economico ( OTE ) delle aziende

SAU ( Superficie Agricola Utilizzata )

UBA ( unità di bestiame )

Vantaggi :

Dà una migliore rappresentatività del CCS

Sfrutta informazioni disponibili sulla popolazione

Svantaggi :

Bisogna avere una lista completa delle unità della popolazione

C’è bisogno di un lavoro precedente la stratificazione :

Scelte delle variabili

Realizzare indagine pilota per verificare efficacia

CAMPIONAMENTO A GRAPPOLO

Presupposto  la popolazione è suddivisa in sottoinsiemi di unità

“ grappolo” = sottoinsieme degli elementi della popolazione che viene trattato come un’unica entità per il

campionamento

I grappoli, come gli strati sono una partizione della popolazione ma con caratteristiche opposte:

Sono predeterminati per scopi amministrativi

Devono essere eterogenei all’interno e omogenei fra loro

Fasi :

Ripartizione unità della popolazione in grappoli

Formazione lista dei grappoli

Selezione casuale di alcuni grappoli : il campione sarà formato da tutte le unità che appartengono au grappoli

prescelti

Vantaggi:

Se i grappoli sono insiemi di unità territorialmente o fisicamente vicini, i costi di spostamento da un’unità all’altra

all’interno di un grappoli sono bassi, quindi i costi di rilevazione complessivi sono bassi

Richiede solo la lista dei grappoli e delle unità statistiche che appartengono ai soli grappoli estratti

Difetti: Il campionamento per grappoli non assicura la stessa rappresentatività di quello stratificato perché poche volte

l’omogeneità fra grappoli è perfetta

CAMPIONAMENTO A Più STADI

Selezione delle “ unità di primo stadio” dentro le quali vengono selezionate alcune unità di uno stadio

successivo. Se gli stadi sono solo 2 ci possono essere le seguenti fasi:

Si individuano le unità di primo stadio dette unità primarie che formano raggruppamenti delle unità di secondo

stadio dette unità secondarie

Formazione della lista delle unità di primo stadio

Selezione casuale di alcune unità di primo stadio

Selezione casuale di alcune unità di secondo stadio da ogni unità di primo stadio estratta. Il campione a 2 stadi

è formato da tutte le unità secondarie prescelte.

Analogia fra campionamento a 2 stadi e campionamento a grappoli:

campionamento a 2 stadi è un campionamento a grappoli dove vengono considerate solo un sottoinsieme di unità

all’interno dei grappoli estratti. Con il campionamento a 2 stadi si può controllare la numerosità

CARATTERISTICHE DEI METODI DI CAMPIONAMENTO

Rappresentatività -> il metodo di campionamento deve riflettere fedelmente nelle unità campionarie le

caratteristiche di tutta la popolazione che si vuole studiare

Attendibilità -> aumenta all’aumentare del numero e delle dimensioni del campione

Scala -> è la dimensione delle unità campionarie

Fedeltà -> è la capacità di un metodo di misura di replicare i risultati ottenuti quando ci sono condizioni

identiche

Accuratezza -> capacità del metodo di avvicinarsi al valore reale

Precisione -> indica l’intervallo entro il quale si ha una determinata probabilità di trovare il valore esatto

Efficienza -> rapporto tra la precisione di una misura e il suo costo in tempo e danaro.

RICHIAMI

NOZIONI INTRODUTTIVE, TERMINOLOGIA ESSENZIALE, MISURAZIONE DEI CARATTERI

TERMINOLOGIA ESSENZIALE

Collettivo, Statistico o popolazione: insieme di riferimento, molteplicità dei casi individuali finalizzato alla

conoscenza o comprensione del fenomeno oggetto di studio.

Unità statistica: il caso individuale, un elemento della popolazione

Carattere statistico o Variabile: ogni aspetto elementare oggetto della rilevazione nelle unità statistiche della

popolazione

Modalità: i diversi modi con cui si presenta il carattere nelle unità statistiche del collettivo

LA POPOLAZIONE – ESEMPIO

Alcuni studenti vogliono finanziare le spese di frequenza universitaria iniziando un programma di ripetizioni ben fatte

ed a basso costo.

Quale sarà la popolazione?

Non possono essere tutti gli studenti iscritti. Ci si può limitare agli studenti dei primi 2 anni. Bisogna determinare le

materie per cui esistono le competenze ( corsi di statistica e matematica )

Si tratterà di : studenti del biennio che non hanno sostenuto statistica o analisi .

TIPOLOGIA DI POPOLAZIONE

Finita: include oggetti che possono essere contati ed il conteggio ad un certo punto si interrompe. Ad esempio

le pagine di un libro.

Enumerabile: le unità sono contabili e il conteggio non finisce mai. Ad esempio i numeri naturali.

Infinita: ogni sottoinsieme di popolazione contiene lo stesso numero di entità contenute nella popolazione. Ad

esempio le frazione tra 0 ed 1, le nuances di un colore.

Indeterminata: l’insieme di soggetti è finito perché esiste un limite fisico ma le unità sono sparse o rare da

rendere impossibile il censimento. Ad esempio gli animali selvatici, i tifosi di una squadra.

L’UNITà STATISTICA – esempi

Interessi maturati su un conto corrente ( conto corrente )

Tipo di riscaldamento di un appartamento ( appartamento )

Numero di testi consigliati in un corso ( corso )

UNITà STATISTICHE SEMPLICI E COMPOSTE

Semplice una persona, un albero, un’automobile, un soldato

Composta una famiglia, una foresta, una concessionaria, un reggimento

CARATTERE STATISTICO – esempi

Può essere una distanza, una numerosità, una forma, un grado. Qualunque carattere di “ articola” in “modalità”.

[ sesso -> maschio – femmina. Età-> anni]

Le modalità devono essere almeno:

Esausite -> devono rappresentare tutti i possibili modi di manifestarsi del carattere

Non sovrapposte -> ad ogni unità corrisponde una sola modalità

Soggett a variazioni -> cioè avere almeno due valori in corrispondenza delle unità statistiche

CLASSIFICAZIONE DEI CARATTERI STATISTICI

Le modalità di un carattere possono essere:

Quantitative  espresse da numeri ( età, reddito, temperatura ). Il carattere si dice quantitativo o variabile.

Qualitative  espresso da termini nominali, categorie, attributi ( sesso, professioni, colori, mesi ). Il carattere si

dice qualitativo o mutabile.

CLASSIFICAZIONE DELLE MUTABILI

Un carattere qualitativo si distingue in:

Carattere sconnesso  date 2 modalità si può solo affermare se sono uguali o diverse

Carattere ordinato  date 2 modalità si può solo dare un ordine. Si dicono :

Rettilinei -> hanno una modalità iniziale e una finale

Ciclici -> non hanno una modalità iniziale e una finale ma vengono fissate in modo convenzionale

CLASSIFICAZIONE DELLE VARIABILI

Un carattere quantitativo si distingue in :

Quantitativo con scala a intervalli  non esiste uno 0 assoluto non arbitrario o naturale

Quantitativo con scala di rapporti  esiste uno 0 assoluto naturale e non arbitrario.

Le variabili si distinguono in:

Discrete  l’insieme delle modalità può essere messo in corrispondenza con un sottoinsieme di numeri interi.

Continue  l’insieme delle modalità può essere messo in corrispondenza con un sottoinsieme di numeri reali.

CARATTERI DICOTOMICI

Hanno solo 2 modalità ( maschio e femmina )

Le unità statistiche sono classificate in base alla dicotomia : la presenza / assenza di un dato attributo. Alla

modalità presenza si assegna valore ‘a’, alla modalità assenza valore ‘b’

Dal punto di vista del livello di misurazione:

Possiedono in parte un ordinamento

Possiedono il requisito dell’unità di misura

ALTRE CLASSIFICAZIONI DEI DATI STATISTICI:

In base al tempo:

Invarianti nel tempo ( luogo di nascita, anno di nascita, ecc.)

Di stato ( età, stato civili, ecc)

Di flusso ( nascite, reddito, consumi, ecc )

DISTRIBUZIONI STATISTICHE

Distribuzioni statistiche disaggregate

Distribuzioni di frequenze

Distribuzioni doppie

MATRICE DEI DATI

I dati solitamente sono raccolti in forma RETTANGOLARE : matrice righe x colonne

Ogni riga della matrice corrisponde ad una UNITà DI OSSERVAZIONE

Ogni colonna della matrice corrisponde ad una VARIABILE

Esempio: si intervistano 39 persone con un questionario di 4 domande. 39

osservazioni x 4 variabili.

VARIABILI

ETICHETTE DI

IDENTIFICAZIONE

Unità u id sesso età Liv_istruz Distanza

(km)

Primo 1 M 24 2 15

Caio 2 M 32 3 6

Sempronio 3 M 19 2 20

… … … … … …

Velia 39 F 27 4 18

UNITà

STATISTICHE

NO NOMI –

PRIVACY

MODALITà DELLE

VARIABILI DISTRIBUZIONE UNITARIA O DISAGGREGATA

Si definisce distribuzione unitaria semplice di un carattere l’elencazione delle

modalità osservate, unità per unità, nel collettivo preso in esame. Se si analizza più di un carattere la

distribuzione di chiamerà unitaria multipla.

La distribuzione unitaria del carattere descrive, in modo analitico, le modalità di ogni unità statistica, ma non

rappresenta in modo sintetico le caratteristiche del fenomeno osservato.

Una prima descrizione del carattere osservato è data dalla frequenza con cui si presenta la sua modalità

( frequenza assoluta )

DISTRIBUZIONI DI FREQUENZE

Con le frequenze si può ottenere una rappresentazione più sintetica detta distribuzione di frequenze.

La distribuzione di frequenza semplice associa alla modalità che può assumere un carattere x le corrispondenti

frequenze assolute.

Si dice semplice se si riferisce ad un unico carattere ( sesso )

Si dice doppia se si riferisce a 2 caratteri congiunti ( sesso ed età )

In generale si dice multipla se si riferisce a più di un carattere

FREQUENZA ASSOLUTA

Dopo aver costruito il database, per valutare il fenomeno descritto dal carattere bisogna associare a ognu modalità la

frequenza assoluta = il numero di volte che una modalità si presenta nella popolazione.

Ad esempio -> una variabile discreta ottenuta dalle votazioni riportate da 30 studenti all’esame di statistica:

18; 23; 30; 24; 18; 27; 21; 29; 25; 23; 20; 19; 26; 22; 28; 22; 24; 30; 18; 25; 27; 26; 28; 28; 26; 27; 20; 22; 26; 21.

Bisogna identificare il valore minimo ( 18 ) e quello massimo ( 30 ) contando quante volte compare ogni modalità

( quanti sono gli studenti che hanno avuto lo stesso voto)

DISTRIBUZIONE DI FREQUENZA ( TABELLA)

La costruzione delle frequenze assolute permette di fare una prima valutazione sulla variabile osservata. Si può

affermare quali sono le votazioni che si manifestano con maggiore (26) e minore (19,29) frequenza.

Le frequenze assolute indicano la consistenza numerica effettiva con cui una certa modalità è stata osservata.

Voto Freq.

assolute

18 3

19 1

20 2

21 2

22 3

23 2

24 2

25 2

26 4

27 3

28 3

29 1

30 2

Totale 30

Esempio nel caso di VARIABILE CONTINUA

Quando la variabile è continua la distribuzione di frequenza della variabile suddivisa in classi si ottiene selezionando

m intervalli della variabile e contando per ogni intervallo il numero di volte che le unità osservate presentano un valore

in esso.

Esempio: si supponga di rilevare la temperatura corporea in un campione di 13 donne

{36.2, 36.6, 37.3, 38.0, 38.2, 36.5, 36.5, 37.3, 38.4, 36.5, 37.4, 38.0}

Nel formare le classi il limite inferiore della prima classe e quello superiore dell’ultima non devono essere i valori

osservati ma li devono comprendere

Bisogna definire il valore minimo e massimo.

Tabella nel caso di variabili continue

Invece di elencare le singole modalità è più conveniente raggrupparle in un certo numero di classi

Temperatura Freq. assoluta

36.0-36.4 1

36.5-36.9 4

37.0-37.4 3

37.5-37.9 1

38-38.4 4

Totale 13

FREQUENZE RELATIVE E PERCENTUALI

Le frequenze relative indicano il peso, il contributo relativo di ogni modalità totale.

Sono ottenute dividendo le frequenze assolute per il totale delle unità osservate.

fi = ni / N = n° di volte che si osserva l’i-esima modalità / n° di unità che formano la popolazione

A volte le frequenze percentuali sono preferite a quelle relative semplici.

f% = ni / N x 100 = fi x 100

FREQUENZE RELATIVE perché

Facilitare la percezione del PESO delle modalità

Sesso Freq. Freq. Freq. %

assoluta relativa

M 1750 0.583 58.3

F 1250 0.417 41.7

Tot 3000 1 100

Facilitare CONFRONTI tra popolazioni

Sesso FreqAssoluta Freq. %

Pop.A Pop. B Pop.A Pop. B

M 1750 850 58.3 85.0

F 1250 150 41.7 15.0

3000 1000 100 100

Attenzione  l’attendibilità delle frequenze relative dipende dalla numerosità della popolazione.

Esempio : ad un anno dalla laurea l’80% dei laureati è occupato. Si tratta di 5 laureati di cui 4 ccupati : se 2 degli

occupati non avessero trovato lavoro la percentuale sarebbe stata del 40%

FREQUENZE CUMULATE

La frequenza cumulata assoluta (relativa) associata ad una modalità della variabile indica il numera (la proporzione) di

osservazioni che presentano un valore minore o uguale rispetto a quello della modalità.

Si può usare solo se il carattere è misurato almeno su scala ordinale.

La distribuzione di frequenza cumulate e retro cumulate consistono nel sommare via via tutte le osservazioni che

presentano il valore inferiore (cumulate) o quello superiore (retro cumulate) ad una data modalità.

FREQUENZE CUMULATE: HANNO SENSO?

Hanno senso solo se le modalità sono ordinabili, cioè per tutte le variabili numerich.

Esempio di frequenze relative, percentuali e cumulate.

. esami f fi f% fcum

120 0.14 14.05 120

150 0.18 17.56 270

180 0.21 21.08 450

165 0.19 19.32 615

135 0.16 15.81 750

104 0.12 12.18 854

otale 854 1 100

Carattere qualitativo ordinale

Soddisfazione f f% fcum%

Poco 120 22.2 22.2

Abbastanza 241 44.5 66.7

Molto 180 33.3 100

Totale 541 100

Carattere qualitativo sconnesso

Colore occhi f f% fcum%

Castano 120 22.2 22.2

Azzurro 241 44.5 66.7

Marrone 180 33.3 100

Totale 541 100

NON HA SENSO

CLASSIFICAZIONE DELLE DISTRIBUZIONI

TABELLE DI FREQUENZA BIVARIATE

ESEMPIO DI FREQUENZE BIVARIATE

Numero di figli e condizione lavorativa

Frequenze assolute

Frequenze relative

3° ARGOMENTO

RAPPORTI STATISTICI

Molte volte i soli risultati di un’indagine statistica non permettono di avere una completa spiegazione del fenomeno

oggetto di indagine.

Rapporti statistici => permettono di confrontare meglio e in modo sintetico le intensità o le frequenze dei fenomeni

studiati.

In un rapporto statistico si mettono a confronto 2 termini di cui almeno uno è di natura statistica e tale che tra i 2

termini vi è un legame logico.

Con questi rapporti si può confrontare l’intensità di un fenomeno, misurato su un collettivo, di solito vengono usati per

descrivere fenomeni di tipo socio-economico.

Hanno sempre valore positivo e non dipendono dall’unità di misura, così può avvenire un confronto anche tra

fenomeni diversi.

RAPPORTI STATISTICI :

Rapporti di composizione

Rapporti di coesistenza

Rapporti di derivazione

Rapporti di densità

Variazione assoluta e relativa

Numeri indici

Rapporti statistici = indicatori che risultano dal rapporto di 2 dati statistici e permettono di confrontare l’intensità di un

fenomeno registrata in luoghi o tempi diversi.

RAPPORTI DI COESISTENZA

Dati dal rapporto tra le frequenze di 2 modalità di uno stesso fenomeno


ACQUISTATO

4 volte

PAGINE

51

PESO

610.94 KB

PUBBLICATO

+1 anno fa


DETTAGLI
Corso di laurea: Corso di laurea in turismo culturale e dams
SSD:
Università: Messina - Unime
A.A.: 2016-2017

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Debora.N. di informazioni apprese con la frequenza delle lezioni di Analisi dei dati territoriali e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Messina - Unime o del prof Gargano Romana.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!