Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Popolazione: è l'insieme dei casi oggetto di studio
Campione: è un sottoinsieme della popolazione oggetto di studio
Statistica:
- Descrittiva -> Utilizzata per sintetizzare le masse di informazioni
- Inferenziale: Utilizzata per ottenere previsioni sulla popolazione sulla base delle info campione
Parametro: Misura di sintesi calcolata a livello popolazione
Statistica: descrive campione
Qualunque caratteristica rilevante su ciascun soggetto è chiamata variabile (connoti che assumo diversi valori fra i soggetti)
Variabili si dividono in:
- Quantitative => Assumono valori numerici che rappresentano diversi ordini di grandezza
- Qualitative (categoriche) => Ognuno i valori assunti sono un insieme di categorie
La scala degli intervalli (var. quantitativa) -> Formata dai possibili valori numerici caratterizzati da specifica distanza numerica (intervalli)
- I livelli delle scale ad intervallo sono quantità e denominano variazioni in grandezza. Es. (20,000-30,000)
La variabile nominale (var. categoriale): I valori nominali (scala nominale) non rappresentano ordini di grandezza differenti
-> Formata da un insieme di categorie
Le variabili ordinale (var. categoriale): Le categorie hanno un ordinamento naturale di valore e non è possibile definire una distanza fra i vari livelli (scala ordinale - Es. classe sociale: alta, media, bassa)
- Ciascun livello (categoria) è una grandezza che è minima o massima di quella di un altro livello particolare, assegnando valori numerici alle diverse categorie in modo che le variazioni sono
- >
Trattate come se fosse misura su scala di intervalli
Classificazione le variabili anche in riferimento al nº di valori contenuti nella scala di misura:
- Discreta: i suoi valori rappresentano un insieme di numeri distinti (es. fortuito: 0, 1, 2, 3, 4)
- Continua: Può assumere come valori un continuum infinito (l’altezza, peso, tempo)
Le variabili categoriche: categorie non ordinate (nominali);
Categorie ordinate (ordinale);
Discreta (se assumono molti valori >tabella)
Continua
La statistica inferenziale fa uso delle statistiche campionarie per fare previsioni sui parametri popolazione
- Casualizzazione al fine di ottenere una buona
- Rappresentatività del campione
Campione casuale semplice = È ottenuto attraverso un metodo che garantisce che ogni campione abbia stessa possibilità di estrazione della popolazione
m = n° dei numero di soggetti campione (dimensione campionaria)
- Estratti da Lista Campionaria con tutti i soggetti popolazione :
- Assegna un numero a ciascun soggetto
- Ottenerne in modo casuale un insieme di diversi numeri
- Includere i soggetti estratti nel campione
Indagine campionaria = General e Social Survey (selezionando e intervistando un campione di popolazione)
Si può' presentare l'errore campionario quanto le statistiche calcolate nel campione si allontanano dal valore del parametro che prevedono
Campionamento = Probabilistico => Quanda la Prob. di ognuno di essere estratto è nota
Non Probabilistico => Quando la Prob. di ognuno di essere estratto non è nota (Risultati non affidabili. Per vilo della disposizione campionaria)
- Stratificato => La Popolazione viene suddivisa in gruppi distinti chiamati strati e da ogni strato viene estratto un Campione casuale semplice
- Gappato => Popolazione viene suddivisa in gruppi: si seleziona poi un campione casuale di questi gruppi (utile quando non si dispone di liste delle popolazione)
- Campione a più stadi => combinazione degli altri metodi di campionamento
- (ES. Sezioni editoriali come gruppi e seleziona un campione di una organizzazione)
Dati categorici: inseriti nella tabella con un elenco delle categorie della variabile con le relative Frequenze Assolute (n° di osservazioni che hanno preso il valore della variabile nel campione)
Rispetive proporzioni con Frequenze relative (proporzione percentiva di oss. che si listav'della categoria)
- N° osservazioni categoria numero compreso fra 0 ed 1 e somma di tutte
- N° totale osservazioni => Le FREQUENZE E magu di 1
Distribuzione di frequenze = è una Lista di tutti i possibili valori di una variabile e ciascuno di quelle è assiato un numero che rappresente quanto vołte quel valore viene osservato
Z-SCORE
Numero di dev. standard
che separano un'oss. distribuzione della media
- se è > di 3 è outlier
L'analisi bivariata
Studia come il valore della variabile risposta dipenda da o sia spiegato da i valori assunti dalla variabile esplicativa
- Indipendente
- Variabile dipendente
e
Indichiamo la media e dev. standard di una variabile nella popolazione
sono variabili con valore che dipendono del campione
Probabilità (campione casuale semplice): è la proporzione di volte in cui essa dovrebbe verificarsi in una serie di oss.
- Numero compreso fra 0 e 1
Se P(A) è la probabilità di un possibile evento:
- P(non A) = 1-P(A)
Se è nota la probabilità di A, allora la Prob. che non si verifichi è pari a 1 - meno quella prob.
Se A e B sono due possibili risultati:
- P(A o B) = P(A) + P(B)
Se A sia un valore stimato per la pop. camp., e sia molto basso oltre o sotto al di della pop. calcolata nella popolazione, sia B un valore stimato per la pop. e che esso sia molto alto oltre al di della pop. calcolata.
- Se A e B sono possibili esistenti
- P(A e B) = P(A) . P(B dato A)
- Se A e B sono indipendenti:
- P(A e B) = P(A) . P(B)
Una variabile deve assumere almeno 2 differenti valori => Camp. casuale semplice
Distribuzione di probabilità
Insieme di possibili risultati e corrispondenti probabilità
- Per variabili discrete:
- Assegna una probabilità a ciascun valore della variabile
- Ciascuna probabilità è un numero compreso fra 0 e 1
- La somma di tutte le prob. è 1
Ogni risultato varia da oss. a oss. secondo una variazione casuale che può essere spiegata da probabilità
Il suo errore standard (σ̂π) della Proporz. campionaria (f̂n)
σf̂ = σ/√n = √π(1−π)/m
Proporzione campionaria (f̂) = Media campionaria
- I campioni casuali di ampiezza elevata la dist. campionaria f̂ è approssimativamente normale intorno al parametro π oggetto di stima.
Scelto il campione se f̂ si trova entro 1,96 se damici da π, allora l'intervallo che va da
f̂ - 1,96se a f̂ + 1,96se contiene π
Contiene con probabilità 0,95 il parametro della popolazione π
L'intervallo f̂±1,96σf̂ è una stima intervallare per π
Con un livello di fiducia pari a 0,95 (inf. confidenza 0,97)
Il valore dell'errore standard (σf̂) è ignoto e viene stimato con se (stima campionaria errore standard)
se = √f̂(1−f̂)/m
Nel calcolo dell'intervallo di confidenza è bene arrotondare (Prime 2-03 cifra)
Ridurre la possibilità di errore durante l'intervallo è bene utilizzare imt. fiducia 99% (si trova a z 2,58 deviazioni standard dalla media f̂ ± 2,58 (se))
Se l'intervallo risulta più ampio si rinuncia alla stima 99% per includere il vero valore 95%
L'intervallo di confidenza per una proposizione della popolazione (π) è
f̂ ± z(se)
L'ampiezza di un intervallo di fiducia
- cresce al crescere del livello di fiducia
- decresce al crescere della dimensione campionaria (m)
Il prodotto rappresenta il margine d'errore
Più piccolo il margine d'errore e stretto l'intervallo
La probabilità che un metodo di stima intervallare fornisca un intervallo di confidenza che non contenga un certo parametro è definita livello di significatività
(1−livello fiducia)
α=livello di significatività
(per intervallo fiducia 95%: 1−0,95=0,05)
Teorema del limite centrale
al crescere di m la dist. camp. f̂ è quasi normale