Anteprima
Vedrai una selezione di 7 pagine su 26
Riassunto esame Statistica, Prof. Arpino Bruno, libro consigliato Metodi statistici di base e avanzati per le scienze sociali, Agresti, finlay  Pag. 1 Riassunto esame Statistica, Prof. Arpino Bruno, libro consigliato Metodi statistici di base e avanzati per le scienze sociali, Agresti, finlay  Pag. 2
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica, Prof. Arpino Bruno, libro consigliato Metodi statistici di base e avanzati per le scienze sociali, Agresti, finlay  Pag. 6
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica, Prof. Arpino Bruno, libro consigliato Metodi statistici di base e avanzati per le scienze sociali, Agresti, finlay  Pag. 11
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica, Prof. Arpino Bruno, libro consigliato Metodi statistici di base e avanzati per le scienze sociali, Agresti, finlay  Pag. 16
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica, Prof. Arpino Bruno, libro consigliato Metodi statistici di base e avanzati per le scienze sociali, Agresti, finlay  Pag. 21
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica, Prof. Arpino Bruno, libro consigliato Metodi statistici di base e avanzati per le scienze sociali, Agresti, finlay  Pag. 26
1 su 26
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Popolazione: è l'insieme dei casi oggetto di studio

Campione: è un sottoinsieme della popolazione oggetto di studio

Statistica:

  • Descrittiva -> Utilizzata per sintetizzare le masse di informazioni
  • Inferenziale: Utilizzata per ottenere previsioni sulla popolazione sulla base delle info campione

Parametro: Misura di sintesi calcolata a livello popolazione

Statistica: descrive campione

Qualunque caratteristica rilevante su ciascun soggetto è chiamata variabile (connoti che assumo diversi valori fra i soggetti)

Variabili si dividono in:

  • Quantitative => Assumono valori numerici che rappresentano diversi ordini di grandezza
  • Qualitative (categoriche) => Ognuno i valori assunti sono un insieme di categorie

La scala degli intervalli (var. quantitativa) -> Formata dai possibili valori numerici caratterizzati da specifica distanza numerica (intervalli)

  • I livelli delle scale ad intervallo sono quantità e denominano variazioni in grandezza. Es. (20,000-30,000)

La variabile nominale (var. categoriale): I valori nominali (scala nominale) non rappresentano ordini di grandezza differenti

-> Formata da un insieme di categorie

Le variabili ordinale (var. categoriale): Le categorie hanno un ordinamento naturale di valore e non è possibile definire una distanza fra i vari livelli (scala ordinale - Es. classe sociale: alta, media, bassa)

  • Ciascun livello (categoria) è una grandezza che è minima o massima di quella di un altro livello particolare, assegnando valori numerici alle diverse categorie in modo che le variazioni sono
  • >

Trattate come se fosse misura su scala di intervalli

Classificazione le variabili anche in riferimento al nº di valori contenuti nella scala di misura:

  1. Discreta: i suoi valori rappresentano un insieme di numeri distinti (es. fortuito: 0, 1, 2, 3, 4)
  2. Continua: Può assumere come valori un continuum infinito (l’altezza, peso, tempo)

Le variabili categoriche: categorie non ordinate (nominali);

Categorie ordinate (ordinale);

Discreta (se assumono molti valori >tabella)

Continua

La statistica inferenziale fa uso delle statistiche campionarie per fare previsioni sui parametri popolazione

  • Casualizzazione al fine di ottenere una buona
  • Rappresentatività del campione

Campione casuale semplice = È ottenuto attraverso un metodo che garantisce che ogni campione abbia stessa possibilità di estrazione della popolazione

m = n° dei numero di soggetti campione (dimensione campionaria)

  1. Estratti da Lista Campionaria con tutti i soggetti popolazione :
  2. Assegna un numero a ciascun soggetto
  3. Ottenerne in modo casuale un insieme di diversi numeri
  4. Includere i soggetti estratti nel campione

Indagine campionaria = General e Social Survey (selezionando e intervistando un campione di popolazione)

Si può' presentare l'errore campionario quanto le statistiche calcolate nel campione si allontanano dal valore del parametro che prevedono

Campionamento = Probabilistico => Quanda la Prob. di ognuno di essere estratto è nota

Non Probabilistico => Quando la Prob. di ognuno di essere estratto non è nota (Risultati non affidabili. Per vilo della disposizione campionaria)

  • Stratificato => La Popolazione viene suddivisa in gruppi distinti chiamati strati e da ogni strato viene estratto un Campione casuale semplice
  • Gappato => Popolazione viene suddivisa in gruppi: si seleziona poi un campione casuale di questi gruppi (utile quando non si dispone di liste delle popolazione)
  • Campione a più stadi => combinazione degli altri metodi di campionamento
  • (ES. Sezioni editoriali come gruppi e seleziona un campione di una organizzazione)

Dati categorici: inseriti nella tabella con un elenco delle categorie della variabile con le relative Frequenze Assolute (n° di osservazioni che hanno preso il valore della variabile nel campione)

Rispetive proporzioni con Frequenze relative (proporzione percentiva di oss. che si listav'della categoria)

    • N° osservazioni categoria numero compreso fra 0 ed 1 e somma di tutte
    • N° totale osservazioni => Le FREQUENZE E magu di 1

Distribuzione di frequenze = è una Lista di tutti i possibili valori di una variabile e ciascuno di quelle è assiato un numero che rappresente quanto vołte quel valore viene osservato

Z-SCORE

Numero di dev. standard

che separano un'oss. distribuzione della media

  • se è > di 3 è outlier

L'analisi bivariata

Studia come il valore della variabile risposta dipenda da o sia spiegato da i valori assunti dalla variabile esplicativa

  • Indipendente
  • Variabile dipendente

e

Indichiamo la media e dev. standard di una variabile nella popolazione

sono variabili con valore che dipendono del campione

Probabilità (campione casuale semplice): è la proporzione di volte in cui essa dovrebbe verificarsi in una serie di oss.

  • Numero compreso fra 0 e 1

Se P(A) è la probabilità di un possibile evento:

  • P(non A) = 1-P(A)

Se è nota la probabilità di A, allora la Prob. che non si verifichi è pari a 1 - meno quella prob.

Se A e B sono due possibili risultati:

  • P(A o B) = P(A) + P(B)

Se A sia un valore stimato per la pop. camp., e sia molto basso oltre o sotto al di della pop. calcolata nella popolazione, sia B un valore stimato per la pop. e che esso sia molto alto oltre al di della pop. calcolata.

  • Se A e B sono possibili esistenti
  • P(A e B) = P(A) . P(B dato A)
  • Se A e B sono indipendenti:
  • P(A e B) = P(A) . P(B)

Una variabile deve assumere almeno 2 differenti valori => Camp. casuale semplice

Distribuzione di probabilità

Insieme di possibili risultati e corrispondenti probabilità

  • Per variabili discrete:
  • Assegna una probabilità a ciascun valore della variabile
  • Ciascuna probabilità è un numero compreso fra 0 e 1
  • La somma di tutte le prob. è 1

Ogni risultato varia da oss. a oss. secondo una variazione casuale che può essere spiegata da probabilità

Il suo errore standard (σ̂π) della Proporz. campionaria (f̂n)

σ = σ/√n = √π(1−π)/m

Proporzione campionaria (f̂) = Media campionaria

  • I campioni casuali di ampiezza elevata la dist. campionaria f̂ è approssimativamente normale intorno al parametro π oggetto di stima.

Scelto il campione se f̂ si trova entro 1,96 se damici da π, allora l'intervallo che va da

f̂ - 1,96se a f̂ + 1,96se contiene π

Contiene con probabilità 0,95 il parametro della popolazione π

L'intervallo f̂±1,96σ è una stima intervallare per π

Con un livello di fiducia pari a 0,95 (inf. confidenza 0,97)

Il valore dell'errore standard (σ) è ignoto e viene stimato con se (stima campionaria errore standard)

se = √f̂(1−f̂)/m

Nel calcolo dell'intervallo di confidenza è bene arrotondare (Prime 2-03 cifra)

Ridurre la possibilità di errore durante l'intervallo è bene utilizzare imt. fiducia 99% (si trova a z 2,58 deviazioni standard dalla media f̂ ± 2,58 (se))

Se l'intervallo risulta più ampio si rinuncia alla stima 99% per includere il vero valore 95%

L'intervallo di confidenza per una proposizione della popolazione (π) è

f̂ ± z(se)

L'ampiezza di un intervallo di fiducia

  • cresce al crescere del livello di fiducia
  • decresce al crescere della dimensione campionaria (m)

Il prodotto rappresenta il margine d'errore

Più piccolo il margine d'errore e stretto l'intervallo

La probabilità che un metodo di stima intervallare fornisca un intervallo di confidenza che non contenga un certo parametro è definita livello di significatività

(1−livello fiducia)

α=livello di significatività

(per intervallo fiducia 95%: 1−0,95=0,05)

Teorema del limite centrale

al crescere di m la dist. camp. f̂ è quasi normale

Dettagli
Publisher
A.A. 2022-2023
26 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher jack_988 di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Firenze o del prof Arpino Bruno.