Statistica - Appunti per esame

Ho scritto questi appunti partecipando alle lezioni e rielaborando il materiale fornito dal professore. All'interno vengono trattati tutti gli argomenti con i relativi esercizi e loro …

Esame Statistica

Facoltà Scienze politiche

Dal corso del Prof. Rossi Luca

Università Università telematica Niccolò Cusano di Roma

Publisher DottSimone91

A.A. 2021-2022

65 pagine

9 download

Appunto

Vota 4,0 / 5 (2)

Scarica

Estratto del documento

TIPI DI TEST

Test parametrici: si utilizzano quando conosciamo la funzione di ripartizione della variabile casuale che sintetizza la popolazione e si vogliono effettuare dei test statistici sui suoi parametri dati (test parametrici principali: test di T Student; test di Fisher; test sulla Normale standardizzata).

Test non parametrici: si utilizzano quando non è nota il tipo di distribuzione.

Risultato del test:

Regione di accetazione: lo spazio di valori con i quali possiamo accettare il parametro dato dopo aver verificato il valore dello stesso parametro sul campione di individui estratto dalla popolazione.
Regione critica (o di rifiuto): lo spazio dei risultati che non ci permettono di accettare il parametro sulla base dei valori calcolati sul campione di individui estratti.

Scopo del test: verificare se il parametro conosciuto della popolazione possa essere attendibile o meno confrontandolo con il valore teorico ricavato da un campione di individui estratti dalla stessa.

popolazione.Nel confronto si tiene in considerazione una regione di accetazione. Esempio:Supponiamo che l'età media dei laureati in giurisprudenza sia di 24 anni. Viene esaminato un campione di 16 studenti e si vuole analizzare il valore medio sapendo che σ = 1 e che nella regola di decisione per testare la media α = 0,05 Ipotesi nulle: H0 → μ = 24 Ipotesi alternativa: H1 → μ ≠ 24 Il test da utilizzare è a 2 code, dobbiamo quindi considerare α/2 = 0,025 e quindi il valore = 1,96 (1-0,025=area alla α/2 quale corrisponde il valore di z) Distribuzione T di Student → VIENE UTILIZZATA IN STATISTICA PER STIMARE IL VALORE MEDIO DI UNA POPOLAZIONE QUANDO SONO DISPONIBILI UN CAMPIONE DI PICCOLE DIMENSIONI ED I VALORI SEGUONO L'ANDAMENTO DELLA VARIABILE. Se il campione è più numeroso le distribuzioni gaussiana e quella di Student differiscono di poco, pertanto è indifferente usare una ol'aspetto seguente:

l'altra.T → TTEST DI STUDENT EST SULLA MEDIA DI UNA POPOLAZIONE CON VARIANZA NON NOTA

Test di T student = È UN TEST STATISTICO DI TIPO PARAMETRICO CHE VIENE UTILIZZATO PER VERIFICARE SE LA MEDIA DI’UN INTERA POPOLAZIONE CON VARIANZA NON NOTA SI DISCOSTA SIGNIFICATIVAMENTE O MENO DALLA MEDIA CALCOLATA SUUN CAMPIONE DI INDIVIDUI ESTRATTI DALLA STESSA POPOLAZIONE

Si definisce quindi:

ipotesi nulla H → μ = μ (la media del campione coincide con la media della popolazione intera)
ipotesi alternativa H → μ ≠ μ (i 2 valori non coincidono, o meglio il valore medio calcolato sui campioni non ricade sulla regione di accetazione)

Distribuzione chi-quadrato: è una distribuzione continua che presenta asimmetria in cui tutti i suoi valori sono sempre positivi in quanto la variabile è una somma di quadrati.

La curva si trova nel 1° quadrante e assume forme diverse per ogni valore di v che indica i gradi di libertà ed assume

solo valori positivi. Come per le altre distribuzioni di probabilità l'area compresa tra la curva e l'asse delle ascisse è pari ad 1.
Il test di "Chi-quadrato" è un test che viene ampiamente utilizzato in statistica per verificare se le frequenze dei valori osservati si adattino o meno ai valori delle frequenze teoriche relative ad una distribuzione di dati. Dopo aver prefissato l'errore massimo tollerabile, il test di "Chi-quadrato" consente di stabilire se la differenza tra frequenze osservate e teoriche è imputabile al caso oppure ad altre ragioni.
Il test di Fisher è utilizzato in statistica per verificare se due popolazioni che seguono entrambe l'andamento della distribuzione normale abbiano la stessa varianza.
L'ipotesi nulla H₀: σ =σ0ipotesi alternativa: le 2 varianze sono diverse, una può essere maggiore dell'altra e viceversa
Se l'ipotesi nulla è verificata allora ogni variabile si distribuisce come una chi-quadro con n-1 gradi di libertà → in tale test viene richiesto se la varianza di una popolazione che
TEST DELLA VARIANZA DELLA POPOLAZIONE
segue l'andamento di una distribuzione gaussiana può corrispondere o meno ad un certo valore.
21 22
Se l'ipotesi nulla è verificata (H = σ = σ) la distribuzione si distribuisce come una chi-quadrato con n-1 gradi di libertà
RACCOLTA DATI E RAPPRESENTAZIONE DEGLI STESSI
C:AMPO DI STUDIO DELLA STATISTICAL , ,A STATISTICA INDAGA SU FENOMENI COLLETTIVI CHE RIGUARDANO CIOÈ UN INSIEME DI INDIVIDUI OGGETTI O BENI
RACCOGLIENDO INFORMAZIONI RELATIVE AD ESSI E TRADUCENDOLE POI IN UN MODELLO NUMERICO CHE POSSA ESSERE
ANALIZZATO SEMPLICEMENTE
Popolazione = indica il gruppo di persone, oggetti o

beni preso in esame (cittadini con diritto di voto, aziende tessili in Liguria, studenti di un liceo, libri presenti sulla scrivania)
Individuo (unità statistica) = ogni elemento della popolazione
S → raccoglie ed elabora i dati per studiare un fenomeno collettivo
STATISTICA DESCRIPTIVA → si occupa dei metodi per stimare un fenomeno collettivo a partire da un campione
STATISTICA INDUTTIVA → ricavato da una popolazione

3 FASI DELLA STATISTICA:

rilevazione tramite schede, questionari, interviste anche telefoniche, exit poll.
sintetizzare i dati raccolti per avere una lettura più immediata e veloce
interpretazione dei dati per trarre conclusioni e fare previsioni

Tipo di rilevazione:

Totale: eseguita su tutte le unità statistiche della popolazione
Parziale o campionaria: eseguita solo su una parte o campione della popolazione

Costi contenuti ma risultati approssimati

costruzione di tabelle e grafici. All'interno della tabella si riportano i diversi risultati con le relative frequenza assolute. Le tabelle possono contenere: sia dati quantitativi -> seriazione statistica (num.stanze - num.appartamenti) che dati qualitativi -> serie statistica (es titolo di studio - frequenza: licenza) media-200; diploma-600; laurea-200 I dati possono essere suddivisi anche per classi (intervallo di valori) Frequenza assoluta -> numero di individui il cui carattere assume un determinato valore Frequenza relativa -> rapporto tra freq. assoluta e la totalità della popolazione Frequenza percentuale -> è la freq. relativa espressa in percentuale Grafici -> permettono una rappresentazione visiva e veloce dei dati riportati nella tabella (diagrammi a barre, istogrammi, grafici a torta) E3) calcolo degli indici statistici che ci permettono di avere un'idea più chiara. LABORAZIONE DATI Calcolo la media e la

varianza. Dalla varianza ricavo lo scarto quadratico medio che ci fornisce informazione riguardo lo scostamento dei diversi caratteri (delle diverse preferenze degli intervistati) rispetto alla media. Se lo scarto quadratico è basso allora i caratteri sono molto vicino alla media, viceversa, se lo scarto medio quadrartico ha valori maggiori, allora ci saranno caratteri che si allontanano dalla media in modo più marcato.

DATI RILEVATI POSSONO ESSERE:

Qualitatitivi → espressi in forma verbale e rappresentati spesso da aggettivi (giudizio di un film, colore, nazionalità, attitudine agli studi)
Quantitativi → espressi da numeri, detti valori (altezza delle persone, peso, numero di stanze di un appartamento)

Discreti: insieme finito o infinito di numeri interi positivi (insieme dei numeri Naturali {0,1,2,3…}) (numero dei componenti di una famiglia)

Continui: insieme dei numeri Reali (numeri positivi e negativi con parte decimale) (altezza, peso)

STORIA ED

EVOLUZIONE DELLA STATISTICA Etimologia della parola statistica deriva dal vocabolo "Stato" e fa riferimento alla constatazione sulle informazioni di fenomeni reali che in passato erano state raccolte in primis dagli organismi statali. Statistiche: intesa quindi come informazioni organizzate e gestite dallo Stato. ISTAT → istituto nazionale di statistica per la raccolta e la diffusione dei dati. SVILUPPO DELLA STATISTICA - 1713 Bernoulli: introduce il concetto della probabilità - teoria variabili casuali + teorie del limite centrale. - 1760 Lambert sviluppa i grafici come sintesi dei risultati ottenuti. - 1800 Sviluppo di diagrammi e grafici (introduzione grafici a torta). - Sviluppo variabili casuali - Poisson. - 1853 PRIMO CONGRESSO DELL'ISTITUTO INTERNAZIONALE DI STATISTICA. - 1885 FONDAZIONE DELL'ISTITUTO INTERNAZIONALE DI STATISTICA. - Laplace grande apporto allo sviluppo della statistica nell'800 - contributo nella teoria delle probabilità.pronbabilità- dal 1900: grande sviluppo della statistica con l'analisi di nuove variabili casuali e nuovi modelli con i quali studiare molti fenomeni di vario genere (campo medico, campo economico, statistiche sulla popolazione, statistiche elettorali) - nascita delle variabili che utilizziamo oggi (variabile casuale Chi-quadrato; variabile casuale di t di Student e relativo Test di Student; analisi statistiche da parte di Fisher) - Introdotto coefficiente di correlazione 1904 - Pubblicazione di riviste statistiche applicate in varie materie (economia) - normalizzazione dei grafici attraverso una commissione in modo da renderli confrontabili - sviluppo dei test statistici - si effettuano delle previsioni riguardo le elezioni intervistando un campione di elettori - 1939 I SFONDAZIONE IN TALIA DELLA OCIETÀ ITALIANA DI STATISTICA Fino all'800 si considerava la statistica una materia assestante che poteva al massimo essere affiancata alla fisica per lo studio di

alcuni fenomeni

A partire dal novecento, invece, abbiamo un notevole sviluppo della statistica e la stessa viene considerata una materia oggettiva e interdisciplinare, cioè una materia che si può agganciare a tutte le altre discipline al fine di analizzare e creare dei modelli riguardo lo studio di molti fenomeni.

La statistica è utilizzata oggi per l'analisi dei caratteri di una popolazione, per le previsioni sulle lezioni, in campo economico, mediaco, sociale...

Person mette le basi per la statistica moderna

Oggetto di studio della statistica sono le popolazioni

Statistica investigativa → raccolta dati + elaborazione + ricerca delle cause

Se nell'800 la statistica era considerata una scienza inferiore, nel 900, viene invece considerata una disciplina fondamentale che può essere applicata a qualsiasi materia.

Viene a svilupparsi la statistica inferenziale

Anteprima

Vedrai una selezione di 10 pagine su 65