Anteprima
Vedrai una selezione di 3 pagine su 6
Formule per esame di statistica Pag. 1 Formule per esame di statistica Pag. 2
Anteprima di 3 pagg. su 6.
Scarica il documento per vederlo tutto.
Formule per esame di statistica Pag. 6
1 su 6
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Cosa fa la sintesi di un carattere quantitativo?

La sintesi di un carattere quantitativo assegna a ciascuna unità la stessa modalità del carattere. Essa risente dell'unità di misura della variabile e gode della proprietà di internalità, ovvero il suo valore è interno al valore minimo e massimo.

Medie di posizione moda, mediana e percentili: (quantitative e qualitative).

Medie analitiche aritmetica (solo qualitative).

Percentili: rappresenta la famiglia a cui la mediana (valore centrale delle osservazioni una volta che queste sono state ordinate in senso crescente).

Variabilità: è l'attitudine di un fenomeno a presentarsi con modalità diverse.

Variabilità qualitativa (sconnesse e ordinali) → scarto.

Variabilità quantitativa (discrete e continue) → quadratico medio.

Range: differenza tra la più grande e la più piccola osservazione.

Variabilità per caratteri quantitativi: esistono due modi di misurare, il primo si ottiene...

confrontando ciascuna modalità con tutte le altre xi-Xi, il secondo è di confrontare ogni modalità con la misura di sintesi scelta per esprimere la caratteristica della distribuzione xi-M.media degli scarti. Fare la : Σ (xi-M) =0 per evitare l'influenza dei segni (- e Obiettivo:+) si può scrivere |xi-M| oppure (xi-M)^2 (useremo questa). Ottenere misura di variabilità ottenuta dalla media degli scarti. Scarto quadratico medio serie di valori: σ=√(Σ(xi-M)\n≥0) : Σ(xi-M^2) \n Distribuzioni doppie : dai due caratteri x e y si definisce distribuzione doppia l'insieme delle modalità della variabile doppia e delle frequenze congiunte nij (sono quelle assolute delle unità che presentano congiuntamente la modalità i-esima x e j-esima y) ad esse associate. Indipendenza logica : la conoscenza delle modalità di uno dei 2 caratteri non migliora la previsione delle modalità dell'altro; se xqualitativi connessi: data una tabella doppia rispetto a 2 caratteri qualitativi connessi, indice di associazione phi. Indice phi: serve per stabilire l'intensità della relazione: phi = (ad - bc) / sqrt((a+b)(c+d)(a+c)(b+d)) -1 ≤ phi ≤ 1 phi = -1 se e solo se c'è una relazione inversa perfetta tra x e y; phi = 0 se e solo se non c'è relazione tra x e y; phi = 1 se vi è una relazione diretta perfetta tra x e y.

qualitativi ordinati: tra 2 caratteri ordinati possono sussistere 2 tipi diversi di relazione, (se modalità di ordine elevato di x si associano più frequentemente a modalità di ordine elevato di y e modalità di ordine basso di x si associano più frequentemente a modalità di ordine basso di y) e (se le modalità di ordine elevato di x si associano più frequentemente a modalità di ordine basso di y e modalità di ordine basso di x si associano più frequentemente a modalità di ordine elevato di y).

Indice rho di Spearman: indice di associazione per caratteri ordinati può assumere sia valori negativi che positivi, corrispondenti rispettivamente a situazioni di discordanza e concordanza. Caso di caratteri ordinati che rappresentano delle graduatorie; la differenza tra i ranghi dell'i-esima unità è di i; n è il numero delle unità statistiche. ρs = 1-

(Σd^2 i)/(n(n^2-1))-1 ≤ ρs ≤ 1

ρs=1: i ranghi sono in perfetta concordanza;

ρs=-1: i ranghi sono in perfetta discordanza;

ρs=0: le 2 graduatorie non mostrano associazione.

Ranghi ripetuti: quando 2 o più valori di x o y sono identici (ties) e pertanto hanno lo stesso rango, si può procedere in 2 modi, attribuendo alle unità appaiate un Rango Medio, pari alla media delle loro posizioni ipotetiche; attribuendo alle unità appaiate lo Stesso Rango e poi all'unità successiva il rango che effettivamente le compete.

Indagini totali: facciamo riferimento a una ricerca che ha preso in considerazione tutte le unità da cui è costituita la popolazione interessata;

Indagini parziali popolazione N (numerosità): analizza solo un gruppo della popolazione; campione n (grandezza campionaria).

Problema inferenza: non è noto il valore di grandezze (parametri).

Campione estratto da popolazione: statistica di interesse.

Si possono usare ẋ=Σxi/n s=√(Σ(xi-ẋ)^2\n) f=ni/n

Statistica campionaria : funzione dei dati campionari.

Inferenza statistica : quando generalizziamo un risultato campionario.

Significa prendere in considerazione una serie di tecniche e procedure tramite le quali possiamo generalizzare dei risultati rilevati a livello campionario per riferirli alla popolazione da cui il campione è stato estratto.

Esistono campioni di diverso tipo: per usare l'inferenza statistica si prende in considerazione il campione probabilistico (capire come si misura la probabilità); deve prevedere una selezione casuale delle unità, mettere dentro una scatola biglietti con numero matricola ed estrarre a caso.

Nessuna relazione tra ricercatore e soggetto selezionato.

Popolazione (parametri) Campione (statistiche campionarie)

µ= Σ xi/N media ẋ= Σ xi/n media campionaria

σ= Σ(xi-ẋ)^2/N scarto s= Σ(xi-ẋ)^2/n deviazione campionaria

π= ni/N

La proporzione p = ni/n rappresenta la proporzione campionaria.

La probabilità si riferisce all'oggetto su cui si misura la probabilità (evento). La probabilità di un evento P(E) rappresenta una manifestazione possibile. Bisogna attribuirgli una misura P(E) definita come il rapporto tra il numero di casi favorevoli a E e il numero di casi possibili. 0 ≤ P(E) ≤ 1. Se P(E) = 0, l'evento è impossibile, se P(E) = 1, l'evento è certo. Ω viene utilizzato anche per indicare lo spazio campionario, ovvero l'insieme di tutti i possibili risultati di una prova.

La regola della somma si applica agli eventi incompatibili A e B. La probabilità dell'unione di A e B è uguale alla somma delle probabilità di A e B. Se gli eventi sono compatibili, la probabilità dell'unione di A e B è uguale alla somma delle probabilità di A e B meno la probabilità dell'intersezione di A e B.

Gli eventi sono indipendenti quando il verificarsi di uno non modifica la probabilità del verificarsi dell'altro. La probabilità dell'intersezione di A e B è uguale al prodotto delle probabilità di A e B.

Gli eventi sono dipendenti quando il verificarsi di uno influisce sulla probabilità del verificarsi dell'altro. Ad esempio, se immaginiamo di fare due estrazioni, la probabilità dell'intersezione di A e B dipende dalla probabilità di A e dalla probabilità di B.

pari a 1/N, alla seconda la prob 1/N-1 perché unaprob è già uscita. P(A∪B) = P(A) P(B|A). V. discrete V. continue
P(x) x f(x)+∞∫ xE(x)= Σ xi P(x) E(x)= f(x) dx-∞ +∞∫VAR (x)= Σ⦋xi- E(x)⦋^2 P(xi) VAR (x)= ⦋x-E(x)⦋^2 f(x)dx-∞
Distribuzioni notevoli : usandole come modelli è possibile descrivere alcuni fenomeni reali conoscendo gli elementi caratteristici di queste distribuzioni.
Distribuzione normale standardizzata : x~ N(0,1)
Scatterplot : relazione positiva se aumenta x, aumenta y; relazione negativa se aumenta x, diminuisce y; relazione assente se aumenta x, y aumenta o diminuisce.
Covarianza concordanza: i caratteri presentano se la maggior parte degli scostamenti sono concordi; presentano se la maggior parte degli scostamenti sono discordi. COV (x,y)= σxy= 1/n Σ(y1-ȳ) (xi-ẋ) si può scrivere anche σxy=1/nΣxiyi – (ẋȳ).
Correlazione : la covarianza può

assumere valori all'interno di -σyσx ≤ σxy

Coefficiente di correlazione lineare di Bravais e Pearson:≤ σxσy.ρxy= σxy/σxσy.

Proprietà del coeff correlazione :ρxy=1 Se tra x e y sussiste un perfetto legame lineare e i 2 caratteri sono Concordi.

Ρxy=-1 Se tra x e y sussiste un perfetto legame lineare e i 2 caratteri sono Discordi.

Ρxy=0 Se i 2 caratteri sono indipendenti oppure se la loro relazione nonè lineare.

Obiettivo relazione funzionale e statistica : date 2 variabili x e y, si è interessati a comprendere come la variabile y (dipendente) sia influenzata dalla x (indipendente). Y è funzione di x se ad ogni valore di x corrisponde un solo valore di y. La relazione funzionale è lineare se possiamo scrivere Y= β0+β1x β0 intercetta, β1 coeff angolare.

Metodo dei minimi quadrati : per un certo valore dei parametri (β0 e β1) si definisce valore corrispondente

alla i-esima osservazione. Ŷi= β0+β1x. Ilei=yi-ŷicorrispondente Errore di Previsione (o residuo) è εi. La sommadei quadrati dei residui è una misura complessiva dell’errore di previsione.G (β0, β1) =Σ(yi-ŷ)^2= Σ(yi-β0-β1xi)^2.Stima puntuale dei coeff di regressione: indicheremo con ŷi= β0+β1xi ilvalore di y fornito dalla retta stimata dove β0 e β1 sono le stime dei coeff diregressione. Tale metodo consiste nel ricercatore le stime di β0 e β1 cherendono minima la funzione di perdita. Chiameremo residuo i-esimo la
Dettagli
Publisher
A.A. 2021-2022
6 pagine
SSD Scienze economiche e statistiche SECS-S/05 Statistica sociale

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher sofitoooo di informazioni apprese con la frequenza delle lezioni di Statistica sociale e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Palermo o del prof Parroco Anna Maria.