vuoi
o PayPal
tutte le volte che vuoi
Teoria di Probabilità e Teoria di Statistica
Incidenza = nuovi casi/periodo = nuovi casi/popolazione * K(t)
Prevalenza = numero di persone che presentano la malattia in una popolazione = numero malati/popolazione * K(t)
Statistica = studio dei fenomeni collettivi o di massa, riferito ad una popolazione
Unità statistica = ogni singolo elemento della popolazione
Variabile = caratteristica della popolazione che osserviamo
Osservazione, dato, modalità = valore assunto dalla variabile in un'unità statistica
Campionamento = il campione deve contenere informazioni sulla popolazione e queste informazioni possono essere il più casuale possibile.
Casuale = ogni individuo della popolazione ha la stessa possibilità degli altri appartenenti al campione
Semplice = qualsiasi altro campione di ampiezza n ha la possibilità di essere selezionato.
Variabili statistiche: Una variabile statistica è una caratteristica del fenomeno in osservazione. Ad esempio nel...
fenomeno "popolazione straniera presente in Italia" si possono prendere in esame caratteristiche riguardanti la provenienza, la religione, l'istruzione, la famiglia, ecc. Le variabili sono di tre tipi: a) Variabili qualitative nominali, se consentono solo operazioni di classificazione. Ad esempio il sesso, il colore degli occhi (a livello macroscopico) b) Variabili qualitative ordinali (o semiquantitative), se consentono anche operazioni di ordinamento. Ad esempio il livello di istruzione, l'anno di nascita (inteso come identificazione anagrafica). c) Variabili quantitative, se consentono misurazioni. Ad esempio il reddito, l'età, il numero di figli. TIPI DI DISTRIBUZIONE: a) le osservazioni equidistanti dalla mediana (coincidente in questo caso col massimo centrale) presentano la stessa frequenza relativa. Un esempio importante è la distribuzione normale.importante è fornito dalla curva di fornito dalla curva di distribuzione normale
b) Distribuzione asimmetrica positiva: la curva di frequenza ha una coda più lunga a destra del massimo centrale.
c) Distribuzione asimmetrica negativa: la curva di frequenza ha una coda più lunga a sinistra del massimo centrale.
RAPPRESENTAZIONI DI UNA VARIABILE QUALITATIVA
Le rappresentazioni usuali per le variabili qualitative sono le tabelle di contingenza (o semplicemente tabelle) e i diagrammi a barre (o impropriamente istogrammi).
Osserviamo che per le variabili nominali l'ordine delle modalità nelle tabelle e nelle rappresentazioni grafiche è arbitrario. Nelle tabelle di contingenza ad ogni valore i della variabile è associato il numero ni delle volte in cui tale valore si riscontra nelle osservazioni oppure la sua frequenza relativa (ni/N). La tabella con le frequenze relative viene anche detta tabella della distribuzione della variabile.
STATISTICA
UNIVARIATA: analisi dei valori riferiti ad un'unica variabile della popolazione. Bisogna trattare singolarmente ogni variabile. Quando il dato non è reperibile si scrive NA.
ALCUNI COMANDI...
VARIANZA CAMPIONARIA: L'obiettivo è determinare un parametro che misuri la dispersione dei dati rispetto alla media campionaria.
PERCENTILI: il valore h che divide un assegnato insieme di n dati, cioè di n valori, supposti ordinati in senso non decrescente, in modo che il numero dei valori inferiori a h costituisca una data percentuale di n. Ad esempio per trovare il 95-esimo percentile, ossia quel valore tale che il 95% dei dati ordinati è minore o uguale ad esso, si usa la stessa regola, con p = 0.95. La formula è L / N (100) = P. In questa funzione L sta a indicare il numero di prove con punteggio inferiore a 87, N la cifra totale dei punteggi del test e P è il percentile.
QUARTILI: In statistica, ciascun intervallo fra i valori in cui viene diviso un insieme di dati.
corrispondente a un quarto dei casi rilevati. data una distribuzione di valori la si ordina in senso crescente (dal più piccolo al più grande), dopodiché si calcolano le frequenze (prima quelle assolute, poi quelle cumulate). A questo punto si saprà come sono distribuiti i valori in questione.
I quartili suddividono la serie X in quattro parti uguali. Pertanto, per trovare la frequenza del primo quartile dobbiamo dividere per quattro la somma delle frequenze. Si ottiene così la frequenza del primo quartile (Φ Q )
BOX PLOT: I box plot forniscono un riepilogo visivo rapido della variabilità dei valori in un dataset. Mostrano la mediana, i quartili superiore e inferiore, i valori minimo e massimo ed eventuali outlier nel dataset.
- La linea centrale nella scatola rappresenta la mediana dei dati.
- La parte inferiore e superiore della scatola mostrano il 25° e il 75° quantile, o percentile.
- Le linee che si estendono a partire dalla scatola
Sono chiamate baffi.
COVARIANZA: per vedere se tra 2 variabili esiste un legame lineare. Può essere:
- POSITIVA: cresce x cresce y o viceversa
- NEGATIVA: cresce x diminuisce y o viceversa
- NULLA: x e y non sono correlate tra loro
INDICE DI CORRELAZIONE DI PEARSON: per studiare il grado di intensità del legame lineare tra coppie di variabili. Se è uguale a +1 o -1 le variabili sono perfettamente correlate.
STATISTICA INFERENZIALE:
OBIETTIVO: trarre conclusioni su un'intera popolazione a partire da dati di un campionamento
FORMULE SU FOGLIO...
STATISTICA E PROBABILITÀ ESERCIZI E TEORIA DA FARE:
- ESERCIZI ST. DESCR. 1 FATTO
- ESERCIZIO ST. DESCR 2 FATTO
- COMPLEMENTI SULL'UTILIZZO DI R 1,2,3
- PROBABILITÀ 2 SCRIPT 1
- PROBABILITÀ 2 SCRIPT 2
- PROBABILITÀ 3 SCRIPT 1,2,3 STAMPA E LEGGI
- STATISTICA INFERENZIALE 1 SCRIPT 1,2,3
- STATISTICA INFERENZIALE 2 SCRIPT 1,2
- STATISTICA INFERENZIALE 3 SCRIPT R
- ESERCIZI STATISTICA INFERENZIALE
- COMPLEMENTI
STATISTICA INFERENZIALE SCRIPT R 1,2-TEST AUTOVALUTAZIONE-ESERCIZI DI STATISTICA IN LETTURA 1,2,3-SIMULAZIONI