● Media: valore medio dei dati.
● Mediana: valore centrale che divide i dati in due metà uguali.
● Moda: valore che si presenta con maggiore frequenza.
● Media ponderata: simile alla media, ma tiene conto dell’importanza o del
peso di ciascun dato.
3. Misure di dispersione
Misurano quanto i dati si discostano dal valore centrale.
● Varianza: misura quanto i dati sono lontani dalla media.
● Deviazione standard: indica la dispersione dei dati attorno alla media in
modo più intuitivo.
● Range: differenza tra il valore massimo e minimo.
● Intervallo interquartile: misura la dispersione dei dati centrali, ignorando
estremi.
● Coefficiente di variazione: misura relativa della dispersione rispetto alla
media.
4. Concetti di probabilità
● La probabilità esprime quanto è probabile che un evento accada.
● Eventi complementari: se un evento non accade, allora il suo
complementare accade.
● Unione di eventi: quando si considera che almeno uno tra più eventi
accada.
● Intersezione di eventi: quando si considerano eventi che accadono
contemporaneamente.
● Eventi indipendenti: il verificarsi di un evento non influenza la
probabilità dell’altro.
5. Distribuzioni di probabilità
● Distribuzione discreta: assegna probabilità specifiche a ciascun valore
possibile, ad esempio il lancio di un dado.
● Distribuzione continua: i valori possono assumere qualsiasi numero in un
intervallo, come le altezze delle persone.
● Le distribuzioni più comuni includono la distribuzione uniforme, la
distribuzione binomiale e la distribuzione normale.
6. Distribuzione binomiale
● Modello per situazioni in cui ci sono due possibili esiti (successo o
insuccesso) ripetuti più volte.
● Indica quante volte ci si aspetta di ottenere un certo numero di successi in
un numero fisso di prove.
● È molto usata per previsioni e simulazioni di eventi ripetuti.
7. Distribuzione normale
● È la distribuzione più comune nella statistica, caratterizzata da simmetria
attorno alla media.
● La maggior parte dei valori si concentra attorno alla media, con meno dati
agli estremi.
● Serve come modello per moltissimi fenomeni naturali, come altezza,
peso, punteggi dei test.
8. Teorema del limite centrale
● Quando si sommano molti valori casuali indipendenti, la loro
distribuzione tende ad essere normale, anche se i singoli valori non lo
sono.
● Questo principio permette di usare la distribuzione normale per stimare
probabilità e parametri di popolazioni più complesse.
9. Statistica descrittiva grafica
● Istogramma: rappresenta la distribuzione di frequenze dei dati.
● Diagramma a barre: usato per dati categoriali.
● Diagramma a torta: mostra le percentuali di ciascuna categoria.
● Boxplot: evidenzia mediana, quartili e valori estremi.
● Scatter plot: mostra la relazione tra due variabili numeriche.
10. Probabilità condizionata e teorema di Bayes
● Probabilità condizionata: probabilità che un evento si verifichi dato che
un altro evento è già avvenuto.
● Teorema di Bayes: permette di aggiornare le probabilità di un evento alla
luce di nuove informazioni o evidenze.
11. Campionamento e stima
● Gli stimatori derivano dai dati campionari per stimare i parametri della
popolazione.
● L’errore standard misura la variabilità dello stimatore.
● Gli intervalli di confidenza indicano un range di valori in cui ci si aspetta
che il parametro della popolazione si trovi con un certo livello di
sicurezza.
12. Test d’ipotesi
● L’ipotesi nulla rappresenta la situazione di partenza, mentre l’ipotesi
alternativa è ciò che si vuole dimostrare.
● Il livello di significatività indica quanto si è disposti a rischiare di
commettere un errore.
● Il p-value misura quanto i dati osservati siano compatibili con l’ipotesi
nulla.
● Si rifiuta l’ipotesi nulla quando i dati mostrano evidenze sufficienti a
favore dell’ipotesi alternativa.
13. Correlazione e regressione
● La correlazione misura la forza e la direzione di una relazione lineare tra
due variabili.
● La regressione lineare permette di prevedere i valori di una variabile a
partire da un’altra, individuando una relazione di tipo causa-effetto o
predittiva.
14. Tabelle e riepiloghi
● Le tabelle di frequenza organizzano i dati, mostrando quante volte si
verificano certi valori.