Domande esame statistica
1. Parlare del chi-quadrato come misura di associazione
L'indice di chi-quadrato è un indice che dà informazione, in media quadratica, di quanto differiscono le frequenze effettive da quelle teoriche e quindi dà una misura del grado di connessione o associazione tra i due caratteri oggetto di studio. Il chi-quadrato possiamo utilizzarlo sia con variabili quantitative e qualitative. Il vincolo del chi-quadrato consiste nella numerosità delle celle di una tabella che non deve essere inferiore a 5. In una tabella 2x2 non si può calcolare il chi-quadrato.
2. Che cos'è il P-Value e quando lo utilizziamo?
Nel modello inferenziale il concetto di P-Value ha una grande importanza perché permette di stabilire l'accettazione o il rifiuto dell'ipotesi di interesse, confrontando direttamente la probabilità della statistica test-empirico con il livello di significatività α fissato a priori e quindi, scegliere la regola di decisione in modo tempistico. Dopo aver effettuato il test e controllato la relativa statistica-test, il P-Value può essere definito come la probabilità di osservare un valore della stessa statistica uguale o più estremo del valore campionario, che si sarebbe realizzato se l'ipotesi nulla o di interesse fosse stata vera. Per calcolare il P-Value occorre determinare il valore della statistica test empirica e quindi trovare il valore della statistica messa a confronto con il valore critico al livello di confidenza prescelto.
3. Cos'è il coefficiente angolare?
Il coefficiente angolare della retta di regressione si calcola facendo il rapporto tra la codevianza e varianza x (cioè la variabile indipendente). Un coefficiente angolare positivo indica una retta crescente che va dal basso a sinistra verso l'alto a destra. Se è negativo la retta è decrescente e va dall'alto a sinistra verso il basso a destra. Una retta con coefficiente angolare pari a 0 non cresce e non decresce.
4. Parlare della regressione lineare
L'analisi di regressione lineare è una tecnica che permette di analizzare la relazione lineare tra una variabile dipendente e una o più variabili indipendenti. L'analisi della regressione lineare è una metodologia asimmetrica che si basa sull'ipotesi dell'esistenza di una relazione di tipo causa-effetto tra una o più variabili (o esplicative) e la variabile dipendente (o di criterio). Lo studio di questa relazione può avere un duplice scopo:
- Esplicativo cioè comprende e ponderare gli effetti della variabile indipendente sulla variabile dipendente in funzione di un determinato modello teorico.
- Predittivo cioè individuare una combinazione lineare di variabili indipendenti per prevedere in modo ottimale il valore assunto dalla variabile dipendente.
La regressione lineare
Variabile dipendente Y Effetto
Variabile indipendente (X1, X2, X3, X4,…,Xn)
Le variabili, per poter essere inserite in un modello di regressione lineare semplice o multipla, devono essere del seguente tipo:
- Variabili dipendente (Y): quantitativa
- Variabili indipendenti (X1, X2, X3, X4,…,Xn): qualitative
La regressione binomiale (o semplice)
Nell'analisi della regressione semplice o bivariata abbiamo una sola variabile indipendente, sulla quale "regredisce" la variabile dipendente. Si ipotizza che la variabile dipendente "influenzi" o "predica" la variabile dipendente. L'analisi della regressione lineare semplice individua quella retta che consente di prevedere al meglio, i punteggi nella variabile dipendente a partire da quelli della variabile indipendente.