Cinquanta esercizi di relazioni tra variabili quantitative e qualitative
Esercizio 1
Si conoscono i seguenti dati che si riferiscono ad un campione casuale semplice di 80 dati della v.c. X,Y:
- Per X, la media aritmetica è 25 e la somma dei quadrati 58320
- Per Y, la media aritmetica è 32 e la somma dei quadrati 92480
- La codevianza tra X e Y è -640
Esercizio 2
In una grande banca si vuole determinare se il tempo (in giorni) per espletare una pratica di erogazione di un mutuo dipenda dall'importo del mutuo stesso (in migliaia di Euro). Si rilevano di 12 pratiche estratte a caso e si ottengono i dati che seguono:
- Importo del mutuo (X): 120, 118, 136, 50, 132, 144, 85, 113, 104, 180, 152, 114
- Tempo di erogazione (Y): 14, 18, 16, 9, 16, 14, 10, 12, 10, 18, 12, 10
- a) Determinare la relazione lineare di Y in funzione di X
- b) Stimare, con intervallo di confidenza al 95%, il tempo di erogazione di un mutuo di 160 mila Euro
- c) Stimare quanta parte della variazione del tempo di erogazione è spiegata dall'importo del mutuo e saggiarne la significatività al livello del 5%
Esercizio 3
In un corso sulla lettura veloce si è considerato un campione di 12 soggetti indipendenti e per ciascuno di essi è rilevata la velocità di lettura (parole lette al minuto) in relazione al numero di lezioni ricevute. Con i dati che seguono si chiede di:
- a) Rappresentare i dati osservati e determinare la relazione lineare di Y in funzione di X
- b) Dare una stima intervallare al 95% per la velocità di lettura di un soggetto che abbia seguito venti lezioni
- c) Stimare quanta parte della varianza della Y è spiegata dalla regressione con la X e saggiarne la significatività al livello del 5%
Velocità (Y): 34, 118, 146, 124, 136, 140, 108, 146, 160, 184, 162, 170
Esercizio 4
La tabella che segue riporta i risultati di un’indagine campionaria per valutare il gradimento di un dato prodotto. I 150 soggetti casuali sono distinti per classi di età e la qualità del prodotto è valutata con un giudizio qualitativo. Si vuole stabilire se vi è una differenza significativa nei giudizi espressi per le differenti fasce di età.
| Classi di età | Scadente | Accettabile | Buono | Totale |
|---|---|---|---|---|
| 21-30 | 23 | 9 | 4 | 36 |
| 31-60 | 17 | 25 | 28 | 70 |
| >60 | 5 | 8 | 31 | 44 |
| Totale | 45 | 42 | 63 | 150 |
Esercizio 5
Volendo conoscere l’opinione degli studenti circa una innovazione nella didattica di primo anno, si considera un campione di 320 studenti, 80 per ciascuno di quattro corsi di laurea (BAM, ECOEUR, ECOTUR, EPO). Danno giudizio positivo sulla innovazione didattica il 40% degli studenti di BAM, il 55% di quelli iscritti a ECOEUR e il 60% di quelli iscritti a ECOTUR. In complesso sono favorevoli all’innovazione il 60% degli studenti intervistati. Verificare, al livello di significatività del 5%, l’ipotesi che le differenze di opinione riscontrate tra gli studenti dei diversi corsi di laurea siano dovute al caso.
Esercizio 6
Per valutare la diffusione di un romanzo tra gli studenti, si sono intervistati 400 studenti delle superiori e 200 studenti universitari scelti a caso e si è stimato che il romanzo è acquistato dal 25% degli studenti delle superiori e dall’8% degli universitari. Si chiede di:
- a) Costruire la tabella a doppia entrata 2x2 “Livello istruzione” x “Acquirenti”
- b) Saggiare l’ipotesi di indipendenza tra i due caratteri al livello del 5%
Esercizio 7
La tabella che segue riporta i dati di età e pressione arteriosa sistolica alle ore 11 di un campione casuale di 12 donne, tutte aventi una medesima patologia. Determinare la relazione lineare tra la pressione e l'età, verificare l'ipotesi che l'età non dia un contributo significativo alla spiegazione della variabilità della pressione sistolica e stimare, con intervallo di confidenza al 95%, la pressione sistolica alle ore 11 di una donna con quella patologia e di età 45 anni.
- Età: 56, 42, 72, 36, 63, 47, 55, 49, 38, 42, 68, 60
- Pressione: 147, 125, 160, 118, 149, 128, 150, 145, 115, 140, 152, 155
Esercizio 8
La tabella che segue riporta la distribuzione di un campione casuale di 320 unità estratto da una variabile doppia X,Y. Misurare il grado di correlazione lineare tra le due variabili e saggiarne la significatività.
| Y | 150 | 160 | 170 | 180 | 190 |
|---|---|---|---|---|---|
| 3 | 5 | 6 | 24 | 35 | 40 |
| 4 | 22 | 18 | 15 | 13 | 12 |
| 5 | 45 | 37 | 28 | 14 | 6 |
| Totale | 72 | 61 | 67 | 62 | 58 |
Esercizio 9
In un dato comune si è rilevato un campione casuale di 15 appartamenti in affitto. I dati richiesti, X = superficie in mq e Y = canone di affitto mensile in Euro, sono riportati nella tabella seguente:
| X | Y |
|---|---|
| 65 | 302 |
| 152 | 600 |
| 97 | 420 |
| 74 | 309 |
| 74 | 400 |
| 68 | 400 |
| 89 | 380 |
| 89 | 420 |
| 159 | 530 |
| 103 | 484 |
| 143 | 520 |
| 52 | 350 |
| 87 | 380 |
| 129 | 540 |
| 81 | 415 |
Sulla base della relazione lineare tra canone mensile e superficie dell'alloggio, determinare un intervallo di confidenza al 95% per la media dei canoni di affitto di appartamenti, siti in quello stesso comune, con superficie di 110 mq.
Esercizio 10
Da una variabile doppia X,Y si sono estratte a caso 30 unità e si è calcolato che:
- La media aritmetica di X è 25 e la media quadratica di X è 27
- La media aritmetica di Y è 32 e la media quadratica di Y è 34
- La covarianza tra X ed Y è -8
- a) Determinare l'equazione di regressione lineare X= a+bY
- b) Dare una stima intervallare al 95% per il parametro di regressione
- c) Calcolare la quota della varianza della X spiegata dalla Y
- d) Verificare l'ipotesi che X ed Y non siano correlate
Esercizio 11
Un campione casuale di 300 studenti universitari della stessa facoltà e in possesso di maturità scientifica, è sottoposto ad una prova test di matematica di base. La distribuzione dei 300 studenti per età e rendimento al test figura nella tabella seguente. Può dirsi che il rendimento non dipende dall'età?
| Rendimento | Età | Totale | |||
|---|---|---|---|---|---|
| Scadente | 15 | 18 | 30 | 40 | 103 |
| Sufficiente | 12 | 38 | 33 | 17 | 100 |
| Buono | 36 | 24 | 28 | 9 | 97 |
| Totale | 63 | 80 | 91 | 66 | 300 |
Esercizio 12
Un campione di 10 imprese di un dato settore è stato classificato secondo il numero degli addetti e il numero totale di ore di sciopero effettuate nell'ultimo anno.
- Addetti: 15, 135, 99, 25, 53, 104, 72, 18, 28, 10
- Ore di sciopero: 30, 302, 105, 67, 40, 250, 190, 45, 53, 22
- a) Determinare la più opportuna relazione lineare tra le due variabili e stimarla
- b) Stimare la quota della varianza della variabile dipendente spiegata dalla regressione con la variabile indipendente
- c) Saggiare l'ipotesi che il coefficiente di regressione ottenuto non sia diverso da zero
Esercizio 13
Da una indagine sugli acquirenti di yogurt, dei quali 200 sono uomini e 400 donne, è risultato che lo consumano quotidianamente il 40% dei primi ed il 20% delle seconde. Misurare la dipendenza tra consumo quotidiano di yogurt ed il sesso del consumatore.
Esercizio 14
Da una indagine su un campione casuale di 500 acquirenti di un prodotto alimentare, dei quali 200 hanno meno di 20 anni, 200 fra 20 e 30 anni e 100 più di 30 anni, è risultato che lo consumano quotidianamente il 20% dei primi, il 30% dei secondi ed il 10% dei terzi. Misurare la dipendenza tra consumo del prodotto ed età del consumatore e saggiare la significatività dell'indice utilizzato.
Esercizio 15
La tabella che segue riporta la distribuzione di frequenza di un campione casuale di 85 case di cura private distinte per numero di medici e di posti letto. Verificare se esista dipendenza tra le due variabili e saggiare la significatività dell'indice statistico usato per misurare la dipendenza.
| No. medici | No. Posti letto 1 - 50 | 51- 100 | 101 - 200 | 201-300 | |
|---|---|---|---|---|---|
| 1 - 40 | 36 | ||||
| 41 - 60 | 2 | 8 | 12 | 22 | |
| 61 - 90 | 4 | 5 | 3 | 12 | |
| 91-160 | 2 | 13 | 15 | ||
| Totale | 38 | 12 | 19 | 16 | 85 |
Questa è un'anteprima a titolo informativo.