Anteprima
Vedrai una selezione di 4 pagine su 11
Esercizi d'esame svolti Informatica e Statistica per le Biotecnologie Pag. 1 Esercizi d'esame svolti Informatica e Statistica per le Biotecnologie Pag. 2
Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.
Esercizi d'esame svolti Informatica e Statistica per le Biotecnologie Pag. 6
Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.
Esercizi d'esame svolti Informatica e Statistica per le Biotecnologie Pag. 11
1 su 11
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Struttura del documento: - 30 esercizi d'esame risolti di Informatica e Statistica per le Biotecnologie

Ci sono due sottocategorie all'interno del file:

  1. Esercizi alternati di informatica e statistica che ricoprono tutto il programma di entrambe le materie
  2. Correzione degli esercizi stessi su una pagina separata (risposta corretta nel caso di statistica e codice in R nel caso di informatica)

Per il codice di informatica è necessario aver installato R sul proprio dispositivo (preferibilmente PC: Mac, Linux o Windows).

Gli esercizi partono dai concetti più semplici per facilitare la familiarizzazione con l'applicazione.

Domande InfoStat<1>: Al fine di verificare se le persone fumatrici siano caratterizzate da una maggior probabilità di sviluppare malattie cardiovascolari rispetto alle persone non fumatrici, è stata verificata la presenza di malattie cardiovascolari in un campione di fumatori e non fumatori. Come posso classificare le

1) Quale delle due variabili (malattie cardiovascolari e fumo) rappresenterebbe la variabile risposta?

A) Variabili Categoriche, Variabile risposta = fumo;

B) Variabili Continue, Variabile risposta = fumo;

C) Variabile Categoriche, Variabile risposta = malattie cardiovascolari;

D) Variabili Continue, Variabile risposta = malattie cardiovascolari.

2) Costruire un vettore contenente 10 numeri campionati dalla distribuzione normale con media=0 e deviazione standard=1, e salvarlo in una variabile x utilizzando un'unica istruzione R.

3) Quale grafico sarebbe appropriato al fine di rappresentare la relazione tra la variabile età (espressa in anni) e la variabile distanza percorsa durante l'allenamento (espressa in Km) sulla base di dati raccolti in un campione di soggetti?

A) Grafico a torta;

B) Scatterplot.

4) Costruire una matrice 10x5 contenente numeri campionati dalla distribuzione

uniforme con minimo=1 e massimo=2, salvarla in una variabile x utilizzando un'unica istruzione R.

<5> Il più elevato dei valori non estremi (baffo superiore) del boxplot ottenuto a partire dai valori 1.29, 1.87, 2.7, 2.77, 2.99, 3.07, 4.71, 5.09, 5.97, 6.79, 10.78, 12.62 corrisponde a:

"A") 10.78;

"B") 12.62;

"C") 11.31.

<6> Costruire un array di dimensione 3 x 3 x 3 contenente 27 numericampionati dalla distribuzione normale con media 10 e deviazione standard 0.75 e salvarlo in una variabile x utilizzando un'unica istruzione R.

<7> Calcolare la media ponderata dei seguenti valori e relativi pesi associati: valori = 47.5, 63.7, 43.3, 91.9, 66.6, 43.6, 69.7, 74.8, 71.5, 53.9; pesi = 0.73, 0.79, 0.85, 0.37, 0.89, 0.95, 0.34, 0.94, 0.44, 0.97. A quale dei seguenti valori corrisponde la media ponderata (valore arrotondato alla seconda cifra decimale)?

"A") 59.73;

"B") 59.09;

"C") 51.05;

"D")

69.92.<8> Costruire un fattore contenente 5 ripetizioni del vettorec("basso","medio","alto") specificando che i l ivelli del fattore sono gli elementicontenuti in c("basso","medio","alto") e che essi sono livelli ordinati (basso <medio < alto) e salvarlo in una variabile x utilizzando un'unica istruzione R.

<9> Una variabile e' caratterizzata da media = 29.97 e deviazione standard =3.49 nel campione 1 e da media = 24.06 e deviazione standard = 2.94 nelcampione 2. Quale delle seguenti affermazioni e' corretta?"

"A") La distribuzione della variabile nel campione 1 e' caratterizzata damaggior dispersione e da misura di posizione piu' elevata rispetto alladistribuzione della variabile nel campione 2;

"B") La distribuzione della variabile nel campione 1 e' caratterizzata damaggior dispersione e da misura di posizione inferiore rispetto alladistribuzione della

variabile nel campione 2;"C") La distribuzione della variabile nel campione 1 e' caratterizzata da minor dispersione e da misura di posizione più elevata rispetto alla distribuzione della variabile nel campione 2.

"D") La distribuzione della variabile nel campione 1 e' caratterizzata da minor dispersione e da misura di posizione inferiore rispetto alla distribuzione della variabile nel campione 2.

<10> Costruire una lista contenente: una matrice 7x3 di nome m contenente 21 numeri campionati dalla normale con media=5 e deviazione standard = 1, un vettore v contenente 100 numeri campionati dalla distribuzione uniforme con minimo = 0 e massimo = 2, un vettore r contenente 5 ripetizioni di un vettore composto dai caratteri "G", "A", "T", "T", "A", "C", "A" ed una matrice m2 di 5x20 contenente i primi 100 interi, salvarla in una variabile x utilizzando un'unica istruzione R.

<11> Tra

Tutte le parole riportate in un testo scientifico sono presenti i termini "ecologia", "simbiosi", "biosfera", "ecosistema" con la seguente frequenza relativa:

  • "ecologia" = 0.1015
  • "biosfera" = 0.101
  • "ecosistema" = 0.0955
  • "simbiosi" = 0.202

Qual è la probabilità che un termine scelto casualmente tra tutte le parole presenti nel testo sia uno tra i seguenti: "biosfera", "ecologia", "simbiosi"?

A) 0.4045;

B) 0.2234;

C) 0.0021;

D) 0.1726.

<12> Costruire una lista contenente come primo elemento una matrice M1 derivante dalla trasposizione del risultato ottenuto concatenando, come righe, le ultime due righe di una matrice 5 x 5 contenente i primi 25 interi e le prime due righe di una matrice 5 x 5 contenente i primi 25 elementi di letters, come secondo elemento un vettore V contenente 10 numeri campionati dalla normale con media

15 e deviazione standard 0.5 e, come terzo ed ultimo elemento, un vettore VR contenente, in ordine inverso, tutti gli elementi ad indice pari di letters. Il tutto in un'unica istruzione R. Nella costruzione delle strutture dati che contribuiscono alla costruzione di M1 evitare di popolare le strutture dati intermedie per colonna. Nella costruzione di VR non è consentito l'utilizzo di un vettore numerico contenente i soli indici richiesti.

<13> Calcolare il valore atteso di una variabile casuale discreta che può assumere valori pari a 1 (probabilità = 0.013), 2 (probabilità = 0.941), 3 (probabilità = 0.040), 4 (probabilità = 0.006). Il valore atteso (valore arrotondato alla terza cifra decimale) corrisponde a:

"A") 1.991;

"B") 2.253;

"C") 3.013;

"D") 2.039.

<14> Creare un data frame a partire da mtcars estraendo le righe in cui nella colonna cyl è presente un valore >5 e nella colonna mpg

E' presente un valore>18. Dal data frame così ottenuto estrarre le prime 4 colonne. Salvare in una variabile x utilizzando un'unica istruzione R.<15>

Il valore medio di una determinata variabile clinica nel sangue misurato in una popolazione di individui caratterizzati da una determinata patologia è di 5.27 microgrammi/dL e la deviazione standard è di 8.53 microgrammi/dL.

Quale frazione della popolazione in esame è caratterizzata da livelli della variabile nel sangue compresi tra 17.25 microgrammi/dL e 21.85 microgrammi/dL? La distribuzione della variabile è descritta da una distribuzione normale. Per il calcolo della probabilità arrotondare il valore Z alla seconda cifra decimale (per effettuare l'arrotondamento di Z utilizzare la funzione "round" implementata in R) ed utilizzare la tavola statistica della distribuzione normale standardizzata. Quale delle seguenti risposte è corretta?

"A")

  1. 0.01923;"B"
  2. 0.27165;"C"
  3. 0.05457;"D"
  4. 0.0937.<16>

In un campione di 12 persone esposte ad un determinato fattore ambientale è stato osservato che 7 di queste si sono ammalate. Data H0 "La proporzione di persone esposte che si ammalano è uguale alla proporzione di persone esposte che non si ammalano", HA "La proporzione di persone esposte che si ammalano non è uguale alla proporzione di persone esposte che non si ammalano" e la distribuzione nulla della statistica test la cui distribuzione di probabilità è riportata di seguito:

Pr[0 malati] = 0.000244

Pr[1 malato] = 0.00293

Pr[2 malati] = 0.016113

Pr[3 malati] = 0.053711

Pr[4 malati] = 0.12085

Pr[5 malati] = 0.193359

Pr[6 malati] = 0.225586

Pr[7 malati] = 0.193359

Pr[8 malati] = 0.12085

Pr[9 malati] = 0.053711

Pr[10 malati] = 0.016113

Pr[11 malati] = 0.00293

Pr[12 malati] = 0.000244

Calcolare il p-value ed indicare a quale dei seguenti valori:

corrisponde il p-value corretto e se sia possibile rifiutare l'ipotesi nulla dato un livello di significatività alfa = 0.05.

"A") 0.006348, non rifiuto H0;

"B") 0.006348, rifiuto H0;

"C") 0.774414, non rifiuto H0;

"D") 0.774414, rifiuto H0.

<17> Sapendo che il tempo di vita medio delle coccinelle è di 18 mesi (realtà), se rifiutassimo l'ipotesi nulla H0 "Il tempo di vita medio delle coccinelle è di 18 mesi", in favore dell'ipotesi alternativa HA "Il tempo di vita medio delle coccinelle è diverso da 18 mesi" quale delle seguenti affermazioni risulterebbe corretta?

"A") Incorreremmo in errore di tipo II;

"B") Incorreremmo in errore di tipo I;

"C") Non incorreremmo in errore (decisione corretta).

<18> Scrivere una funzione f che, dati due argomenti a e b, crei un data.frame contenente, i primi 30 elementi della colonna cyl di a, i primi 30 elementi

dellacolonna hp di a, gli elementi presenti nella colonna Petal.Length di b aventi valore maggiore o uguale a 4.65. Il data frame restituito deve avere dimensione 30 x 4. Utilizzare come valore di default per il parametro formale a il dataset mtcars e per il parametro formale b il dataset iris. Il tutto deve essere fatto utilizzando un'unica istruzione R. <19> L'altezza delle piante di una determinata varietà è caratterizzata da un certo grado di variabilità. Si suppone tuttavia che l'altezza media delle piante di tale varietà sia di 38.12 cm. Al fine di verificare tale ipotesi sono stati raccolti dati relativi all'altezza di un campione di 9 piante: l'altezza media delle piante appartenenti al campione è risultata pari a 39.53 cm con deviazione standard di 1.22 cm. Applicando il test t per un campione e facendo riferimento alla tavola statistica della distribuzione t, l'
Dettagli
Publisher
A.A. 2022-2023
11 pagine
SSD Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher anna.kurgina di informazioni apprese con la frequenza delle lezioni di Informatica e statistica per le biotecnologie e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano o del prof Re' Matteo.