SET DOMANDE APERTE
STATISTICA
9 CFU
COCCARDA RAOUL
LEZIONE 1 DOMANDA 10. Per importare il file di testo “prova.txt” descrivere quali linee di codice di R
si utilizzano:
a) quando non compare il nome della colonna nella prima riga; b) quando contiene due e più colonne
separate da spazi vuoti con nome delle colonne nella prima riga; c) quando ci sono i nomi di riga nella
prima colonna.
prova < - scan ("c:/mydat/prova.txt")
a) prova < - read.table ("c:/mydat/prova.txt", header=TRUE)
b) prova < - read.table ("c:/mydat/prova.txt", header=TRUE, row.names=1)
c)
LEZIONE 1 DOMANDA 11. Redigere le seguenti linee di codice di R: a) per cambiare una directory di
lavoro, per settare una nuova directory e per importare una data frame presente in R; b) per
implementare la creazione del date frame “df” utilizzando il comando matrix; c) per implementare la
creazione del data frame “df” utilizzando il comando tab.
Essa può essere visualizzata o modificata cliccando sulla RConsole e aprire da File l'opzione
a)
"Cambia directory" oppure tramite il comando di R: getwd (). Per settare una nuova directory si può
usare il comando: setwd(). Se il file che si vuole leggere si chiama prova.txt (contenente vettori
colonna di dati senza il nome della colonna nella prima riga) che si trova nella directory mydat del
disco C:/ il codice da utilizzare e: prova <- scan(≪C:/mydat/prova.txt");
m1<- matrix(1:36, nrow=6) df<-data.frame(m1); df;
b) tab <- matrix(c (1:18),6, 3);rownames(tab) <- c(a,b,c,d,e,f) colnames(tab) <- c("Ottimo", "Buono",
c)
"Discreto") tab.
LEZIONE 1 DOMANDA 12. Dato un file Excel quali linee di codice di R si utilizzano per:
a) importarlo senza il nome della colonna nella prima riga; b) importarlo quando contiene due e più
colonne separate da spazi vuoti con nome delle colonne nella prima riga; c) importarlo con la versione
Excel in inglese se nella prima colonna ci sono i nomi di riga con l’estensione.
prova < - scan(«C:/mydat/prova.csv2")
a) prova < - read.table(“C:/mydat/prova.csv2", header=TRUE, row.names=1)
b) \\prova < - read.csv(«C:/mydat/prova.csv", header=TRUE, row.names=1)
c)
LEZIONE 2 DOMANDA 10. Definita una popolazione di interesse con dati a scelta stabilire: a) quale tipo
di dati devono essere utilizzato; b) quali sono le fasi della rilevazione; c) la nomenclatura statistica
completa.
La popolazione presa in considerazione è l’insieme dei contagiati in un’epidemia in Italia, i dati raccolti
sono di tipo qualitativo sconnesso: maschio o femmina; quantitativo discreto: età dei contagiati;
qualitativo sconnesso: sintomi ed eventuali patologie, conseguenze riportate. Le fasi di rilevazione sono
la modalità di raccolta dei dati, la vera e propria raccolta dei dati. Si possono anche utilizzare i dati
rilevati dal Ministero della Salute.
LEZIONE 2 DOMANDA 11. Descrivere le seguenti caratteristiche di un carattere scelto a piacere: a) la
misura; b) la scala di misurazione; c) la trasferibilità.
Si vuole svolgere una indagine statistica con dati a scelta e si vuole: a)
LEZIONE 2 DOMANDA 12.
stabilire quale strumento di raccolta di dati deve essere utilizzato; b) quali unità statistiche utilizzare;
c) quali caratteri e quali modalità scegliere.
Si può dire che il piano o progetto statistico consiste nella raccolta di tutti i dati. Quindi si specifica il
cosa rilevare; il dove rilevare. Si definisce il come rilevare ovvero, ad esempio, attraverso un’indagine
diretta. Infine è necessario stabilire il quando rilevare ovvero la tempificazione di raccolta dei dati.
LEZIONE 3 DOMANDA 12. Dati i seguenti valori dei prezzi del I semestre 2017 (12,4-12,5-11,9-12,9-
13,1-11,1) calcolare:
a) numeri indici a base fissa e mobile; b) passaggio da base fissa Marzo a base mobile Giugno; c)
passaggio da base mobile Febbraio a base fissa Maggio.
Tempo Prezzi NIBF NIBM Da NIBM a NIBF Da NIBF a NIBM
GEN 17 12,4 12,4/12,4 = 1 - 1 -
FEB 17 12,5 12,5/12,4 = 1,008 12,5/12,4=1,008 1*1,008 = 1,008 1,008/1 = 1,008
MAR 17 11,9 11,9/12,4=0,9597 11,9/12,5=0,952 1,008*0,952=0,9596 0,9596/1,008=0,9519
APR 17 12,9 12,9/12,4 = 1.040 12,9/11,9=1,084 0,9596*1,084=1,040 1,040/0,9596=1,0837
MAG 17 13,1 13,1/12,4 = 1,055 13,1/12,9=1,016 1,040*1,016 = 1,057 1,057/1,040=1,0163
GIU 17 11,1 11,1/12,4 = 0,894 11,1/13,1=0,847 1,057 * 0,84 = 0,895 0,855/1,057=0,8088
LEZIONE 3 DOMANDA 13. Dati i valori dei prezzi per gli anni 2015 (2.48,2.97,2.23,2.67,2.90,3.06,2.89,
3.88,3.22,3.90,3.12,3.01), 2016 (3.52,3.99,3.08,3.88,3.96,4.01,4.07,4.25,4.89,4.08,4.78,4.71) e 2017
(5.01,5.57,5.34,5.09,5.25,5.02,5.01,5.02,5.78,5.21,5.33,5.36): a) quali linee di codice di R si utilizzano
per calcolare i numeri indice a base fissa 2015; b) quali linee di codice di R si utilizzano per calcolare i
numeri indice a base mobile 2017; c) quali linee di codice di R si utilizzano per calcolare i numeri indici
a base fissa 2016.
# CODICE DI R #
p_2015<-c(2.48,2.97,2.23,2.67,2.90,3.06,2.89,3.88,3.22,3.90,3.12,3.01)
p_2016<-c(3.52,3.99,3.08,3.88,3.96,4.01,4.07,4.25,4.89,4.08,4.78,4.71)
Fissa <-function(P,Base) P/Base
Fissa(p_2015,2.48)
Fissa(p_2016,3.52)
p_2017<-c(5.01,5.57,5.34,5.09,5.25,5.02,5.01,5.02,5.78,5.21,5.33,5.36)
Mobile(p_2017[-1],p_2017[-12])
LEZIONE 3 DOMANDA 14. Dati i seguenti valori dei prezzi del I semestre 2017 (12,4-12,5-11,9;12,9-13,1-
11,1) quali script di R si utilizzano per calcolare:
a) numeri indici a base fissa da Gennaio a Marzo; b) numeri indici a base fissa da Marzo a Giugno; c)
numeri indici a base mobile.
# CODICE DI R BASE FISSA 2017 #
P_2017 < - c(12.4-12.5-11.9,12.9-13.1-11.1)
Fissa < - function (P, Base) P/Base
Fissa (p_2017, 12.4) # CODICE DI R BASE MOBILE 2017 #
p_2017 < - c (12.4-12.5-11.9,12.9-13.1-11.1)
Mobile < - function (P_t2, P_t1) P_t2/P_t1
Mobile(p_2017[-1],p_2017[-6])
#CODICE DI R MEDIA ARITMETICA E CODICE DI R MEDIA GEOMETRICA#
X <- c(12.4-12.5-11.9,12.9-13.1-11.1)
Mean(x)
Media <-Sum(x)/6
Library (labstatR)
Meang (p_2017)
LEZIONE 4 DOMANDA 10. Si sono osservati i dati di Età di 20 unità statistiche (individui) quali linee di
codice si utilizzano per a) individuare le classi con il metodo logaritmico e calcolare le frequenze
assolute b) calcolare le frequenze relative e cumulate assolute; c) rappresentare il relativo
istogramma.
libray(labstarR)
x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39,41,37);x
n<-length(x);n
k<-ceiling(1+3.322*log10(n));k
a<-(max(x-min(x))/k;a
Classi<-seq(min(x),max(x),length.out=k+1); Classi ####a.####
FreqAss<-hist(x,Classi,plot=FALSE)$counts;FreqAss ####b.####
FreqRel<-FreqAss/length(x);FreqRel ####b.####
cumsum(FreqAss) ####b.####
cumsum(freqRel) ####b.####
par(bg=”conrnsilk”) ####c.####
h<-hist(x,Classi,plot=FALSE)
h$counts<-FreqRel
plot(h,ylab=”Frequenze Relative”,axes=FALSE)
axis(1,at=Classi,cex.axis=1.1)
axis(2,at=c(0,round(h$counts,digits=2)),cex.axis=1.1)
LEZIONE 4 DOMANDA 11. Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,
34,44,46,58) con quali script di R si individuano:
a) le classi con il metodo soggettivo; b) le classi con il metodo a radice; c) le classi con il metodo
logaritmico.
# CLASSI CALCOLATE CON IL METODO SOGGETTIVO #
x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58);x
k <- 5 ; k
n <- length(x);n
Classi <- seq(min(x), max(x), length.out = k + 1); Classi
plot(h,ylab="Frequenze relative",xlab="Classi di Età",main="Istogramma Classi di Età")
axis(1,at = Classi,cex.axis = 1.1)
axis(2,at = c(0,round(h$counts,digits = 2)),cex.axis =1.1)
#CLASSI CALCOLATE CON IL METODO A RADICE #
x<-
c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58); x
n<- length(x); n
Classi <- ceiling(sqrt(n)); Classi
plot(h,ylab="Frequenze relative",xlab="Classi di Età",main="Istogramma Classi di Età")
axis(1,at = Classi,cex.axis = 1.1)
axis(2,at = c(0,round(h$counts,digits = 2)),cex.axis =1.1)
#CLASSI CALCOLATE CON IL METODO LOGARITMICO #
x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58); x # Dati di imput del carattere Età #
n <- length(x); n
k<- ceiling(1+3.322*log10(n)); k
a <- (max(x) - min(x)) / k ; a
Classi <- seq(min(x),max(x),length.out = k + 1); Classi
plot(h,ylab="Frequenze relative",xlab="Classi di Età",main="Istogramma Classi di Età")
axis(1,at = Classi,cex.axis = 1.1)
axis(2,at = c(0,round(h$counts,digits = 2)),cex.axis =1.1)
LEZIONE 4 DOMANDA 12. Dati le seguenti classi equi ampie (12-16; 16-20; 20-24; 24-28) e la relativa
frequenza assoluta (0,1,2,3) calcolare: a) i valori centrali di classe e la frequenza relativa; b) la
frequenza cumulata assoluta; c) la frequenza cumulata relativa.
Classi Fre ass Val centr Fre rel Fre cum ass Fra cum rel
12-16 0 14 0,00 0 0
16-20 1 18 0,17 1 0,17
20-24 2 22 0,33 3 0,5
24-28 3 26 0,5 6 1
Tot. 6 1,00
Dati i seguenti valori del carattere X (1450, 1560, 1680, 1940, 2350, 2670,
LEZIONE 4 DOMANDA 13.
3120):
a) costruire 3 classi aperte a dx e chiuse a sx e viceversa; b) costruire classi con il metodo a radice; c)
costruire classi con il metodo logaritmico.
LEZIONE 5 DOMANDA 9. Si sono osservati i dati di Età di 20 unità statistiche (individui) quali linee di
codice si utilizzano per a) individuare le classi con il metodo logaritmico e calcolare le frequenze
assolute b) calcolare le frequenze relative e cumulate assolute; c) rappresentare il relativo
istogramma.
libray(labstarR)
x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39,41,37);x
n<-length(x);n
k<-ceiling(1+3.322*log10(n));k
a<-(max(x-min(x))/k;a
Classi<-seq(min(x),max(x),length.out=k+1); Classi ####a.####
FreqAss<-hist(x,Classi,plot=FALSE)$counts;FreqAss ####b.####
FreqRel<-FreqAss/length(x);FreqRel ####b.####
cumsum(FreqAss) ####b.####
cumsum(freqRel) ####b.####
par(bg=”conrnsilk”) ####c.####
h<-hist(x,Classi,plot=FALSE)
h$counts<-FreqRel
plot(h,ylab=”Frequenze Relative”,axes=FALSE)
axis(1,at=Classi,cex.axis=1.1)
axis(2,at=c(0,round(h$counts,digits=2)),cex.axis=1.1)
LEZIONE 5 DOMANDA 10. Descrivere quali grafici sono più appropriati per rappresentare:
a) una distribuzione dei costi indiretti di una produzione; b) una distribuzione generica di valori
suddivisi in classi; c) una relazione fra due variabili x ed y (di ogni risposta rappresentare un esempio
senza preoccuparsi della correttezza grafica)
Se si prende in considerazione la distribuzione dei costi indiretti di una produzione generica, questi
possono essere rappresentati attraverso Questo grafico, infatti, è molto utile quando si
un grafico a torta.
vuole rappresentare la composizione di un “tutto” in parti. Il mette in relazione due
grafico cartesiano
variabili sui due assi (X,Y), associando normalmente la variabile indipendente o esplicativa all’asse delle
ascisse e la variabile dipendente o risposta all’asse delle ordinate.
Con viene rappresentato il fenomeno statistico in modo simile a quello a dispersione
tanto
il grafico a bolle
che alcuni lo considerano come vera e propria variante a tale grafico e come una via di mezzo tra il
grafico e il cartogramma. l grafico a bolle deve essere letto in modo che le aree delle stesse debbano
considerarsi proporzionali alla densità del carattere osservato. L’utilizzo del grafico a bolle è
particolarmente indicato per presentazioni di coppie di dati la cui somma ha un qualche significato da un
punto di vista aziendalistico. Il è simile a quello a torta. La differenza consiste nel fatto
grafico ad anello
che vengono rappresentati in più anelli concentrici serie diverse di dati ed ogni anello è suddiviso in parti
corrispondenti normalmente alle frequenze percentuali del carattere osservato.
Grafico a bolle Istogramma
Cartesiano Grafico a barre orizzontali e verticali
LEZIONE 6 DOMANDA 8. Descrivere con quali script di R si calcola:
a) la media aritmetica semplice; b) la media aritmetica in frequenza; c) la media geometrica per classi.
#MEDIA ARTITMETICA SEMPLICE#
n<-pength(x)
sum(x)/n #OPPURE
Mean(x)
#MEDIA ARTITMETICA FREQUENZA ASSOLUTA#
Sum(x* fre. ass.)/sum(fre. ass.)
#MEDIA ARTITMETICA FREQUENZA RELATIVA#
Freq_rel<- fre. ass./sum(fre. ass.)
Sum(x*freq_rel)
LEZIONE 6 DOMANDA 9. Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,
34,44,46,58,20,39,41,37) con quali formule si calcolano: a) la media aritmetica semplice per valori
singoli; b) la media aritmetica semplice in frequenza assoluta; c) la media geometrica per valori
singoli.
LEZIONE 6 DOMANDA 10. Dati i seguenti dati del carattere x (12,2,3,45,64,32,1,87) e le relative
frequenze assolute (0,1,2,3,2,1,3,4) descrivere con quali script di R si calcolano: a) la media aritmetica
in frequenza relativa; b) la media geometrica; c) la media armonica.
library(labstatR)
v_c< -c(12,2,3,45,64,32,1,87);v_c
m_ar_r.rel< -sum(v_c*FreqRel);
m_ar_f.relmeang(x) m_geom_f.as< -
prod(v_c^FreqAss)^(1/n); m_geom_f.a
m_arm_f.as< -sumFì(FreqAss)/sum(FreqAss/v_c); m_arm_f.as meana(x)
LEZIONE 7 DOMANDA 6. Con quali formule si calcolano:
a) la media per valori singoli; b) la mediana per classi con il procedimento 1; c) la mediana per classi
con il procedimento 2.
La mediana occupa la posizione che si ottiene dalla formula: (n+1)/2 = (7+1)/2 = 4^
Dopo aver ordinato l’insieme dei dati in sequenza crescente o decrescente e assegnato la relativa
posizione si
applicano due principi:
Se il numero di modalità è dispari la mediana occupa la posizione (n+1)/2 ed il suo valore e
1.
corrispondente
a quello della posizioni trovata;
Se il numero di modalità è pari la mediana occupa sempre la posizione (n+1)/2 ma il suo
2.
valore e
corrispondente a quello delle due posizioni limitrofe trovate.
LEZIONE 7 DOMANDA 7. Dati i valori di x (12,16,18,22,26) con quali linee di codice di R si
implementano: a) per calcolare la mediana per valori singoli; b) per costruire classi con K=2; c) per
calcolare la mediana per valori suddivisi in classi.
x<-c(12,16,18,22,26);median(x)
a)
LEZIONE 8 DOMANDA 8. Dati i seguenti valori di xi (11,12,13,14,15) e ni (0,1,2,3,4) con quali script di R
si calcola: a) la densità di classe; b) la moda per i valori di x; c) la moda per la distribuzione di
frequenza.
LEZIONE 8 DOMANDA 9. Dati i seguenti valori di x (33,35,38,42,43): a) costruire classi per K=2; b)
calcolare la densità di classe; c) calcolare il valore della moda per classi.
LEZIONE 8 DOMANDA 10. A proposito della moda descrivere: a) che cos’è la densità di classe e come si
calcola; b) la formula della moda per valori suddivisi in classi; c) che cos’è una distribuzione amodale
ed una distribuzione plurimodale.
che cos'è la densità di classe e come si calcola;
a)
Quando le classi sono equi-ampie si può utilizzare, ai fini del calcolo delle misure centrali e di variabilità,
il valore centrale di classe, tenendo conto che tale procedura presenta un certo grado di
approssimazione dei risultati.
Qualora, invece, le classi non sono equi-ampie è necessario disegnare per ogni classe un rettangolo
che ha per altezza la densità di classe, data dal rapporto fra la frequenza assoluta ni e l’ampiezza di
classe (ai-1, ai) e per base l’ampiezza di classe stessa.
qual'è la formula della moda per valori suddivisi in classi;
b)
Mo=Lmo+ dove:
∗
Lmo è l’estremo inferiore della classe modale.
∆finf è la differenza fra la frequenza assoluta della classe modale e la frequenza assoluta della classe
immediatamente inferiore a quella modale.
∆fsup è la differenza fra la frequenza assoluta della classe modale e la frequenza assoluta della
classe immediatamente superiore a quella modale.
A classe è l’ampiezza della classe modale.
che cos'è un distribuzione amodale; Presenta frequenze tutte uguali.
c) che cos'è una distribuzione plurimodale
d)
La Moda può essere definita come: una misura di tendenza centrale che si applica ai caratteri qualitativi
e quantitativi ordinabili, in modo crescente o decrescente. Rappresenta la modalità di un carattere che
si presenta più volte o che evidenzia il valore di frequenza più elevato in un insieme di osservazioni.
Una distribuzione di valori di un carattere può presentare più mode (in questo caso si definisce
“plurimodale”), quando si registra più volte la stessa frequenza.
LEZIONE 9 DOMANDA 8. Data una distribuzione di valori singoli descrivere con quali formule si
calcolano: a) il I Quartile; b) il II Quartile (o Mediana); c) il III Quartile.
a) I Quartile
IQ1 è l’estremo inferiore della classe dove cade il I quartile.
Fq1-1 è la frequenza relativa cumulata fino alla classe precedente a quella cui cade il I quartile
Fq1 è la frequenza relativa cumulata fino alla classe che contiene il I quartile.
∆_Q1 è l’ampiezza della classe che contiene il I quartile.
b) II Quartile
Lme è la media tra l’estremo inferiore della classe mediana e l’estremo superiore della classe che
precede quella mediana.
N è la frequenza totale.
freq.cum.ass.Me-1è la frequenza cumulata assoluta della classe inferiore a quella
mediana.
Freq. ass. Me è la frequenza assoluta della classe mediana.
C è l’ampiezza della classe mediana.
c) III Quartile
IQ3 è l’estremo inferiore della classe dove cade il Q3
Fq3-1 è la frequenza relativa cumulata fino alla classe precedente a quella in cui
cade il Q3
Fq3 è la frequenza relativa cumulata fino alla classe che contiene il Q3
∆_Q3 è
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Paniere Statistica
-
Paniere Matematica e statistica
-
Paniere Statistica - risposte multiple e aperte
-
Paniere di statistica - risposte aperte