Estratto del documento

SET DOMANDE APERTE

STATISTICA

9 CFU

COCCARDA RAOUL

LEZIONE 1 DOMANDA 10. Per importare il file di testo “prova.txt” descrivere quali linee di codice di R

si utilizzano:

a) quando non compare il nome della colonna nella prima riga; b) quando contiene due e più colonne

separate da spazi vuoti con nome delle colonne nella prima riga; c) quando ci sono i nomi di riga nella

prima colonna.

prova < - scan ("c:/mydat/prova.txt")

a) prova < - read.table ("c:/mydat/prova.txt", header=TRUE)

b) prova < - read.table ("c:/mydat/prova.txt", header=TRUE, row.names=1)

c)

LEZIONE 1 DOMANDA 11. Redigere le seguenti linee di codice di R: a) per cambiare una directory di

lavoro, per settare una nuova directory e per importare una data frame presente in R; b) per

implementare la creazione del date frame “df” utilizzando il comando matrix; c) per implementare la

creazione del data frame “df” utilizzando il comando tab.

Essa può essere visualizzata o modificata cliccando sulla RConsole e aprire da File l'opzione

a)

"Cambia directory" oppure tramite il comando di R: getwd (). Per settare una nuova directory si può

usare il comando: setwd(). Se il file che si vuole leggere si chiama prova.txt (contenente vettori

colonna di dati senza il nome della colonna nella prima riga) che si trova nella directory mydat del

disco C:/ il codice da utilizzare e: prova <- scan(≪C:/mydat/prova.txt");

m1<- matrix(1:36, nrow=6) df<-data.frame(m1); df;

b) tab <- matrix(c (1:18),6, 3);rownames(tab) <- c(a,b,c,d,e,f) colnames(tab) <- c("Ottimo", "Buono",

c)

"Discreto") tab.

LEZIONE 1 DOMANDA 12. Dato un file Excel quali linee di codice di R si utilizzano per:

a) importarlo senza il nome della colonna nella prima riga; b) importarlo quando contiene due e più

colonne separate da spazi vuoti con nome delle colonne nella prima riga; c) importarlo con la versione

Excel in inglese se nella prima colonna ci sono i nomi di riga con l’estensione.

prova < - scan(«C:/mydat/prova.csv2")

a) prova < - read.table(“C:/mydat/prova.csv2", header=TRUE, row.names=1)

b) \\prova < - read.csv(«C:/mydat/prova.csv", header=TRUE, row.names=1)

c)

LEZIONE 2 DOMANDA 10. Definita una popolazione di interesse con dati a scelta stabilire: a) quale tipo

di dati devono essere utilizzato; b) quali sono le fasi della rilevazione; c) la nomenclatura statistica

completa.

La popolazione presa in considerazione è l’insieme dei contagiati in un’epidemia in Italia, i dati raccolti

sono di tipo qualitativo sconnesso: maschio o femmina; quantitativo discreto: età dei contagiati;

qualitativo sconnesso: sintomi ed eventuali patologie, conseguenze riportate. Le fasi di rilevazione sono

la modalità di raccolta dei dati, la vera e propria raccolta dei dati. Si possono anche utilizzare i dati

rilevati dal Ministero della Salute.

LEZIONE 2 DOMANDA 11. Descrivere le seguenti caratteristiche di un carattere scelto a piacere: a) la

misura; b) la scala di misurazione; c) la trasferibilità.

Si vuole svolgere una indagine statistica con dati a scelta e si vuole: a)

LEZIONE 2 DOMANDA 12.

stabilire quale strumento di raccolta di dati deve essere utilizzato; b) quali unità statistiche utilizzare;

c) quali caratteri e quali modalità scegliere.

Si può dire che il piano o progetto statistico consiste nella raccolta di tutti i dati. Quindi si specifica il

cosa rilevare; il dove rilevare. Si definisce il come rilevare ovvero, ad esempio, attraverso un’indagine

diretta. Infine è necessario stabilire il quando rilevare ovvero la tempificazione di raccolta dei dati.

LEZIONE 3 DOMANDA 12. Dati i seguenti valori dei prezzi del I semestre 2017 (12,4-12,5-11,9-12,9-

13,1-11,1) calcolare:

a) numeri indici a base fissa e mobile; b) passaggio da base fissa Marzo a base mobile Giugno; c)

passaggio da base mobile Febbraio a base fissa Maggio.

Tempo Prezzi NIBF NIBM Da NIBM a NIBF Da NIBF a NIBM

GEN 17 12,4 12,4/12,4 = 1 - 1 -

FEB 17 12,5 12,5/12,4 = 1,008 12,5/12,4=1,008 1*1,008 = 1,008 1,008/1 = 1,008

MAR 17 11,9 11,9/12,4=0,9597 11,9/12,5=0,952 1,008*0,952=0,9596 0,9596/1,008=0,9519

APR 17 12,9 12,9/12,4 = 1.040 12,9/11,9=1,084 0,9596*1,084=1,040 1,040/0,9596=1,0837

MAG 17 13,1 13,1/12,4 = 1,055 13,1/12,9=1,016 1,040*1,016 = 1,057 1,057/1,040=1,0163

GIU 17 11,1 11,1/12,4 = 0,894 11,1/13,1=0,847 1,057 * 0,84 = 0,895 0,855/1,057=0,8088

LEZIONE 3 DOMANDA 13. Dati i valori dei prezzi per gli anni 2015 (2.48,2.97,2.23,2.67,2.90,3.06,2.89,

3.88,3.22,3.90,3.12,3.01), 2016 (3.52,3.99,3.08,3.88,3.96,4.01,4.07,4.25,4.89,4.08,4.78,4.71) e 2017

(5.01,5.57,5.34,5.09,5.25,5.02,5.01,5.02,5.78,5.21,5.33,5.36): a) quali linee di codice di R si utilizzano

per calcolare i numeri indice a base fissa 2015; b) quali linee di codice di R si utilizzano per calcolare i

numeri indice a base mobile 2017; c) quali linee di codice di R si utilizzano per calcolare i numeri indici

a base fissa 2016.

# CODICE DI R #

p_2015<-c(2.48,2.97,2.23,2.67,2.90,3.06,2.89,3.88,3.22,3.90,3.12,3.01)

p_2016<-c(3.52,3.99,3.08,3.88,3.96,4.01,4.07,4.25,4.89,4.08,4.78,4.71)

Fissa <-function(P,Base) P/Base

Fissa(p_2015,2.48)

Fissa(p_2016,3.52)

p_2017<-c(5.01,5.57,5.34,5.09,5.25,5.02,5.01,5.02,5.78,5.21,5.33,5.36)

Mobile(p_2017[-1],p_2017[-12])

LEZIONE 3 DOMANDA 14. Dati i seguenti valori dei prezzi del I semestre 2017 (12,4-12,5-11,9;12,9-13,1-

11,1) quali script di R si utilizzano per calcolare:

a) numeri indici a base fissa da Gennaio a Marzo; b) numeri indici a base fissa da Marzo a Giugno; c)

numeri indici a base mobile.

# CODICE DI R BASE FISSA 2017 #

P_2017 < - c(12.4-12.5-11.9,12.9-13.1-11.1)

Fissa < - function (P, Base) P/Base

Fissa (p_2017, 12.4) # CODICE DI R BASE MOBILE 2017 #

p_2017 < - c (12.4-12.5-11.9,12.9-13.1-11.1)

Mobile < - function (P_t2, P_t1) P_t2/P_t1

Mobile(p_2017[-1],p_2017[-6])

#CODICE DI R MEDIA ARITMETICA E CODICE DI R MEDIA GEOMETRICA#

X <- c(12.4-12.5-11.9,12.9-13.1-11.1)

Mean(x)

Media <-Sum(x)/6

Library (labstatR)

Meang (p_2017)

LEZIONE 4 DOMANDA 10. Si sono osservati i dati di Età di 20 unità statistiche (individui) quali linee di

codice si utilizzano per a) individuare le classi con il metodo logaritmico e calcolare le frequenze

assolute b) calcolare le frequenze relative e cumulate assolute; c) rappresentare il relativo

istogramma.

libray(labstarR)

x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39,41,37);x

n<-length(x);n

k<-ceiling(1+3.322*log10(n));k

a<-(max(x-min(x))/k;a

Classi<-seq(min(x),max(x),length.out=k+1); Classi ####a.####

FreqAss<-hist(x,Classi,plot=FALSE)$counts;FreqAss ####b.####

FreqRel<-FreqAss/length(x);FreqRel ####b.####

cumsum(FreqAss) ####b.####

cumsum(freqRel) ####b.####

par(bg=”conrnsilk”) ####c.####

h<-hist(x,Classi,plot=FALSE)

h$counts<-FreqRel

plot(h,ylab=”Frequenze Relative”,axes=FALSE)

axis(1,at=Classi,cex.axis=1.1)

axis(2,at=c(0,round(h$counts,digits=2)),cex.axis=1.1)

LEZIONE 4 DOMANDA 11. Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,

34,44,46,58) con quali script di R si individuano:

a) le classi con il metodo soggettivo; b) le classi con il metodo a radice; c) le classi con il metodo

logaritmico.

# CLASSI CALCOLATE CON IL METODO SOGGETTIVO #

x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58);x

k <- 5 ; k

n <- length(x);n

Classi <- seq(min(x), max(x), length.out = k + 1); Classi

plot(h,ylab="Frequenze relative",xlab="Classi di Età",main="Istogramma Classi di Età")

axis(1,at = Classi,cex.axis = 1.1)

axis(2,at = c(0,round(h$counts,digits = 2)),cex.axis =1.1)

#CLASSI CALCOLATE CON IL METODO A RADICE #

x<-

c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58); x

n<- length(x); n

Classi <- ceiling(sqrt(n)); Classi

plot(h,ylab="Frequenze relative",xlab="Classi di Età",main="Istogramma Classi di Età")

axis(1,at = Classi,cex.axis = 1.1)

axis(2,at = c(0,round(h$counts,digits = 2)),cex.axis =1.1)

#CLASSI CALCOLATE CON IL METODO LOGARITMICO #

x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58); x # Dati di imput del carattere Età #

n <- length(x); n

k<- ceiling(1+3.322*log10(n)); k

a <- (max(x) - min(x)) / k ; a

Classi <- seq(min(x),max(x),length.out = k + 1); Classi

plot(h,ylab="Frequenze relative",xlab="Classi di Età",main="Istogramma Classi di Età")

axis(1,at = Classi,cex.axis = 1.1)

axis(2,at = c(0,round(h$counts,digits = 2)),cex.axis =1.1)

LEZIONE 4 DOMANDA 12. Dati le seguenti classi equi ampie (12-16; 16-20; 20-24; 24-28) e la relativa

frequenza assoluta (0,1,2,3) calcolare: a) i valori centrali di classe e la frequenza relativa; b) la

frequenza cumulata assoluta; c) la frequenza cumulata relativa.

Classi Fre ass Val centr Fre rel Fre cum ass Fra cum rel

12-16 0 14 0,00 0 0

16-20 1 18 0,17 1 0,17

20-24 2 22 0,33 3 0,5

24-28 3 26 0,5 6 1

Tot. 6 1,00

Dati i seguenti valori del carattere X (1450, 1560, 1680, 1940, 2350, 2670,

LEZIONE 4 DOMANDA 13.

3120):

a) costruire 3 classi aperte a dx e chiuse a sx e viceversa; b) costruire classi con il metodo a radice; c)

costruire classi con il metodo logaritmico.

LEZIONE 5 DOMANDA 9. Si sono osservati i dati di Età di 20 unità statistiche (individui) quali linee di

codice si utilizzano per a) individuare le classi con il metodo logaritmico e calcolare le frequenze

assolute b) calcolare le frequenze relative e cumulate assolute; c) rappresentare il relativo

istogramma.

libray(labstarR)

x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39,41,37);x

n<-length(x);n

k<-ceiling(1+3.322*log10(n));k

a<-(max(x-min(x))/k;a

Classi<-seq(min(x),max(x),length.out=k+1); Classi ####a.####

FreqAss<-hist(x,Classi,plot=FALSE)$counts;FreqAss ####b.####

FreqRel<-FreqAss/length(x);FreqRel ####b.####

cumsum(FreqAss) ####b.####

cumsum(freqRel) ####b.####

par(bg=”conrnsilk”) ####c.####

h<-hist(x,Classi,plot=FALSE)

h$counts<-FreqRel

plot(h,ylab=”Frequenze Relative”,axes=FALSE)

axis(1,at=Classi,cex.axis=1.1)

axis(2,at=c(0,round(h$counts,digits=2)),cex.axis=1.1)

LEZIONE 5 DOMANDA 10. Descrivere quali grafici sono più appropriati per rappresentare:

a) una distribuzione dei costi indiretti di una produzione; b) una distribuzione generica di valori

suddivisi in classi; c) una relazione fra due variabili x ed y (di ogni risposta rappresentare un esempio

senza preoccuparsi della correttezza grafica)

Se si prende in considerazione la distribuzione dei costi indiretti di una produzione generica, questi

possono essere rappresentati attraverso Questo grafico, infatti, è molto utile quando si

un grafico a torta.

vuole rappresentare la composizione di un “tutto” in parti. Il mette in relazione due

grafico cartesiano

variabili sui due assi (X,Y), associando normalmente la variabile indipendente o esplicativa all’asse delle

ascisse e la variabile dipendente o risposta all’asse delle ordinate.

Con viene rappresentato il fenomeno statistico in modo simile a quello a dispersione

tanto

il grafico a bolle

che alcuni lo considerano come vera e propria variante a tale grafico e come una via di mezzo tra il

grafico e il cartogramma. l grafico a bolle deve essere letto in modo che le aree delle stesse debbano

considerarsi proporzionali alla densità del carattere osservato. L’utilizzo del grafico a bolle è

particolarmente indicato per presentazioni di coppie di dati la cui somma ha un qualche significato da un

punto di vista aziendalistico. Il è simile a quello a torta. La differenza consiste nel fatto

grafico ad anello

che vengono rappresentati in più anelli concentrici serie diverse di dati ed ogni anello è suddiviso in parti

corrispondenti normalmente alle frequenze percentuali del carattere osservato.

Grafico a bolle Istogramma

Cartesiano Grafico a barre orizzontali e verticali

LEZIONE 6 DOMANDA 8. Descrivere con quali script di R si calcola:

a) la media aritmetica semplice; b) la media aritmetica in frequenza; c) la media geometrica per classi.

#MEDIA ARTITMETICA SEMPLICE#

n<-pength(x)

sum(x)/n #OPPURE

Mean(x)

#MEDIA ARTITMETICA FREQUENZA ASSOLUTA#

Sum(x* fre. ass.)/sum(fre. ass.)

#MEDIA ARTITMETICA FREQUENZA RELATIVA#

Freq_rel<- fre. ass./sum(fre. ass.)

Sum(x*freq_rel)

LEZIONE 6 DOMANDA 9. Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,

34,44,46,58,20,39,41,37) con quali formule si calcolano: a) la media aritmetica semplice per valori

singoli; b) la media aritmetica semplice in frequenza assoluta; c) la media geometrica per valori

singoli.

LEZIONE 6 DOMANDA 10. Dati i seguenti dati del carattere x (12,2,3,45,64,32,1,87) e le relative

frequenze assolute (0,1,2,3,2,1,3,4) descrivere con quali script di R si calcolano: a) la media aritmetica

in frequenza relativa; b) la media geometrica; c) la media armonica.

library(labstatR)

v_c< -c(12,2,3,45,64,32,1,87);v_c

m_ar_r.rel< -sum(v_c*FreqRel);

m_ar_f.relmeang(x) m_geom_f.as< -

prod(v_c^FreqAss)^(1/n); m_geom_f.a

m_arm_f.as< -sumFì(FreqAss)/sum(FreqAss/v_c); m_arm_f.as meana(x)

LEZIONE 7 DOMANDA 6. Con quali formule si calcolano:

a) la media per valori singoli; b) la mediana per classi con il procedimento 1; c) la mediana per classi

con il procedimento 2.

La mediana occupa la posizione che si ottiene dalla formula: (n+1)/2 = (7+1)/2 = 4^

Dopo aver ordinato l’insieme dei dati in sequenza crescente o decrescente e assegnato la relativa

posizione si

applicano due principi:

Se il numero di modalità è dispari la mediana occupa la posizione (n+1)/2 ed il suo valore e

1.

corrispondente

a quello della posizioni trovata;

Se il numero di modalità è pari la mediana occupa sempre la posizione (n+1)/2 ma il suo

2.

valore e

corrispondente a quello delle due posizioni limitrofe trovate.

LEZIONE 7 DOMANDA 7. Dati i valori di x (12,16,18,22,26) con quali linee di codice di R si

implementano: a) per calcolare la mediana per valori singoli; b) per costruire classi con K=2; c) per

calcolare la mediana per valori suddivisi in classi.

x<-c(12,16,18,22,26);median(x)

a)

LEZIONE 8 DOMANDA 8. Dati i seguenti valori di xi (11,12,13,14,15) e ni (0,1,2,3,4) con quali script di R

si calcola: a) la densità di classe; b) la moda per i valori di x; c) la moda per la distribuzione di

frequenza.

LEZIONE 8 DOMANDA 9. Dati i seguenti valori di x (33,35,38,42,43): a) costruire classi per K=2; b)

calcolare la densità di classe; c) calcolare il valore della moda per classi.

LEZIONE 8 DOMANDA 10. A proposito della moda descrivere: a) che cos’è la densità di classe e come si

calcola; b) la formula della moda per valori suddivisi in classi; c) che cos’è una distribuzione amodale

ed una distribuzione plurimodale.

che cos'è la densità di classe e come si calcola;

a)

Quando le classi sono equi-ampie si può utilizzare, ai fini del calcolo delle misure centrali e di variabilità,

il valore centrale di classe, tenendo conto che tale procedura presenta un certo grado di

approssimazione dei risultati.

Qualora, invece, le classi non sono equi-ampie è necessario disegnare per ogni classe un rettangolo

che ha per altezza la densità di classe, data dal rapporto fra la frequenza assoluta ni e l’ampiezza di

classe (ai-1, ai) e per base l’ampiezza di classe stessa.

qual'è la formula della moda per valori suddivisi in classi;

b)

Mo=Lmo+ dove:

Lmo è l’estremo inferiore della classe modale.

∆finf è la differenza fra la frequenza assoluta della classe modale e la frequenza assoluta della classe

immediatamente inferiore a quella modale.

∆fsup è la differenza fra la frequenza assoluta della classe modale e la frequenza assoluta della

classe immediatamente superiore a quella modale.

A classe è l’ampiezza della classe modale.

che cos'è un distribuzione amodale; Presenta frequenze tutte uguali.

c) che cos'è una distribuzione plurimodale

d)

La Moda può essere definita come: una misura di tendenza centrale che si applica ai caratteri qualitativi

e quantitativi ordinabili, in modo crescente o decrescente. Rappresenta la modalità di un carattere che

si presenta più volte o che evidenzia il valore di frequenza più elevato in un insieme di osservazioni.

Una distribuzione di valori di un carattere può presentare più mode (in questo caso si definisce

“plurimodale”), quando si registra più volte la stessa frequenza.

LEZIONE 9 DOMANDA 8. Data una distribuzione di valori singoli descrivere con quali formule si

calcolano: a) il I Quartile; b) il II Quartile (o Mediana); c) il III Quartile.

a) I Quartile

IQ1 è l’estremo inferiore della classe dove cade il I quartile.

Fq1-1 è la frequenza relativa cumulata fino alla classe precedente a quella cui cade il I quartile

Fq1 è la frequenza relativa cumulata fino alla classe che contiene il I quartile.

∆_Q1 è l’ampiezza della classe che contiene il I quartile.

b) II Quartile

Lme è la media tra l’estremo inferiore della classe mediana e l’estremo superiore della classe che

precede quella mediana.

N è la frequenza totale.

freq.cum.ass.Me-1è la frequenza cumulata assoluta della classe inferiore a quella

mediana.

Freq. ass. Me è la frequenza assoluta della classe mediana.

C è l’ampiezza della classe mediana.

c) III Quartile

IQ3 è l’estremo inferiore della classe dove cade il Q3

Fq3-1 è la frequenza relativa cumulata fino alla classe precedente a quella in cui

cade il Q3

Fq3 è la frequenza relativa cumulata fino alla classe che contiene il Q3

∆_Q3 è

Anteprima
Vedrai una selezione di 10 pagine su 72
paniere Statistica aperte Pag. 1 paniere Statistica aperte Pag. 2
Anteprima di 10 pagg. su 72.
Scarica il documento per vederlo tutto.
paniere Statistica aperte Pag. 6
Anteprima di 10 pagg. su 72.
Scarica il documento per vederlo tutto.
paniere Statistica aperte Pag. 11
Anteprima di 10 pagg. su 72.
Scarica il documento per vederlo tutto.
paniere Statistica aperte Pag. 16
Anteprima di 10 pagg. su 72.
Scarica il documento per vederlo tutto.
paniere Statistica aperte Pag. 21
Anteprima di 10 pagg. su 72.
Scarica il documento per vederlo tutto.
paniere Statistica aperte Pag. 26
Anteprima di 10 pagg. su 72.
Scarica il documento per vederlo tutto.
paniere Statistica aperte Pag. 31
Anteprima di 10 pagg. su 72.
Scarica il documento per vederlo tutto.
paniere Statistica aperte Pag. 36
Anteprima di 10 pagg. su 72.
Scarica il documento per vederlo tutto.
paniere Statistica aperte Pag. 41
1 su 72
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze matematiche e informatiche MAT/06 Probabilità e statistica matematica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Flower25 di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università telematica "e-Campus" di Novedrate (CO) o del prof Coccarda Raoul.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community