vuoi
o PayPal
tutte le volte che vuoi
ELABORATO DI STATISTICA
STUDENTE: TROKA SKENDER
MATRICOLA: 0082401163
# Sintesi del modello
overview_model <- summary(linear_model)
print(overview_model)
# Creazione del grafico di dispersione con la retta di regressione
plot(dataset$ratio, dataset$score,
main = "Relazione tra Score e Ratio",
xlab = "Rapporto Studenti/Insegnanti",
ylab = "Punteggio Medio",
pch = 16, col = "orange")
abline(linear_model, col = "black", lwd = 2)
# Output finale
cat("\nRisultati della regressione lineare:\n")
print(overview_model)
ANALISI: Viene creato il rapporto tra studenti e insegnanti per valutare il suo impatto sui risultati scolastici. L'analisi
si conclude con un modello di regressione lineare, che aiuta a comprendere se e come il rapporto
studenti/insegnanti influisce sui punteggi. Infine, viene generato un grafico per visualizzare meglio la relazione t.
Sì, è possibile costruire un modello di regressione alternativo utilizzando ulteriori variabili disponibili nel dataset. Ad
esempio, si potrebbe includere una regressione multipla che considera altre variabili influenti sui punteggi degli
studenti.
ELABORATO DI STATISTICA
STUDENTE: TROKA SKENDER
MATRICOLA: 0082401163 SECONDO ESERCIZIO
# Caricamento delle librerie
library(readxl)
library(vcd)
library(dplyr)
# Lettura del dataset
file_path <- "Diamanti.xlsx"
diamonds_data <- read_excel(file_path)
# Esplorazione iniziale del dataset
head(diamonds_data)
names(diamonds_data)
# Ridenominazione delle colonne per facilitare l'uso
diamonds_data <- rename(diamonds_data, Colore = "Colore (D, E, F, G, H o I)",
Lucentezza = "Lucentezza (IF, VVS1, VVS2, VS1 o VS2)")
# Calcolo della distribuzione condizionata del colore per Lucentezza = "IF"
colore_if <- table(diamonds_data$Colore[diamonds_data$Lucentezza == "IF"])
distribuzione_condizionata <- prop.table(colore_if) * 100
cat("\nDistribuzione di frequenza percentuale condizionata (IF):\n")
print(distribuzione_condizionata)
# Calcolo della distribuzione marginale percentuale della variabile colore
distribuzione_marginale <- prop.table(table(diamonds_data$Colore)) * 100
cat("\nDistribuzione marginale percentuale (Colore):\n")
print(distribuzione_marginale)
# Confronto tra distribuzione condizionata e marginale
confronto_distribuzioni <- data.frame(Condizionata = distribuzione_condizionata,
Marginale = distribuzione_marginale)
cat("\nConfronto tra distribuzioni:\n")
print(confronto_distribuzioni)
# Creazione della tabella di contingenza
contingenza_table <- table(diamonds_data$Colore, diamonds_data$Lucentezza)
# Test del Chi-quadro e calcolo dell'indice V di Cramer
chi2_test <- chisq.test(contingenza_table)
v_cramer <- sqrt(chi2_test$statistic / (sum(contingenza_table) * (min(dim(contingenza_table)) - 1)))
cat("\nIndice V di Cramer:", round(v_cramer, 4), "\n")
ELABORATO DI STATISTICA
STUDENTE: TROKA SKENDER
MATRICOLA: 0082401163
ANALISI: L'analisi condotta ha permesso di confrontare la distribuzione condizionata e marginale del
colore dei diamanti rispetto alla loro lucentezza. Il test del chi-quadro ha valutato la dipendenza tra le due
variabili, mentre l'indice V di Cramer ha quantificato l'intensità della relazione. Se il valore di V di Cramer è
vicino allo zero, significa che la relazione tra colore e lucentezza è debole; valori più alti indicano invece
una maggiore associazione. Questo approccio fornisce una visione più chiara delle caratteristiche qualitative
dei diamanti e può supportare le decisioni. TERZO ESERCIZIO
# Caricamento delle librerie
library(readxl)
# Lettura del dataset
dataset_path <- "studenti_1.xlsx"
student_data <- read_excel(dataset_path)
# Esplorazione preliminare del dataset
str(student_data)
summary(student_data)
# Creazione della tabella di frequenza per la residenza
residenza_counts <- table(student_data$residenza)
# Visualizzazione della distribuzione della residenza con un grafico a barre
barplot(residenza_counts,
main = "Distribuzione della Residenza",
xlab = "Residenza",
ylab = "Frequenza",
col = "deepskyblue",
las = 2)
# Creazione dell'istogramma per l'altezza
hist(student_data$altezza,
main = "Distribuzione dell'Altezza",
xlab = "Altezza (cm)",
ylab = "Frequenza",
col = "lightcoral",
breaks = 12)
# Calcolo delle statistiche di sintesi
quartile_1 <- quantile(student_data$altezza, 0.25, na.rm = TRUE)
quartile_3 <- quantile(student_data$altezza, 0.75, na.rm = TRUE)
mediana_altezza <- median(student_data$altezza, na.rm = TRUE)
media_altezza <- mean(student_data$altezza, na.rm = TRUE)
deviazione_std <- sd(student_data$altezza, na.rm = TRUE)
# Output delle statistiche
cat("\nStatistiche descrittive dell'altezza:\n")
cat("Primo Quartile:", quartile_1, "\n")
cat("Terzo Quartile:", quartile_3, "\n")
cat("Mediana:", mediana_altezza, "\n")
cat("Media Aritmetica:", media_altezza, "\n")
cat("Deviazione Standard:", deviazione_std, "\n")
ELABORATO DI STATISTICA
STUDENTE: TROKA SKENDER
MATRICOLA: 0082401163
# Box plot dell'altezza
boxplot(student_data$altezza,
main = "Box Plot dell'Altezza",
ylab = "Altezza (cm)",
col = "gold",
horizontal = TRUE)
# Aggiunta delle linee di riferimento ai quartili
abline(h = quantile(student_data$altezza, probs = c(0.25, 0.5, 0.75), na.rm = TRUE), col = "darkred", lty = 2)
# Creazione della tabella di contingenza tra sesso e residenza
tabella_contingenza <- table(student_data$sex, student_data$residenza)
# Aggiunta dei totali marginali
tabella_contingenza_margini <- addmargins(tabella_contingenza)
# Visualizzazione della tabella
cat("\nTabella di contingenza sesso vs residenza:\n")
print(tabella_contingenza_margini)
# Test del Chi-Quadrato per indipendenza
test_chi2 <- chisq.test(tabella_contingenza)
cat("\np-value del test del Chi-Quadrato:", test_chi2$p.value, "\n")
# Calcolo dell'indice V di Cramer
indice_v_cramer <- sqrt(test_chi2$statistic / (sum(tabella_contingenza) * (min(dim(tabella_contingenza)) - 1)))
# Output dell'indice V di Cramer
cat("Indice V di Cramer:", round(indice_v_cramer, 4), "\n")