Anteprima
Vedrai una selezione di 3 pagine su 6
Appunti Statistica Pag. 1 Appunti Statistica Pag. 2
Anteprima di 3 pagg. su 6.
Scarica il documento per vederlo tutto.
Appunti Statistica Pag. 6
1 su 6
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

ELABORATO DI STATISTICA

STUDENTE: TROKA SKENDER

MATRICOLA: 0082401163

# Sintesi del modello

overview_model <- summary(linear_model)

print(overview_model)

# Creazione del grafico di dispersione con la retta di regressione

plot(dataset$ratio, dataset$score,

main = "Relazione tra Score e Ratio",

xlab = "Rapporto Studenti/Insegnanti",

ylab = "Punteggio Medio",

pch = 16, col = "orange")

abline(linear_model, col = "black", lwd = 2)

# Output finale

cat("\nRisultati della regressione lineare:\n")

print(overview_model)

ANALISI: Viene creato il rapporto tra studenti e insegnanti per valutare il suo impatto sui risultati scolastici. L'analisi

si conclude con un modello di regressione lineare, che aiuta a comprendere se e come il rapporto

studenti/insegnanti influisce sui punteggi. Infine, viene generato un grafico per visualizzare meglio la relazione t.

Sì, è possibile costruire un modello di regressione alternativo utilizzando ulteriori variabili disponibili nel dataset. Ad

esempio, si potrebbe includere una regressione multipla che considera altre variabili influenti sui punteggi degli

studenti.

ELABORATO DI STATISTICA

STUDENTE: TROKA SKENDER

MATRICOLA: 0082401163 SECONDO ESERCIZIO

# Caricamento delle librerie

library(readxl)

library(vcd)

library(dplyr)

# Lettura del dataset

file_path <- "Diamanti.xlsx"

diamonds_data <- read_excel(file_path)

# Esplorazione iniziale del dataset

head(diamonds_data)

names(diamonds_data)

# Ridenominazione delle colonne per facilitare l'uso

diamonds_data <- rename(diamonds_data, Colore = "Colore (D, E, F, G, H o I)",

Lucentezza = "Lucentezza (IF, VVS1, VVS2, VS1 o VS2)")

# Calcolo della distribuzione condizionata del colore per Lucentezza = "IF"

colore_if <- table(diamonds_data$Colore[diamonds_data$Lucentezza == "IF"])

distribuzione_condizionata <- prop.table(colore_if) * 100

cat("\nDistribuzione di frequenza percentuale condizionata (IF):\n")

print(distribuzione_condizionata)

# Calcolo della distribuzione marginale percentuale della variabile colore

distribuzione_marginale <- prop.table(table(diamonds_data$Colore)) * 100

cat("\nDistribuzione marginale percentuale (Colore):\n")

print(distribuzione_marginale)

# Confronto tra distribuzione condizionata e marginale

confronto_distribuzioni <- data.frame(Condizionata = distribuzione_condizionata,

Marginale = distribuzione_marginale)

cat("\nConfronto tra distribuzioni:\n")

print(confronto_distribuzioni)

# Creazione della tabella di contingenza

contingenza_table <- table(diamonds_data$Colore, diamonds_data$Lucentezza)

# Test del Chi-quadro e calcolo dell'indice V di Cramer

chi2_test <- chisq.test(contingenza_table)

v_cramer <- sqrt(chi2_test$statistic / (sum(contingenza_table) * (min(dim(contingenza_table)) - 1)))

cat("\nIndice V di Cramer:", round(v_cramer, 4), "\n")

ELABORATO DI STATISTICA

STUDENTE: TROKA SKENDER

MATRICOLA: 0082401163

ANALISI: L'analisi condotta ha permesso di confrontare la distribuzione condizionata e marginale del

colore dei diamanti rispetto alla loro lucentezza. Il test del chi-quadro ha valutato la dipendenza tra le due

variabili, mentre l'indice V di Cramer ha quantificato l'intensità della relazione. Se il valore di V di Cramer è

vicino allo zero, significa che la relazione tra colore e lucentezza è debole; valori più alti indicano invece

una maggiore associazione. Questo approccio fornisce una visione più chiara delle caratteristiche qualitative

dei diamanti e può supportare le decisioni. TERZO ESERCIZIO

# Caricamento delle librerie

library(readxl)

# Lettura del dataset

dataset_path <- "studenti_1.xlsx"

student_data <- read_excel(dataset_path)

# Esplorazione preliminare del dataset

str(student_data)

summary(student_data)

# Creazione della tabella di frequenza per la residenza

residenza_counts <- table(student_data$residenza)

# Visualizzazione della distribuzione della residenza con un grafico a barre

barplot(residenza_counts,

main = "Distribuzione della Residenza",

xlab = "Residenza",

ylab = "Frequenza",

col = "deepskyblue",

las = 2)

# Creazione dell'istogramma per l'altezza

hist(student_data$altezza,

main = "Distribuzione dell'Altezza",

xlab = "Altezza (cm)",

ylab = "Frequenza",

col = "lightcoral",

breaks = 12)

# Calcolo delle statistiche di sintesi

quartile_1 <- quantile(student_data$altezza, 0.25, na.rm = TRUE)

quartile_3 <- quantile(student_data$altezza, 0.75, na.rm = TRUE)

mediana_altezza <- median(student_data$altezza, na.rm = TRUE)

media_altezza <- mean(student_data$altezza, na.rm = TRUE)

deviazione_std <- sd(student_data$altezza, na.rm = TRUE)

# Output delle statistiche

cat("\nStatistiche descrittive dell'altezza:\n")

cat("Primo Quartile:", quartile_1, "\n")

cat("Terzo Quartile:", quartile_3, "\n")

cat("Mediana:", mediana_altezza, "\n")

cat("Media Aritmetica:", media_altezza, "\n")

cat("Deviazione Standard:", deviazione_std, "\n")

ELABORATO DI STATISTICA

STUDENTE: TROKA SKENDER

MATRICOLA: 0082401163

# Box plot dell'altezza

boxplot(student_data$altezza,

main = "Box Plot dell'Altezza",

ylab = "Altezza (cm)",

col = "gold",

horizontal = TRUE)

# Aggiunta delle linee di riferimento ai quartili

abline(h = quantile(student_data$altezza, probs = c(0.25, 0.5, 0.75), na.rm = TRUE), col = "darkred", lty = 2)

# Creazione della tabella di contingenza tra sesso e residenza

tabella_contingenza <- table(student_data$sex, student_data$residenza)

# Aggiunta dei totali marginali

tabella_contingenza_margini <- addmargins(tabella_contingenza)

# Visualizzazione della tabella

cat("\nTabella di contingenza sesso vs residenza:\n")

print(tabella_contingenza_margini)

# Test del Chi-Quadrato per indipendenza

test_chi2 <- chisq.test(tabella_contingenza)

cat("\np-value del test del Chi-Quadrato:", test_chi2$p.value, "\n")

# Calcolo dell'indice V di Cramer

indice_v_cramer <- sqrt(test_chi2$statistic / (sum(tabella_contingenza) * (min(dim(tabella_contingenza)) - 1)))

# Output dell'indice V di Cramer

cat("Indice V di Cramer:", round(indice_v_cramer, 4), "\n")

Dettagli
Publisher
A.A. 2024-2025
6 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher troka270 di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Universitas Mercatorum di Roma o del prof Mazzitelli Andrea.