vuoi
o PayPal
tutte le volte che vuoi
I metodi utilizzati per l’analisi descrittiva sono:
▪ Frequenze, distribuzioni e tabulazioni: strumenti statistici che vengono utilizzati per
esaminare il conteggio delle occorrenze di valori all’interno di un intervallo.
▪ Tendenza centrale, media, mediana e moda dei dati: strumenti statistici che permettono di
riepilogare i dati in un singolo valore tipico o rappresentativo di tutti i valori nel set di dati
analizzato.
▪ Intervallo, quartili, varianza o deviazione standard: ci mostrano quanto sono sparsi i valori e
quanto essi differiscono dal valore medio.
I principali metodi utilizzati per l’analisi inferenziale sono
▪ ANOVA a una via: è un metodo statistico per testare le differenze tra le medie di tre o più
gruppi.
▪ Procedura di Tukey‐Cramer: quando nell’ANOVA si rifiuta l’ipotesi nulla, ci sono almeno due
medie significativamente diverse tra loro e la procedura consente di effettuare
simultaneamente confronti a due a due tra tutti i gruppi;
▪ Analisi dei residui: lo strumento diagnostico principale per controllare l’adeguatezza del
modello adottato e per evidenziare scostamenti dalle ipotesi di normalità, indipendenza ed
omogeneità delle varianze.
2. Analisi descrittiva
Sono state eseguite 30 prove per lato e il dataset contiene i risultati di 3 delle 10 battute
sclerometriche previste da normativa eseguite sulle due colonne dell'edificio.
Tab-1: Misure descrittive per la variabile lato
Variable Lato Mean StDev Variance CoefVar Minimum Q1 Median Q3 Maximum
Durezza dx 29,000 3,085 9,517 10,64 22,000 35,000
sx 9,65 25,000 28,000 30,000 32,000 37,000
Variable Lato Range IQR Mode N for Mode
Durezza dx 28 7
sx 12,000 4,000 30 7
Dal confronto tra le misure della media e della moda tra lato destro e lato sinistro si nota che
sia la media che la moda del lato sx sono caratterizzate da durezza maggiore, la colonna di sx
ha quindi una maggior resistenza all’abrasione rispetto alla colonna di destra.
La media e la moda sono rispettivamente per il lato destro pari a 29,000 e 28 e per il lato
sinistro 30,100 e 30.
La variabilità delle misure della durezza è maggiore per il lato destro, ciò si può vedere dai
valori del range, dal coefficiente di variazione e dalla deviazione standard, maggiori in tutti e
tre i casi per il lato destro. Per il lato destro il 25% dei valori è inferiore a 27,500, il 50% è
inferiore a 29,500 e il 75% a 31,250. Mentre per il lato sinistro il 25% dei valori è inferiore a
28,000, il 50% è inferiore 30,000 e il 75% a 32,000. Da un’analisi più approfondita per
entrambi i lati possiamo notare (Fig.1):
▪ Per il lato destro abbiamo una distribuzione tendenzialmente non uniforme per la prima e la
terza battuta con modalità unimodale ed una distribuzione asimmetrica a sinistra e a forma di
J-shaped per la prima battuta, mentre per la seconda battuta abbiamo una distribuzione
tendenzialmente uniforme nella quale utilizzeremo i quartili per ottenere più informazioni.
▪ Per il lato sinistro abbiamo una distribuzione tendenzialmente non uniforme per tutte le
battute. In particolare, per la terza battuta, abbiamo una distribuzione a forma di J-shaped
invece per la seconda si ha una distribuzione tendenzialmente simmetrica (valori centrali più
frequenti).
Fig-1: Istogramma della Durezza
Tab-2: Misure descrittive per le variabili durezza e battuta
Variable Durezza Total Count CumN Percent CumPct
Durezza 22 1 1 1,6667 1,667
24 2 3 3,3333 5,000
25 2 5 3,3333 8,333
26 5 10 8,3333 16,667
27 2 12 3,3333 20,000
28 12 24 20,0000
40,000
29 3 27 5,0000 45,000
30 13 40 21,6667
66,667
31 4 44 6,6667 73,333
32 9 53 15,0000
88,333
33 1 54 1,6667 90,000
34 2 56 3,3333 93,333
35 2 58 3,3333 96,667
36 1 59 1,6667 98,333
37 1 60 1,6667
100,000
Total CumN Percent
Variable Battuta Count CumPct
Battuta 1 20 20 33,3333 33,333
2 20 40 33,3333 66,667
3 20 60 33,3333 100,000
Dalla Tab.2 vediamo le frequenze assolute e percentuali sia semplici che cumulate sia per i
valori di Durezza che per le Battute, che ci permettono l’interpretazione della funzione di
ripartizione empirica per la variabile durezza. Circa il 60% delle battute effettuate sono inferiori
o uguali a 30, e che già il 90% dei valori è inferiore a 33. In particolar modo si nota una
maggiore resistenza per il lato destro nella seconda battuta rispetto al lato sinistro (fig-2).
Fig-2: funzione di ripartizione empirica per la variabile durezza
più valori medi utilizzati:
▪ Media aritmetica
▪ Mediana, quartili
▪ Moda
Tab-3: Misure descrittive per la variabile durezza
Results for Lato = dx
Variable Battuta N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum
Durezza 1 10 0 30,500 0,898 2,838 26,000 28,000 30,500 32,500 35,000
2 10 0 27,500 1,170 3,690 22,000 24,000 27,000 30,500 33,000
3 10 0 29,000 0,632 2,000 25,000 28,000 29,000 30,250 32,000
Results for Lato = sx
Variable Battuta N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum
Durezza 1 10 0 30,000 1,150 3,620 25,000 27,750 29,500 32,000 37,000
2 10 0 30,500 0,946 2,991 26,000 28,500 30,000 32,500 36,000
3 10 0 29,800 0,696 2,201 26,000 28,000 30,000 32,000 32,000
▪ Per il lato destro, i valori di durezza della prima battuta sono per il 25% inferiori a 28,000 per
il 50% a 30,500 e per il 75% a 32,500. Per la seconda battuta il 25% dei valori è inferiori a
24,000 per il 50% a 27,000 e per il 75% a 30,500. Per la terza battuta il 25% dei valori è
inferiori a 28,000 per il 50% a 29,000 e per il 75% a 30,250.
▪ Per il lato sinistro, i valori di durezza della prima battuta sono per il 25% inferiori a 27,750 per
il 50% a 29,500 e per il 75% a 32,000. Per la seconda battuta il 25% dei valori è inferiori a
28,500 per il 50% a
30,000 e per il 75% a 32,500. Per la terza battuta il 25% dei valori è inferiori a 28,000 per il
50% a 30,000 e per il 75% a 32,000.
Fig-3: Boxplot della Durezza
Notiamo che la variabilità è massima per la seconda battuta sul lato destro ed è proprio per
questo motivo che siamo in presenza di una distribuzione uniforme. Mentre la variabilità è
minima per la terza e la prima battuta sul lato destro.
3. Analisi inferenziale
Procediamo l’indagine con la realizzazione dell’ANOVA ad una via per lo studio della relazione
tra la variabile durezza e la variabile lato, fissando il livello di significatività α pari al 95%. Tab-
4: ANOVA ad una via per le variabili durezza e lato
Method
Null hypothesis All means are equal
Alternative Not all means are
hypothesis equal
Significance level α = 0,05
Equal variances were assumed for the analysis.
Factor Information
Factor Levels Values
Lato 2 dx; sx
Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
Lato 1 18,15 18,150 2,02 0,160
Error 58 520,70 8,978
Total 59 538,85
Model Summary
S R-sq R-sq(adj) R-sq(pred)
2,99626 3,37% 1,70% 0,00%
Means
Lato N Mean StDev 95% CI dx
30 29,000 3,085 (27,905;
30,095)
sx 30 30,100 2,905 (29,005;
31,195)
Pooled StDev = 2,99626
Il test dell’ANOVA non è risultato statisticamente significativo poiché per il test di Fisher
abbiamo ottenuto il valore osservato della statistica F=2.02 strettamente minore del valore
critico Fu. In questo caso possiamo notare dalla tabella “Analysis of Variance” che il p-value,
cioè la probabilità di osservare un valore di F maggiore o uguale a quello osservato, nel caso
l’ipotesi nulla sia vera, calcolato è pari a 0.160 e si tratta di un valore maggiore di α pari a 0.05.
Sapendo che l’ipotesi nulla di uguaglianza tra le medie dei gruppi deve essere rifiutata quando
il p‐value è inferiore al livello di significatività scelto, possiamo affermare che le medie dei
valori di durezza per entrambi i lati sono statisticamente simili per l’intervallo di confidenza α.
Tab-5: Procedura di Tukey-Cramer Tukey Pairwise Comparisons Grouping Information Using the
Tukey Method and 95% Confidence
Lato N Mean Grouping
sx 30 30,100 A dx 30
29,000 A
Means that do not share a letter are significantly different.
Tukey Simultaneous Tests for Differences of Means
Difference Difference SE of Adjusted
of Levels of Means Difference 95% CI T-Value P-Value
sx - dx 1,100 0,774 (-0,449; 1,42 0,160
2,649)
Individual confidence level = 95,00%
Per avere un ulteriore conferma ed attendibilità dei risultati ottenuti abbiamo applicato la
procedura di Tukey-Cramer in modo da confrontare la differenza fra le due medie, anche se
normalmente viene applicata quando si rifiuta l’ipotesi nulla.
Fig-4: Intervalli di confidenza simultanei di Tukey-Cramer
Possiamo notare che l’intervallo dato dal range critico rispetto alla differenza fra medie
comprende il valore 0 perciò le medie sono statisticamente uguali(Fig-4). Per concludere
lo studio dell’ANOVA passiamo all’analisi dei residui.
Fig-5: Grafici dei residui
Per ognuno di questi grafici possiamo fare alcune considerazioni (Fig-5):
▪ Per il “Normal Probability Plot” si nota che i punti tendono ad allinearsi lungo la retta
confermando quindi l’ipotesi di normalità per la distribuzione delle osservazioni;
▪ Per il grafico “Residual versus Fits” si nota che i residui si dispongono in modo casuale
sopra e sotto lo zero, questo conferma l’ipotesi di omogeneità delle varianze;
▪ Nell’istogramma con le frequenze dei residui si può vedere che la distribuzione degli errori è
normale, questo conferma la condizione di normalità;
▪ Per il grafico “Residual versus Order” per l’ordine temporale delle osservazioni i punti
sono distribuiti in maniera casuale sopra e sotto lo zero. Perciò questo porta a confermare
l’ipotesi di indipendenza degli errori.
Dall’osservazione dei grafici dei residui abbiamo verificato la non violazione delle ipotesi di
normalità, omogeneità delle varianze, casualità e indipendenza delle osservazioni.
4. Conclusioni
L’indagine sclerometrica effettuata sulla colonna di destra e sulla colonna di sinistra, ci ha
portato allo studio della relazione tra il carico di rottura a compressione e la durezza
superficiale del calcestruzzo. I principali metodi utilizzati per l’analisi descrittiva e
inferenziale portano a determinare che le misure effettuate possono essere accettate
dato che non ci sono differenze statisticamente significative per l’intervallo di confidenza
α scelto. Questa conclusione è relativa ad un dataset che è ritenuto incompleto secondo
la normativa vigente poiché dovrebbero essere eseguite e prese in esame 10 battute
sclero