Analisi di statistica sociale riguardante i tassi di separazioni e divorzi in Italia nell’anno 2009
Prof. Natale Carra
Statistica Sociale a.a. 2011/2012
Indice
- Introduzione
- Andamento di matrimoni, separazioni e divorzi dall’anno 2000 al 2009 (analisi secondo il modello della regressione e correlazione)
- Influenza della situazione socio-economica delle famiglie sulla decisione dei coniugi di separarsi (analisi secondo il modello della regressione e correlazione)
- Tipologie di affidamento dei minori nelle separazioni e nei divorzi in relazione al territorio (analisi secondo il modello della varianza o modello anova)
- Relazione tra l’età e il sesso del coniuge all’atto della separazione (analisi secondo il modello dei dati categoriali)
Introduzione
Con il termine “divorzio” si intende lo scioglimento o la cessazione degli effetti civili del matrimonio in caso, rispettivamente, di matrimonio celebrato con rito civile o di matrimonio celebrato con rito religioso. Il divorzio è stato introdotto in Italia, nonostante la forte opposizione della Democrazia Cristiana, dalla legge numero 898 del 1 Dicembre del 1970: “Disciplina dei casi di scioglimento del matrimonio”; successivamente con la legge numero 74 del 6 Marzo 1987 si è ridotto da cinque a tre gli anni di separazione necessari per la pronuncia della sentenza di divorzio.
La “separazione” non pone fine al matrimonio, né fa venir meno lo status giuridico di coniuge. Incide solo su alcuni effetti propri del matrimonio (si scioglie la comunione legale dei beni, cessano gli obblighi di fedeltà e di coabitazione). La differenza fra divorzio e separazione è che quest’ultima ha carattere transitorio, tanto che è possibile riconciliarsi senza alcuna formalità.
Si è deciso di analizzare questa tematica avvalendosi dei dati forniti dall’ISTAT, in quanto da anni segue l’evoluzione temporale del fenomeno, monitorandone le principali caratteristiche ed inoltre nel sito è possibile reperire questi risultati con estrema facilità. Con questa indagine si vuole portare alla luce quanto la situazione sia concretamente presente nella nostra società, quanto influisca sulle famiglie e la loro composizione, le rispettive dinamiche interne, senza tralasciare il rapporto con l’esterno (il territorio) e l’interno (l’individuo come membro della coppia).
Durante la fase di raccolta dei dati, sono emersi alcuni aspetti di particolare interesse che abbiamo deciso di indagare attraverso i tre modelli statistici (analisi della regressione, analisi della varianza e analisi dei dati categoriali):
- Andamento di matrimoni, separazioni e divorzi dall’anno 2000 al 2009 (verifichiamo se i tassi di matrimoni, separazioni e divorzi sono cambiati in modo lineare nel corso dei dieci anni)
- L’influenza della situazione socio-economica delle famiglie sulla decisione dei coniugi di separarsi (oltre ai dati relativi alle separazioni nel 2009, abbiamo recuperato anche i dati relativi alla “povertà in Italia” nello stesso anno e li abbiamo messi in relazione)
- Tipologie di affidamento dei minori nelle separazioni e nei divorzi in relazione con il territorio (analizziamo i valori dei differenti tipi di affidamento dei minori: esclusivo al padre o alla madre, condiviso o a terzi, nei casi di separazione e divorzio dell’anno 2009)
- Relazione tra l’età e il sesso del coniuge all’atto della separazione (utilizzando i dati relativi al 2009, attraverso l’analisi dei dati categoriali si vuole verificare se l’età del coniuge messa in relazione con il suo essere uomo o donna, influisce sulla decisione di porre fine al matrimonio).
Il lavoro d’indagine è stato pensato in modo tale da offrire in primo luogo una panoramica generale del fenomeno, per poi procedere studiandolo più nel dettaglio e mettendolo in relazione con altre variabili. È importante sottolineare come in alcuni punti si sia preferito indagare solo l’aspetto della separazione in quanto, come già detto in precedenza, è fase preliminare per la sentenza di divorzio anche se non sempre quest’ultimo alla fine si concretizza.
Andamento di matrimoni, separazioni e divorzi dall’anno 2000 al 2009
Per lo studio di questo punto utilizzeremo l’analisi della regressione e correlazione. Con questo tipo di analisi si mettono in relazione coppie di variabili continue, ciò presuppone che la relazione fra le variabili Y e X sia di tipo lineare e che la variabile dipendente Y sia distribuita normalmente ad ogni livello della variabile indipendente X. Il primo passo da svolgere è la realizzazione del diagramma di dispersione sul quale pongo sull’asse delle X la variabile indipendente e su quella delle Y la variabile dipendente. Tracciando le coordinate (X;Y) per ogni coppia, segniamo sul piano un punto e l’insieme di questi rappresenterà la modalità di covariazione tra le due variabili.
Matrimoni
Numero di matrimoni nei dieci anni tra il 2000 e il 2009 sono variati in modo lineare?
x 2000 (1) 2001 2002 2003 2004 2005 2006 2007 2008 2009 (10) (2) (3) (4) (5) (6) (7) (8) (9)
y 284410 264026 270013 264097 248969 247740 245992 250360 246613 230613
La variabile indipendente X che rappresenta gli anni è stata descritta con dei numeri naturali da 1 a 10.
Retta di Regressione
Quando stimiamo la relazione lineare fra una variabile dipendente Y e una variabile indipendente X, regrediamo Y rispetto ad X, producendo una relazione lineare bivariata o una regressione bivariata, in termini algebrici: Y= a+bX. Dove Y (ordinata) coincide alla somma di una costante a (che corrisponde al punto in cui la retta intercetta l’asse verticale, ovvero il valore di Y quando X=0) più il valore di b (il gradiente, cioè l’inclinazione della retta) moltiplicato per X.
I ricercatori sociali di norma presuppongono che le variabili siano correlate in modo lineare a meno che non sia evidente l’esistenza do una correlazione non lineare, come nel caso di una curva gaussiana o logaritmica. Il punto di partenza è un’equazione predittiva, nella quale ad ogni valore di X (v. indipendente) ne corrisponde una di Y (v. dipendente): = a +. Tuttavia, i dati analizzati dai ricercatori sociali non sono mai delle perfette relazioni lineari, bisogna perciò valutare l’esistenza di un errore (detto anche residuo), che misura la discrepanza fra i valori osservati di Y e quelli attesi in base all’equazione di regressione lineare. L’errore è detto “residuo” in quanto rappresenta la quantità che rimane dopo aver sottratto l’equazione predittiva dal modello di regressione lineare:
- = [a + + ] – [a + ] =
Coefficiente di Regressione
L’analisi di regressione stima i valori di a e b utilizzando i dati osservati. Compito del modello è minimizzare i residui.
Il criterio dei minimi quadrati:
Esso permette di stimare l’equazione; secondo questo criterio (OLS → stima dei minimi quadrati comuni) la somma delle differenze al quadrato deve essere minima. La stima dei minimi quadrati per il coefficiente di regressione bivariata è calcolata come:
L’intercetta si può ricavare dall’equazione predittiva dopo aver trovato : a = -
Per poter effettuare tutti i calcoli si può costruire una tabella, come quella che segue, che contiene tutte lòe informazioni necessarie per calcolare e a.
| X | Y | (X - M(x)) | (Y - M(y)) | (X - M(x))^2 | (Y - M(y))^2 | (X - M(x))(Y - M(y)) |
|---|---|---|---|---|---|---|
| 5,5 | 255283,3 | -4,5 | 29126,7 | 20,25 | 848364652,9 | -131070,15 |
| -3,5 | 8742,7 | 12,25 | 76434803,29 | -30599,45 | 216964062,1 | 77681307,69 |
| -2,5 | 14729,7 | 6,25 | 39870384,49 | -36824,25 | 56901374,89 | 86328255,69 |
| -1,5 | 8813,7 | 2,25 | 77681307,69 | -13220,55 | 24238882,89 | 75174102,09 |
| -0,5 | -6314,3 | 0,25 | 39870384,49 | 3157,15 | 608623702,1 | 24670,3 |
| 0,5 | -7543,3 | 0,25 | 56901374,89 | -3771,65 | 29516004,84 | 4923,3 |
| 1,5 | -9291,3 | 2,25 | 86328255,69 | -13936,95 | 25141115,69 | 8670,3 |
| 2,5 | -4923,3 | 6,25 | 24238882,89 | -12308,25 | 19891213,89 | 24670,3 |
| 3,5 | -8670,3 | 12,25 | 75174102,09 | -30346,05 | 32428703,29 | 4923,3 |
| 4,5 | -24670,3 | 20,25 | 608623702,1 | -111016,35 | 13793612,69 | 24670,3 |
Nel nostro caso: b = - 4605,29 [INCLINAZIONE DELLA RETTA DI REGRESSIONE]
a = 255283,3 – (- 4605,29 * 5,5) = 255283,3 – ( - 25329,09) = 280612,39 [PUNTO IN CUI LA RETTA DI REGRESSIONE TOCCA L’ASSE Y CON X = 0]
Inoltre: Il numeratore di diviso per N-1 determina la covarianza indicata come:
= = = = - 42215,16
Il denominatore di diviso per N-1 determina la varianza di X, indicata come:
= = = = 9,16
Dato che N-1 appare nel denominatore di covarianza e varianza campionaria questo viene eliminato nel rapporto tra le due il quale risulta uguale a . Dunque lo stimatore può anche essere espresso come:
Per determinare la forza della covariazione scomponiamo gli effetti:
Dove: = Esprime la differenza tra osservazione e valore atteso
= Esprime la parte di valore osservato attribuibile alla relazione lineare tra Y e X.
Coefficiente di Determinazione
Un modo per determinare la forza della covariazione tra due variabili è misurare la vicinanza tra i valori osservati e quelli prodotti dalla retta di regressione stimata. La variazione di Y è dovuta sia all’effetto esercitato da X sia dall’errore causale; possiamo dividere la somma dei quadrati totale in una componente sistematica ed in una casuale.
Se vogliamo conoscere la quota di variazione attribuibile al modello di regressione:
= =
Quindi → Nel nostro caso:
= = = 234509058,7
= = 0,83
Possiamo dunque affermare che la variabile Y è influenzata per l’83% dalla variabile X, quindi l’83% della variazione osservata nel numero dei matrimoni è data dallo scorrere del tempo.
Coefficiente di Correlazione di Pearson
È la radice quadrata del coefficiente di determinazione.
= = 0,91
Se è -1 rappresenta una relazione inversa perfetta tra le variabili, se è uguale a zero indica l’inesistenza di relazioni e se è uguale a 1 abbiamo una relazione diretta perfetta. In questo caso abbiamo una relazione diretta non totalmente perfetta; le due variabili hanno una relazione inversamente proporzionale.
Test di Significatività per i Coefficienti di Regressione
Il test di significatività del coefficiente di determinazione consente di trarre inferenze sulla popolazione a partire dai dati campionari. Il test di significatività statistica per fa ricorso alla distribuzione F. La somma dei quadrati della regressione, essendo stimata a partire da possiede solo un grado di libertà. La somma dei gradi di libertà può essere suddivisa in due come la somma dei quadrati totali, perciò:
N-1 = 1 + = N-2
Nel nostro caso:
= 10-2 = 8
= * * (N-1) = 0,83 * 234509058,7 * 9 = 1751782668
* (N-1) = 234509058,7 * 9 = 2110581528
= * = 0,83 * 2110581528 = 1751782668
- 2110581528 – 1751782668 = 358798860
= = 44849857,50
= = = 39,06
Poniamo α = 0,01, in quanto un α “piccolo” riduce le possibilità di errore. Il valore critico è 11,26. Essendo F superiore a questo valore il test di significatività può dirsi convalidato.
Conclusione
Dopo questa analisi è possibile notare che in Italia tra il 2000 e il 2009 c’è stato un decremento lineare nel numero dei matrimoni (col procedere degli anni il numero dei matrimoni diminuisce progressivamente, ossia le due variabili sono correlate inversamente). Come postulato da questa relazione quindi il numero dei matrimoni è correlato con lo scorrere degli anni e probabilmente ciò è anche determinato da un cambiamento sociale che prevede percorsi di studi più lunghi, maggiori possibilità di carriera soprattutto per le donne e media di lunghezza della vita più alta, senza contare che molte coppie optano per un’unione di fatto invece di scegliere la via matrimoniale. Per tutte queste ragioni probabilmente le persone tendono a posticipare negli anni la decisione di sposarsi e costruire una famiglia o addirittura decide di rinunciarvi.
Essendo il coefficiente di correlazione vicino ad 1 possiamo vedere che questo legame tra variabili è forte, tesi confermata anche dal test di significatività, ben maggiore del valore critico.
Separazioni
Numero di separazioni nei dieci anni tra il 2000 e il 2009 sono variati in modo lineare?
x 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10)
y 71969 75890 79642 81744 83179 82291 80407 81359 84165 85945
La variabile indipendente X che rappresenta gli anni è stata descritta con dei numeri naturali da 1 a 10.
Retta di Regressione
Quando stimiamo la relazione lineare fra una variabile dipendente Y e una variabile indipendente X, regrediamo Y rispetto ad X, producendo una relazione lineare bivariata o una regressione bivariata, in termini algebrici: Y= a+bX. Dove Y (ordinata) coincide alla somma di una costante a (che corrisponde al punto in cui la retta intercetta l’asse verticale, ovvero il valore di Y quando X=0) più il valore di b (il gradiente, cioè l’inclinazione della retta) moltiplicato per X.
I ricercatori sociali di norma presuppongono che le variabili siano correlate in modo lineare a meno che non sia evidente l’esistenza do una correlazione non lineare, come nel caso di una curva gaussiana o logaritmica. Il punto di partenza è un’equazione predittiva, nella quale ad ogni valore di X (v. indipendente) ne corrisponde una di Y (v. dipendente): = a +. Tuttavia, i dati analizzati dai ricercatori sociali non sono mai delle perfette relazioni lineari, bisogna perciò valutare l’esistenza di un errore (detto anche residuo), che misura la discrepanza fra i valori osservati di Y e quelli attesi in base all’equazione di regressione lineare.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Analisi di un questionario
-
Tesina per esame di statistica: Analisi statistiche relative al tasso di disoccupazione in Italia
-
Analisi matematica - probabilità e statistica
-
Esercitazioni Analisi statistica multivariata