Che materia stai cercando?

Analisi di statistica sociale riguardante i tassi di separazioni e divorzi in Italia nell’anno 2009, Statistica sociale

Appunti contenenti una tesina finale per l'esame del corso di Statistica Sociale tenuto dal professor Carra - E' un'analisi riguardante separazioni e divorzi nel 2009 in Italia. Dal punto di vista didattico si tratta dell'applicazione di tre modelli statistici (analisi della regressione, analisi della varianza e analisi dei dati categoriali).
Conseguito risultato eccellente.

Esame di Statistica sociale docente Prof. N. Carra

Anteprima

ESTRATTO DOCUMENTO

INTRODUZIONE

Con il termine “divorzio” si intende lo scioglimento o la cessazione degli effetti civili del matrimonio in caso,

rispettivamente, di matrimonio celebrato con rito civile o di matrimonio celebrato con rito religioso. Il divorzio

è stato introdotto in Italia, nonostante la forte opposizione della Democrazia Cristiana, dalla legge numero 898

del 1 Dicembre del 1970: “Disciplina dei casi di scioglimento del matrimonio”; successivamente con la legge

numero 74 del 6 Marzo 1987 si è ridotto da cinque a tre gli anni di separazione necessari per la pronuncia della

sentenza di divorzio.

La “separazione” non pone fine al matrimonio, né fa venir meno lo status giuridico di coniuge. Incide solo su

alcuni effetti propri del matrimonio (si scioglie la comunione legale dei beni, cessano gli obblighi di fedeltà e di

coabitazione). La differenza fra divorzio e separazione è che quest’ultima ha carattere transitorio, tanto che è

possibile riconciliarsi senza alcuna formalità.

Si è deciso di analizzare questa tematica avvalendosi dei dati forniti dall’ISTAT, in quanto da anni segue

l’evoluzione temporale del fenomeno, monitorandone le principali caratteristiche ed inoltre nel sito è possibile

reperire questi risultati con estrema facilità. Con questa indagine si vuole portare alla luce quanto la situazione

sia concretamente presente nella nostra società, quanto influisca sulle famiglie e la loro composizione, le

rispettive dinamiche interne, senza tralasciare il rapporto con l’esterno (il territorio) e l’interno (l’individuo

come membro della coppia).

Durane la fase di raccolta dei dati, sono emersi alcuni aspetti di particolare interesse che abbiamo deciso di

indagare attraverso i tre modelli statistici (analisi della regressione, analisi della varianza e analisi dei dati

categoriali):

▪ Andamento di matrimoni, separazioni e divorzi dall’anno 2000 al 2009 (verifichiamo se i tassi di

matrimoni, separazioni e divorzi sono cambiati in modo lineare nel corso dei dieci anni);

▪ L’influenza della situazione socio-economica delle famiglie sulla decisione dei coniugi di separarsi

(oltre ai dati relativi alle separazioni nel 2009, abbiamo recuperato anche i dati relativi alla “povertà in

Italia” nello stesso anno e li abbiamo messi in relazione);

▪ Tipologie di affidamento dei minori nelle separazioni e nei divorzi in relazione con il territorio

(analizziamo i valori dei differenti tipi di affidamento dei minori: esclusivo al padre o alla madre,

condiviso o a terzi, nei casi di separazione e divorzio dell’anno 2009);

▪ Relazione tra l’età e il sesso del coniuge all’atto della separazione (utilizzando i dati relativi al 2009,

attraverso l’analisi dei dati categoriali si vuole verificare se l’età del coniuge messa in relazione con il

suo essere uomo o donna, influisce sulla decisione di porre fine al matrimonio).

Il lavoro d’indagine è stato pensato in modo tale da offrire in primo luogo una panoramica generale del

fenomeno, per poi procedere studiandolo più nel dettaglio e mettendolo in relazione con altre variabili. È

importante sottolineare come in alcuni punti si sia preferito indagare solo l’aspetto della separazione in quanto,

! 3

come già detto in precedenza, è fase preliminare per la sentenza di divorzio anche se non sempre quest’ultimo

alla fine si concretizza.

ANDAMENTO DI MATRIMONI, SEPARAZIONI E DIVORZI DALL’ANNO 2000 AL 2009

Per lo studio di questo punto utilizzeremo l’analisi della regressione e correlazione.

Con questo tipo di analisi si mettono in relazione coppie di variabili continue, ciò presuppone che la relazione

fra le variabili Y e X sia di tipo lineare e che la variabile dipendente Y sia distribuita normalmente ad ogni

livello della variabile indipendente X. Il primo passo da svolgere è la realizzazione del diagramma di

dispersione sul quale pongo sull’asse delle X la variabile indipendente e su quella delle Y la variabile

dipendente. Tracciando le coordinate (X;Y) per ogni coppia, segniamo sul piano un punto e l’insieme di questi

rappresenterà la modalità di covariazione tra le due variabili.

MATRIMONI:

Diagramma di Dispersione

Numero di matrimoni nei dieci anni tra il 2000 e il 2009 sono variati in modo lineare?

x 2000 (1) 2001 2002 2003 2004 2005 2006 2007 2008 2009 (10)

(2) (3) (4) (5) (6) (7) (8) (9)

y 284410 264026 270013 264097 248969 247740 245992 250360 246613 230613

! 4

350000 y = -4605,3x + 280612

320000

290000

260000

230000 0 3 5 8 10

! La variabile indipendente X che rappresenta gli anni è stata descritta con dei numeri naturali da 1 a 10.

Retta di Regressione

Quando stimiamo la relazione lineare fra una variabile dipendente Y e una variabile indipendente X,

regrediamo Y rispetto ad X, producendo una relazione lineare bivariata o una regressione bivariata, in termini

algebrici: Y= a+bX

Dove Y (ordinata) coincide alla somma di una costante a (che corrisponde al punto in cui la retta intercetta

l’asse verticale, ovvero il valore di Y quando X=0) più il valore di b (il gradiente, cioè l’inclinazione della retta)

moltiplicato per X.

I ricercatori sociali di norma presuppongono che le variabili siano correlate in modo lineare a meno che non sia

evidente l’esistenza do una correlazione non lineare, come nel caso di una curva gaussiana o logaritmica.

Il punto di partenza è un’equazione predittiva, nella quale ad ogni valore di X (v. indipendente) ne corrisponde

una di Y (v. dipendente):

= a +

Tuttavia i dati analizzati dai ricercatori sociali non sono mai delle perfette relazioni lineari, bisogna perciò

valutare l’esistenza di un errore (detto anche residuo), che misura la discrepanza fra i valori osservati di Y e

quelli attesi in base all’equazione di regressione lineare.

L’errore è detto “residuo” in quanto rappresenta la quantità che rimane dopo aver sottratto l’equazione

predittiva dal modello di regressione lineare:

- = [a + + ] – [a + ] =

Coefficiente di Regressione

L’analisi di regressione stima i valori di a e b utilizzando i dati osservati. Compito del modello è minimizzare i

residui. ! 5

Il criterio dei minimi quadrati:

Esso permette di stimare l’equazione; secondo questo criterio (OLS → stima dei minimi quadrati comuni) la

somma delle differenze al quadrato deve essere minima.

La stima dei minimi quadrati per il coefficiente di regressione bivariata è calcolata come:

L’intercetta si può ricavare dall’equazione predittiva dopo aver trovato : a = -

Per poter effettuare tutti i calcoli si può costruire una tabella, come quella che segue, che contiene tutte lòe

informazioni necessarie per calcolare e a. X = 5,5 Y = 255283,3

( - M(x)) ( - M(y)) ( - M(x)) ( - M(y)) ( - M(x) ( - M(y)

-4,5 29126,7 -131070,15 20,25 848364652,90

-3,5 8742,7 -30599,45 12,25 76434803,29

-2,5 14729,7 -36824,25 6,25 216964062,10

-1,5 8813,7 -13220,55 2,25 77681307,69

-0,5 -6314,3 3157,15 0,25 39870384,49

0,5 -7543,3 -3771,65 0,25 56901374,89

1,5 -9291,3 -13936,95 2,25 86328255,69

2,5 -4923,3 -12308,25 6,25 24238882,89

3,5 -8670,3 -30346,05 12,25 75174102,09

4,5 -24670,3 -111016,35 20,25 608623702,10

( - M(y) = 2110581528

= 82,50

Nel nostro caso:

= = - 4605,29 [INCLINAZIONE DELLA RETTA DI REGRESSIONE]

a = 255283,3 – (- 4605,29 * 5,5) = 255283,3 – ( - 25329,09) =

= 280612,39 [PUNTO IN CUI LA RETTA DI REGRESSIONE TOCCA L’ASSE Y CON X = 0]

Inoltre:

Il numeratore di diviso per N-1 determina la covarianza indicata come :

! 6

= = = = - 42215,16

Il denominatore di diviso per N-1 determina la varianza di X, indicata come :

= = = = 9,16

Dato che N-1 appare nel denominatore di covarianza e varianza campionaria questo viene eliminato nel

rapporto tra le due il quale risulta uguale a . Dunque lo stimatore può anche essere espresso come:

Per determinare la forza della covariazione scomponiamo gli effetti:

Dove:

= Esprime la differenza tra osservazione e valore atteso:

= Esprime la parte di valore osservato attribuibile alla relazione lineare tra Y e X.

COEFFICIENTE DI DETERMINAZIONE

Un modo per determinare la forza della covariazione tra due variabili è misurare la vicinanza tra i valori

osservati e quelli prodotti dalla retta di regressione stimata.

La variazione di Y è dovuta sia all’effetto esercitato da X sia dall’errore causale; possiamo dividere la somma

dei quadrati totale in una componente sistematica ed in una casuale.

Se vogliamo conoscere la quota di variazione attribuibile al modello di regressione:

= =

Quindi →

Nel nostro caso:

= = = 234509058,7

= = 0,83

Possiamo dunque affermare che la variabile Y è influenzata per l’83% dalla variabile X, quindi l’83% della

variazione osservata nel numero dei matrimoni è data dallo scorrere del tempo.

! 7

COEFFICIENTE DI CORRELAZIONE DI PEARSON

È la radice quadrata del coefficiente di determinazione .

= = 0,91

Se è -1 rappresenta una relazione inversa perfetta tra le variabili, se è uguale a zero indica l’inesistenza di

relazioni e se è uguale a 1 abbiamo una relazione diretta perfetta.

In questo caso abbiamo una relazione diretta non totalmente perfetta; le due variabili hanno una relazione

inversamente proporzionale.

TEST DI SIGNIFICATIVITA’ PER I COEFFICIENTI DI REGRESSIONE

Il test di significatività del coefficiente di determinazione consente di trarre inferenze sulla popolazione a

partire dai dati campionari.

Il test di significatività statistica per fa ricorso alla distribuzione F. La somma dei quadrati della regressione,

essendo stimata a partire da possiede solo un grado di libertà. La somma dei gradi di libertà può essere

suddivisa in due come la somma dei quadrati totali, perciò:

N-1 = 1 + = N-2

Nel nostro caso:

= 10-2 = 8

= * * (N-1) = 0,83 * 234509058,7 * 9 = 1751782668

* (N-1) = 234509058,7 * 9 = 2110581528

= * = 0,83 * 2110581528 = 1751782668]

- 2110581528 – 1751782668 = 358798860

= = 44849857,50

= = = 39,06

Poniamo α = 0,01, in quanto un α “piccolo” riduce le possibilità di errore.

Il valore critico è 11,26. Essendo F superiore a questo valore il test di significatività può dirsi convalidato.

! 8

CONCLUSIONE

Dopo questa analisi è possibile notare che in Italia tra il 2000 e il 2009 c’è stato un decremento lineare nel

numero dei matrimoni (col procedere degli anni il numero dei matrimoni diminuisce progressivamente, ossia le

due variabili sono correlate inversamente). Come postulato da questa relazione quindi il numero dei matrimoni

è correlato con lo scorrere degli anni e probabilmente ciò è anche determinato da una cambiamento sociale che

prevede percorsi di studi più lunghi, maggiori possibilità di carriera soprattutto per le donne e media di

lunghezza della vita più alta, senza contare che molte coppie optano per un’unione di fatto invece di scegliere la

via matrimoniale. Per tutte queste ragioni probabilmente le persone tendono a posticipare negli anni la

decisione di sposarsi e costruire una famiglia o addirittura decide di rinunciarvi.

Essendo il coefficiente di correlazione vicino ad 1 possiamo vedere che questo legame tra variabili è forte, tesi

confermata anche dal test di significatività, ben maggiore del valore critico.

SEPARAZIONI:

Diagramma di Dispersione

Numero di separazioni nei dieci anni tra il 2000 e il 2009 sono variati in modo lineare?

x 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)

y 71969 75890 79642 81744 83179 82291 80407 81359 84165 85945

! 9

90000

85000

80000

75000

70000 0 1 2 3 4

! La variabile indipendente X che rappresenta gli anni è stata descritta con dei numeri naturali da 1 a 10.

Retta di Regressione

Quando stimiamo la relazione lineare fra una variabile dipendente Y e una variabile indipendente X,

regrediamo Y rispetto ad X, producendo una relazione lineare bivariata o una regressione bivariata, in termini

algebrici: Y= a+bX

Dove Y (ordinata) coincide alla somma di una costante a (che corrisponde al punto in cui la retta intercetta

l’asse verticale, ovvero il valore di Y quando X=0) più il valore di b (il gradiente, cioè l’inclinazione della retta)

moltiplicato per X.

I ricercatori sociali di norma presuppongono che le variabili siano correlate in modo lineare a meno che non sia

evidente l’esistenza do una correlazione non lineare, come nel caso di una curva gaussiana o logaritmica.

Il punto di partenza è un’equazione predittiva, nella quale ad ogni valore di X (v. indipendente) ne corrisponde

una di Y (v. dipendente):

= a +

Tuttavia i dati analizzati dai ricercatori sociali non sono mai delle perfette relazioni lineari, bisogna perciò

valutare l’esistenza di un errore (detto anche residuo), che misura la discrepanza fra i valori osservati di Y e

quelli attesi in base all’equazione di regressione lineare.

L’errore è detto “residuo” in quanto rappresenta la quantità che rimane dopo aver sottratto l’equazione

predittiva dal modello di regressione lineare:

- = [a + + ] – [a + ] =

Coefficiente di Regressione ! 10

L’analisi di regressione stima i valori di a e b utilizzando i dati osservati. Compito del modello è minimizzare i

residui.

Il criterio dei minimi quadrati:

Esso permette di stimare l’equazione; secondo questo criterio (OLS → stima dei minimi quadrati comuni) la

somma delle differenze al quadrato deve essere minima.

La stima dei minimi quadrati per il coefficiente di regressione bivariata è calcolata come:

L’intercetta si può ricavare dall’equazione predittiva dopo aver trovato : a = -

Per poter effettuare tutti i calcoli si può costruire una tabella, come quella che segue, che contiene tutte lòe

informazioni necessarie per calcolare e a. X = 5,5 Y = 80659,10

( - M(x)) ( - M(y)) ( - M(x)) ( - M(y)) ( - M(x) ( - M(y)

-4,5 -8690,10 39105,45 20,25 74116602,81

-3,5 -4769,10 16691,85 12,25 22744314,81

-2,5 -1017,10 2542,75 6,25 1034492,41

-1,5 1084,90 -1627,35 2,25 1177008,01

-0,5 2519,90 -1259,95 0,25 6349896,01

0,5 1631,90 815,95 0,25 2663097,61

1,5 -252,10 -378,15 2,25 63554,41

2,5 699,90 1749,75 6,25 489860,01

3,5 3505,90 12270,65 12,25 12291334,81

4,5 5285,90 23786,55 20,25 27940738,81

93697,50 ( - M(y) = 148870899,70

= 82,50

Nel nostro caso:

= = 1135,73 [INCLINAZIONE DELLA RETTA DI REGRESSIONE]

a = 80659,10 – (1135,73 * 5,5) = 80659,10 – 6246,52 = 74412,58

[PUNTO IN CUI LA RETTA DI REGRESSIONE TOCCA L’ASSE Y CON X = 0]

! 11

Inoltre:

Il numeratore di diviso per N-1 determina la covarianza indicata come :

= = = = 10410,83

Il denominatore di diviso per N-1 determina la varianza di X, indicata come :

= = = = 9,16

Dato che N-1 appare nel denominatore di covarianza e varianza campionaria questo viene eliminato nel

rapporto tra le due il quale risulta uguale a . Dunque lo stimatore può anche essere espresso come:

Per determinare la forza della covariazione scomponiamo gli effetti:

Dove:

= Esprime la differenza tra osservazione e valore atteso:

= Esprime la parte di valore osservato attribuibile alla relazione lineare tra Y e X.

COEFFICIENTE DI DETERMINAZIONE

Un modo per determinare la forza della covariazione tra due variabili è misurare la vicinanza tra i valori

osservati e quelli prodotti dalla retta di regressione stimata.

La variazione di Y è dovuta sia all’effetto esercitato da X sia dall’errore causale; possiamo dividere la somma

dei quadrati totale in una componente sistematica ed in una casuale.

Se vogliamo conoscere la quota di variazione attribuibile al modello di regressione:

= =

Quindi →

Nel nostro caso:

= = = 16541211,08 ! 12

= = 0,72

Possiamo dunque affermare che la variabile Y è influenzata per l’72% dalla variabile X, quindi l’72% della

variazione osservata nel numero delle separazioni è data dallo scorrere del tempo.

COEFFICIENTE DI CORRELAZIONE DI PEARSON

È la radice quadrata del coefficiente di determinazione .

= = 0,84

Se è -1 rappresenta una relazione inversa perfetta tra le variabili, se è uguale a zero indica l’inesistenza di

relazioni e se è uguale a 1 abbiamo una relazione diretta perfetta.

In questo caso abbiamo una relazione diretta non totalmente perfetta; le due variabili hanno una relazione

direttamente proporzionale.

TEST DI SIGNIFICATIVITA’ PER I COEFFICIENTI DI REGRESSIONE

Il test di significatività del coefficiente di determinazione consente di trarre inferenze sulla popolazione a

partire dai dati campionari.

Il test di significatività statistica per fa ricorso alla distribuzione F. La somma dei quadrati della regressione,

essendo stimata a partire da possiede solo un grado di libertà. La somma dei gradi di libertà può essere

suddivisa in due come la somma dei quadrati totali, perciò:

N-1 = 1 + → = N-2

Nel nostro caso:

= 10-2 = 8

= * * (N-1) = 0,72 * 16541211,08 * 9 = 107187047,80

* (N-1) = 16541211,08 * 9 = 148870899,70

[= * = 0,72* 148870899,70 = 107187047,80]

- 148870899,70 – 107187047,80 = 41683851,90

= = 5210481,49

= = = 20,57

Poniamo α = 0,01, in quanto un α “piccolo” riduce le possibilità di errore.

! 13

Il valore critico è 11,26. Essendo F superiore a questo valore il test di significatività può dirsi convalidato.

CONCLUSIONE

Dopo questa analisi è possibile notare che in Italia tra il 2000 e il 2009 c’è stato un incremento lineare nel

numero delle separazioni (col procedere degli anni il numero delle separazioni aumenta, ossia le due variabili

sono correlate inversamente). Come postulato da questa relazione quindi il numero delle separazioni è correlato

con lo scorrere degli anni.

Essendo il coefficiente di correlazione vicino ad 1 possiamo vedere che questo legame tra variabili è forte, tesi

confermata anche dal test di significatività, ben maggiore del valore critico.

DIVORZI:

Diagramma di Dispersione ! 14

Numero di divorzi nei dieci anni tra il 2000 e il 2009 sono variati in modo lineare?

x 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)

y 37573 40051 41835 43856 45097 47036 49534 50669 54351 54456

60000

45000

30000

15000

0 0 1 2 3 4

! La variabile indipendente X che rappresenta gli anni è stata descritta con dei numeri naturali da 1 a 10.

Retta di Regressione

Quando stimiamo la relazione lineare fra una variabile dipendente Y e una variabile indipendente X,

regrediamo Y rispetto ad X, producendo una relazione lineare bivariata o una regressione bivariata, in termini

algebrici: Y= a+bX

Dove Y (ordinata) coincide alla somma di una costante a (che corrisponde al punto in cui la retta intercetta

l’asse verticale, ovvero il valore di Y quando X=0) più il valore di b (il gradiente, cioè l’inclinazione della retta)

moltiplicato per X.

I ricercatori sociali di norma presuppongono che le variabili siano correlate in modo lineare a meno che non sia

evidente l’esistenza do una correlazione non lineare, come nel caso di una curva gaussiana o logaritmica.

Il punto di partenza è un’equazione predittiva, nella quale ad ogni valore di X (v. indipendente) ne corrisponde

una di Y (v. dipendente):

= a +

Tuttavia i dati analizzati dai ricercatori sociali non sono mai delle perfette relazioni lineari, bisogna perciò

valutare l’esistenza di un errore (detto anche residuo), che misura la discrepanza fra i valori osservati di Y e

quelli attesi in base all’equazione di regressione lineare.

L’errore è detto “residuo” in quanto rappresenta la quantità che rimane dopo aver sottratto l’equazione

predittiva dal modello di regressione lineare: ! 15

- = [a + + ] – [a + ] =

Coefficiente di Regressione

L’analisi di regressione stima i valori di a e b utilizzando i dati osservati. Compito del modello è minimizzare i

residui.

Il criterio dei minimi quadrati:

Esso permette di stimare l’equazione; secondo questo criterio (OLS → stima dei minimi quadrati comuni) la

somma delle differenze al quadrato deve essere minima.

La stima dei minimi quadrati per il coefficiente di regressione bivariata è calcolata come:

L’intercetta si può ricavare dall’equazione predittiva dopo aver trovato : a = -

Per poter effettuare tutti i calcoli si può costruire una tabella, come quella che segue, che contiene tutte lòe

informazioni necessarie per calcolare e a. X = 5,5 Y = 46445,8

( - M(x)) ( - M(y)) ( - M(x)) ( - M(y)) ( - M(x) ( - M(y)

-4,5 -8872,80 39105,45 20,25 78726579,84

-3,5 -6394,80 16691,85 12,25 40893467,04

-2,5 -4610,80 2542,75 6,25 21259476,64

-1,5 -2589,80 -1627,35 2,25 6707064,04

-0,5 -1348,80 -1259,95 0,25 1819261,44

0,5 590,20 815,95 0,25 348336,04

1,5 3088,20 -378,15 2,25 9536979,24

2,5 4223,20 1749,75 6,25 17835418,24

3,5 7905,20 12270,65 12,25 62492187,04

4,5 8010,20 23786,55 20,25 64163304,04

157595 ( - M(y) = 303782073,60

= 82,50

Nel nostro caso: ! 16

= = 1910,24 [INCLINAZIONE DELLA RETTA DI REGRESSIONE]

a = 46445,8 – (1910,24 * 5,5) = 46445,8 – 10506,32 = 35939,48

[PUNTO IN CUI LA RETTA DI REGRESSIONE TOCCA L’ASSE Y CON X = 0]

Inoltre:

Il numeratore di diviso per N-1 determina la covarianza indicata come :

= = = = 17510,56

Il denominatore di diviso per N-1 determina la varianza di X, indicata come :

= = = = 9,16

Dato che N-1 appare nel denominatore di covarianza e varianza campionaria questo viene eliminato nel

rapporto tra le due il quale risulta uguale a . Dunque lo stimatore può anche essere espresso come:

Per determinare la forza della covariazione scomponiamo gli effetti:

Dove:

= Esprime la differenza tra osservazione e valore atteso:

= Esprime la parte di valore osservato attribuibile alla relazione lineare tra Y e X.

COEFFICIENTE DI DETERMINAZIONE

Un modo per determinare la forza della covariazione tra due variabili è misurare la vicinanza tra i valori

osservati e quelli prodotti dalla retta di regressione stimata.

La variazione di Y è dovuta sia all’effetto esercitato da X sia dall’errore causale; possiamo dividere la somma

dei quadrati totale in una componente sistematica ed in una casuale.

Se vogliamo conoscere la quota di variazione attribuibile al modello di regressione:

! 17

= =

Quindi →

Nel nostro caso:

= = = 33753563,73

= = 0,99

Possiamo dunque affermare che la variabile Y è influenzata per l’99% dalla variabile X, quindi l’99% della

variazione osservata nel numero dei divorzi è data dallo scorrere del tempo.

COEFFICIENTE DI CORRELAZIONE DI PEARSON

È la radice quadrata del coefficiente di determinazione .

= = 0,99

Se è -1 rappresenta una relazione inversa perfetta tra le variabili, se è uguale a zero indica l’inesistenza di

relazioni e se è uguale a 1 abbiamo una relazione diretta perfetta.

In questo caso abbiamo una relazione diretta quasi perfetta; le due variabili hanno una relazione direttamente

proporzionale.

TEST DI SIGNIFICATIVITA’ PER I COEFFICIENTI DI REGRESSIONE

Il test di significatività del coefficiente di determinazione consente di trarre inferenze sulla popolazione a

partire dai dati campionari.

Il test di significatività statistica per fa ricorso alla distribuzione F. La somma dei quadrati della regressione,

essendo stimata a partire da possiede solo un grado di libertà. La somma dei gradi di libertà può essere

suddivisa in due come la somma dei quadrati totali, perciò:

N-1 = 1 + → = N-2

Nel nostro caso:

= 10-2 = 8

= * * (N-1) = 0,99 * 33753563,73 * 9 = 300744252,80

* (N-1) = 33753563,73 * 9 = 303782073,60

[= * = 0,99 * 303782073,60 = 300744252,80]

- 303782073,60 – 300744252,80 = 3037820,80 ! 18

= = 379727,60

= = = 791,99

Poniamo α = 0,01, in quanto un α “piccolo” riduce le possibilità di errore.

Il valore critico è 11,26. Essendo F superiore a questo valore il test di significatività può dirsi convalidato.

CONCLUSIONE

Dopo questa analisi è possibile notare che in Italia tra il 2000 e il 2009 c’è stato un incremento lineare nel

numero dei divorzi (col procedere degli anni il numero dei divorzi aumenta, ossia le due variabili sono correlate

inversamente). Come postulato da questa relazione quindi il numero delle separazioni è correlato con lo

scorrere degli anni.

Essendo il coefficiente di correlazione estremamente vicino ad 1 possiamo osservare che questo legame tra

variabili è molto forte (si tratta di una relazione diretta quasi perfetta), tesi confermata anche dal test di

significatività, ben maggiore del valore critico. ! 19

INFLUENZA DELLA SITUAZIONE SOCIO-ECONOMICA DELLE FAMIGLIE SULLA DECISIONE

DEI CONIUGI DI SEPARARSI

Per lo studio di questo punto utilizzeremo l’analisi della regressione e correlazione.

Con questo tipo di analisi si mettono in relazione coppie di variabili continue, ciò presuppone che la relazione

fra le variabili Y e X sia di tipo lineare e che la variabile dipendente Y sia distribuita normalmente ad ogni

livello della variabile indipendente X. Il primo passo da svolgere è la realizzazione del diagramma di

dispersione sul quale pongo sull’asse delle X la variabile indipendente e su quella delle Y la variabile

dipendente. Tracciando le coordinate (X;Y) per ogni coppia, segniamo sul piano un punto e l’insieme di questi

rappresenterà la modalità di covariazione tra le due variabili.

Diagramma di Dispersione

Quanto la situazione socio-economica influisce sulla decisione di porre fine al matrimonio?

REGIONE VALORI SOGLIA DI N° SEPARAZIONI

POVERTA' CONCESSE

Piemonte 117626 7734

Valle d'Aosta 3629 217

Lombardia 184581 14920

Liguria 37159 2955

Trentino Alto Adige 35647 1360

Veneto 87292 6565

Friuli Venezia-Giulia 42633 1954

Emilia Romagna 78199 6382

Toscana 87431 5461

Umbria 19599 1187

Marche 44266 1942

Lazio 136263 10360

Molise 22599 344

Campania 518171 6940

Puglia 316730 4861

Basilicata 56746 423

Calabria 208735 1745

Sicilia 476386 6694

Sardegna 143434 2039

! 20


PAGINE

41

PESO

305.10 KB

PUBBLICATO

+1 anno fa


DETTAGLI
Corso di laurea: Corso di laurea in scienze psicologiche
SSD:
Università: Bergamo - Unibg
A.A.: 2012-2013

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher A.Beretti di informazioni apprese con la frequenza delle lezioni di Statistica sociale e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Bergamo - Unibg o del prof Carra Natale.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Statistica sociale

Statistica sociale
Appunto
Statistica Sociale - Tesina
Appunto