Che materia stai cercando?

Genetica umana

Appunti di genetica umana sui seguenti argomenti: anomalie cromosomiche, mutazioni, eredità, caratteri multifattoriali, mutazioni, malattie metabolismo, genetica di popolazione, sistema ABO e malattie, genetica del cancro. Scarica il file in formato PDF!

Esame di Genetica umana docente Prof. E. Baruffini

Anteprima

ESTRATTO DOCUMENTO

Genetica Umana

si verifica, almeno per quanto concerne l'uomo, nei gemelli dizigotici (le differenti cellule hanno un'origine

dizigotica) e riguarda essenzialmente la presenza di globuli rossi maschili nel gemello di sesso femminile e

viceversa. Caratteri multifattoriali

Molti caratteri sono determinati non solo da un gene ma da più fattori e il fenotipo finale dipende sia dalla

sequenza dei geni come dall’ambiente e dall’epigenetica.

Per caratteri multigenici (o poligenici) si indendono quei caratteri che sono determinati da due o più geni,

spesso sono caratteri complessi (quantitativi) influenzati sia dai geni che da fattori ambientali ed epigenetici.

Si parla di variazione discontinua dei caratteri per descrivere la presenza di caratteri ben distinti

fenotipicamente e non sovrapponibili (caratteri qualitativi, dicotomici), mentre si parla di variazione continua

dei caratteri per descrivere la distribuzione del fenotipo fra due estremi con variazioni graduali (caratteri

quantitativi).

I caratteri multigenici posso avere influenza di due, tre o più geni.

Per quanto riguarda i caratteri multifattoriali non vi è regressione verso la media, anche se per piccoli gruppi

non è apprentemente così. Ad esempio altezza e QI, caratteri multifattoriali, presentano una distribuzione

gaussiana mentre il colore della pella presenta un modello con variazione discontinua a tratti.

Il fenotipo è l’insieme delle caratteristiche di un individuo ed è determinato dal genotipo, dall’ambiente e

dall’interazione fra ambiente e genotipo.

Il genotipo dell’individuo rappresenta la sua costituzione genetica ed è immutabile (a meno di mutazioni),

l’ambiente in cui si trova l’individuo indica tutti i fattori che possono influenzare le caratteristiche fenotipiche

finali di un individuo (fattori epigenetici, tramite i quali l’ambiente è in grado di alterare l’espressione genica di

un determinato gene, fattori sociali, fisici e fattori generici non direttamente legati al fenotipo sotto indagine).

I caratteri multifattoriali sono multigenici e o geni responsabili del carattere agiscono in maniera additiva, cioè

ognuno contribuisce in piccola parte al fenotipo, non necessariamente in maniera uguale. In alcuni casi

l’azione è sinergica, cioè gli effetti sono maggiori rispetto agli effetti additivi, oppure antagonista, nel caso in

cui gli effetti siano minori rispetto a quelli additivi.

Per varianza fenotipica si intende la varianza complessiva del fenotipo (Vf) ed è data da:

Vf = Vg + Va

Dove Vg è la varianza genetica (varianza del fenotipo dovuta al genotipo) e Va è la varianza ambientale

(varianza del fenotipo dovuta all’ambiente).

L’ereditabilità in senso ampio (H^2) è la varianza fenotipica che dipende dalla variabilità genetica.

H = Vg / Vf

2

Questo valore è sempre compreso fra 0 e 1.

L’ereditabilità in senso ampio ci dice quanto di un fenotipo sia dovuto all’ambiente e quanto al genotipo. Per

quanto riguarda il genotipo ci dice che una specifica percentuale delle differenze fenotipiche siano dovute a

differenze genotipiche, ma non ci dice nulla sulle differenze in sè (se sono dovute ad effetti additivi, sinergici

o a fattori di dominanza).

Quando gli effetti di due o più geni risultano ad azione additiva si parla di varianza dovuta ad effetti additivi

(Vad) mentre per varianza dovuta ad effetti dominanti si intende la varianza dovuta alla presenza di un allele

dominante uguale in omozigoti ed eterozigoti (Vd).

La varianza epistatica è dovuta all’interazione epistatica di due o piu geni che si influenzano a vicenda (Ve).

Calcoleremo quindi la varianza genetica come:

Vg = Vad + Vd + Ve

Per epistasi si intende l’interazione genica per cui una coppia di alleli copre gli effetti fenotipici di un’altra

coppia di alleli, il gene che nasconde il fenotipo è detto epistatico mentre l’altro è detto ipostatico.

In caso di epistasi dominante A (ma non a) è epistatico su B e b, per cui il fenotipo determinato da A

nasconde il fenotipo determinato da B o b. I soggetti AA o Aa hanno lo stesso fenotipo indipendentemente

dal fatto che siano BB, Bb o bb. 15

Genetica Umana

In caso di epistasi recessiva il genotipo aa (ma non il genotipo Aa o AA) è epistatico su B e b, per cui il

fenotipo recessivo osservato in aa nasconde il fenotipo deterinato da B o b. I soggetti aa avranno lo stesso

fenotipo indipendentemente dal fatto che siano BB, Bb o bb (come accade per albinismo).

Ritornando alla formula della varianza genetica abbiamo:

Vg = Vad + Vd + Ve

V. genetica = v. dovuta ad ef. additivi + v. dovuta ad ef. dominanti + v. epistatica

Da cui: Vf = Va + Vad + Vd + Ve

V. complessiva = v. ambientale + v. dovuta ad ef. additivi + v. dovuta ad ef. dominanti + v. epistatica

Solo la varianza dovuta ad effetti additivi (Vad) può permettere di predire quale variabilità si avrà, da cui

l’ereditabilità in senso stretto (H^2) diventa: H = Vad / Vf

2

Sempre con H^2 compreso fra 0 e 1.

L’ereditabilità in senso stretto può essere utilizzata per predire un fenotipo quantitativo nella progenie, con

molta attenzione e non scordandosi mai la varianza.

To = μ + b [(Tm + Tf) / 2 - μ]

2

Dove To è il valore di un carattere quantitativo nella progenie (O di offspring), μ è il valore medionella

popolazione, Tm e Tf sono i valori presenti rispettivamente nella madre e nel padre.

[(Tm+Tf)/2] è il valore medio parentale, espresso anche come Tp, da cui:

To = μ + b (Tp - μ)

2

Aspetti pratici: lo studio dei gemelli

Il contributo quantitativo dato dai geni e dall’ambiente può essere osservato mediante lo studio dei gemelli.

Vi sono due tipi di gemelli: i gemelli monozigoti (MZ) hanno lo stesso fenotipo e si sono formati grazie ad un

singolo evento di fecondazione che ha portato alla formazione di due embrioni geneticamente identici. i

gemetti dizigoti (DZ) hanno mediamente in comune il 50% del genotipo (come i fratelli) e si sono formati

grazie a due eventi indipendenti di fecondazione che hanno portato alla formazione di due embrioni con

circa il 50% dei geni in comune.

L’effetto dell’ambiente può essere calcolato empiricamente basandsi sul fatto che i gemelli monozigoti hanno

lo stesso genotipo e vivono nello stesso ambiente (con qualche eccezione), mentre i gemelli dizigoti non

hanno lo stesso fenotipo e vivono nello stesso ambiente.

Si introduce quindi un coefficiente di correlazione (r) che prevede valori compresi fra -1 e 1:

r = ∑[(X - X )(Y - Y )] / [(n - 1)s s ]

k medio k medio x y

Se r < 0 vi è una correlazione negativa (casistica molto rara), se r = 0 non vi è nessuna correlazione e se r >

0 vi è una correlazione positiva.

Questa differenza spiega gli effetti dovuti all’ambiente: una correlazione positiva è indice che vi è

associazione diretta fra le variabili, una correlazione negativa denota che l’associazione fra le varibili è

inversa mentre una correlazione pari a 0 indica che non si osserva associazione fra le variabili.

Per concordanza si intende la presenza in entrambi i gemelli di uno stesso carattere. Considerando che i

gemelli monozigoti (MZ) hanno il 100% del genotipo in comune, mentre i gemelli dizigoti (DZ) mediamente il

50%, la concordanza sarà di 1.00 negli MZ e dello 0.50 negli DZ (se il carattere è determinato solo

geneticamente). Maggiore è la differenza di concordanza tra MZ e DZ maggiore sarà l’ereditabilità e se nei

gemelli monozigoti la concordanza è molto inferiore a 1.00 l’influenza dell’ambiente è forte, quindi minore è

la concordanza e maggiore è l’effetto dei fattori ambientali.

Per i caratteri quantitativi la concordanza coincide col coefficiente di correlazione.

Molto importante è lo studio dei caratteri legati a gemelli separati alla nascita e dunque cresciuti in ambienti

diversi.

Per gemelli monozigoti separati (MZA) il valore teorico del coefficiente di correlazione (r) sarà: H

2

(coincide con ereditabilità). 16

Genetica Umana

Per gemelli monozigoti cresciuti insieme (MZT) il valore teorico del coefficiente di correlazione (r) sarà: H +

2

C (ereditabilità + ambientabilità).

2

Per gemelli dizigoti separati (DZA) il valore teorico del coefficiente di correlazione (r) sarà:

(1/2) h + D

2 2

Per soggetti non imparentatiti cresciuti separatamente (URA) il valore teorico del coefficiente di correlazione

(r) sarà pari a 0, mentre per soggetti non imparentati cresciuti insieme il valore teorico del coefficiente di

correlazione (r) sarà uguale a C (ambientabilità).

2 Caratteri multifattoriali: peso corporeo

Il peso corporeo è un carattere sia multifattoriale che poligenico, diversi geni influenzano il peso corporeo:

- OB (LP): codifica per una proteina, la leptina, che funge da ormone che regola la sazietà. La proteina è

prodotta nel tessuto adiposo e rilasciata nel sangue, nel cervello si lega al suo recettore inibendo lo

stimolo della fame. Se la proteina è ipofunzionale viene meno lo stimolo della sazietà, con conseguenziale

aumento di peso.

- DB (LEPR): codifica per il recettore della leptina

- MC4R e POMC: codifica per una proteina coinvolta nella trasduzione del segnale che inibisce lo stimolo

della fame dopo il legame della leptina al recettore

- E da altri geni non identificati responsabili dell’ereditabilità situati su specifiche bande dei cromosomi 2, 3,

5, 6, 7, 10, 11, 17 e 20.

Mutazioni di LP, LEPR, MC4R e POMC sono responsabili di circa il 5% dell’ereditabilità, gli altri loci non

ancora identificati dovrebbero essere responsabili del 90% dell’ereditabilità. In generale questi loci spesso

non identificati sono detti QTL (quantitative trait loci).

Caratteri multifattoriali: altezza

Almeno 50 geni sono coinvolti nella determinazione dell’altezza e il contributo dato da ogni coppia genica è

diverso. L’altezza è influenzata da mutazioni presenti in questi geni, che influenzano l’altezza finale della

persona e spesso questa mutazioni determinano ciascuna piccoli cambiamenti (SNP = single nucleotide

polymorphism).

La mutazione di alcuni geni, come ad esempio del gene HMGA2, altera significativamente l’altezza. Questo

gene, che codifica per un fattore di trascrizione, può andare incontro a mutazioni di stop (accorciano la

proteina) oppure ad un’inversione cromosomica che porta alla formazione di una proteina accorciata,

causando in entrambi i casi forme di gigantismo.

L’ereditabilità per l’altezza è di circa 0.80, ma solo lo 0.05% si spiega con i geni noti essere coinvolti nella

determinazione di questa. Caratteri multifattoriali: colore della pelle

All’inizio del ‘900 si fecero diversi studi per analizzare questo carattere multifattoriale.

Si incrociarono un genitore bianco con uno nero (P1) e si notò che nella F1 si osservavano tre fenotipi,

mentre nella F2 ben cinque. Si pensava che fossero coinvolti due geni: fenotipo 0 aabb, fenotipo 1 Aabb e

aabb, fenotipo 2 Aabb, AaBb e aaBB, fenotipo 3 AABb e AaBB, fenotipo 4 AABB (modello superato).

Successivamente si analizzò il colore della pelle in F2 con un genitore nero e uno bianco in F0 grazie all’uso

di un rifrattometro, i dati empirici supportavano il modello in cui sono coinvolti 3 o 4 coppie di geni per la

definizione del carattere colore della pelle.

Caratteri multifattoriali: malattie ed effetto soglia

Molte malattie sono caratteri poligenici e multifattoriali, e la presenza e l’intensità dei sintomi in questo caso

non seguono la gentica mendeliana. Per suscettibilità si intende la probabilità variabile di sviluppare un certo

carattere o una certa malattia, segue una distribuzione gaussiana nella popolazione mentre per soglia si

intende il valore della curva gaussiana sopra il quale si sviluppa la malattia e spesso è diversa nei sessi. 17

Genetica Umana

Conoscere la suscettibilità e il valore della soglia è molto importante per la consulenza genica, che in questo

caso si basa su rischi empirici. Vi sono alcuni fattori che influenzano la predizione:

- consanguineità: genitori consanguinei hanno una maggiore probabilità di avere figli affetti da malattie

multifattoriali, tanto è maggiore il grado di parentela tanto è maggiore l’ereditabilità.

- presenza di un figlio affetto: se un figlio (o più) sono affetti vi è una maggiore probabilità che un nuovo

figlio sia affetto. Maggiore è il numero di figli affetti, maggiore è l’ereditabilità e la vicinanza dei genotipi dei

genitori alla soglia.

- gravità della malattia: maggiore è la gravità dei sintomi in un figlio, maggiore è la probabilità che un

secondo figlio sia affetto, in quanto i genotipi dei genitori sono probabilmente vicini all’effetto soglia (il

primo figlio è molto al di là della soglia).

- maggiore frequenza di una malattia in un sesso: se è noto che una malattia multifattoriale colpisca più un

sesso piuttosto che l’altro, se il nascituro sarà di quel sesso l’effetto soglia è spostato verso sinistra

(maggiore probabilità che sviluppi la malattia).

Una malattia con effetto soglia è la Palatoschisi, malformazione del palato che si presenta come una

fenditura più o meno estesa della parte anteriore del palato duro. Ha un ereditabilità di 0.10 e si presenta

con una frequenza di 1 individuo affetto su 1000 (colpisce più le femmine).

I principali problemi per i soggetti affetti riguardano l’alimentazione, lo sviluppo alterato del linguaggio e un

alto rischi di infezioni broncopolmonari con una riduzione dell’aspettativa di vita.

Il piede equino (o equinismo) è una malattia con effetto soglia che causa una deformità in cui l’asse del

piede forma con l’asse della gamba un angolo superiore all’angolo retto. La punta del piede tende ad essere

rivolta verso il basso e la deambulazione avverrà con l’appoggio della punta al terreno. Ha un ereditabilità di

0.10/0.20 e si presenta con una frequenza di 1 soggetto affetto su 1000.

Genetica del sesso

Sebbene il sesso sia determinato nell’uomo dalla presenza del cromosoma Y o meno, il sesso cromosomico

può non coincidere con il sesso fenotipico, in seguito a particolari mutazioni geniche.

Il cromosoma X è lungo circa 150 milioni di paia base, sono presenti circa 2000 geni predetti di cui

1400/1500 con funzione nota.

Il cromosoma Y è lungo circa 57 milioni di paia base, sono presenti secondo le conoscenze attuali circa 200

geni predetti, di cui soli 50/60 con funzione nota dei quali 17 sono geni pseudoautosomici. Gran parte del

cromosoma Y (nel braccio Q) è non codificante e si trova sotto forma di eterocromatina. Il cromosoma Y è

responsabile della determinazione del sesso, se manca si ha il sesso femminile mentre se è presente si ha il

sesso maschile. I cromosomi X e Y umani presentano diverse regioni di omologia, indice di un’origine

evolutiva comune, e presentano entrambi regioni psudoautosomiche chiamate PAR.

La PAR1 è situata all’estremità dei bracci corti di X e Y, è lunga circa 2.6 Mbp e contiene 13/16 geni attivi che

non hanno a che vedere con lo sviluppo del sesso. Nelle cellule germinali maschili vi è crossing over

obbligatorio fra le due regioni su X e Y, per cui lo scambio di geni è prossimo al 50% (10 volte più elevato

rispetto alla frequenza di crossing over sugli autosomi). Se non avviene crossing over la meiosi si blocca. La

PAR2 è situata all’estremità dei bracci lunghi di X e Y, è lunga circa 330 Kbp e contiene 3/4 geni. In questo

caso il crossing over non è obbligatorio.

Infine la PAR3 è situata nei bracci corti a 700 Kbp da PAR1, contiene 2/4 geni attivi ma la lunghezza precisa

di questa regione è sconosciuta.

Le NRY sono classi (non regioni continue) non ricombinanti in presenti sul cromosoma Y.

NRY1 contiene 8/12 geni attivi con omologhi su X, con espressione ampia e non legati allo sviluppo

sessuale. 18

Genetica Umana

NRY2 contiene geni, alcuni presenti in più copie, che non hanno omologhi su X espressi solo nei testicoli e

coinvolti nella spermatogenesi. Questi geni sono:

- TTY1: gene per un ncRNA, ruolo nella spermatogenesi non ancora sicuro.

- TSPY1: gene codificante per una proteina testicolare presente in 35 copie consecutive, il suo ruolo nella

spermatogenesi non è ancora sicuro.

- PRY: gene codificante per una presunta tirosina fosfatasi testicolare presente in due coppie

palindromiche. Il ruolo nella spermatogenesi non è ancora sicuro e la delezione di entrambi i geni non ha

effetti evidenti.

- TTY2: gene per un ncRNA, ruolo nella spermatogenesi non ancora sicuro.

- CDY: gene codificante per una proteina contenente un cromodominio (repressore genico) e un istone

acetiltransferasi (epigenetica). Presente in due copie palindromiche e responsabile dell’iperacetilazione

degli istoni nella tarda fase della spermatogenesi. Mutazioni che rendono la proteina non funzionale

determinano riduzione della fertilità o infertilità.

- XKRY: gene codificante per una proteina di membrana a funzione sconosciuta, ruolo nella

spermatogenesi non ancora sicuro.

- DAZ: codifica per un RNA binding protein fondamentale nella spermatogenesi. Espresso nello

spermatogonio premeiotico e presente in 4 copie. Mutazioni in questo gene danno origine ad

azoaspermia (assenza di spermatozoi).

- BPY2: codifica per un interattore proteina-proteina cinvolto nello sviluppo degli spermatogoni, è presente

in due copie palindromiche e la delezione di entrambe le copie non ha effetti evidenti.

- AZF1: codifica per una proteina a funzione sconosciuta fondamentale nella spermatogenesi, mutazioni in

questo gene sono la causa più frequente di oligospermia o azoazpermia.

NRY3 contiene geni com omologhi su X, con diversa espressione:

- RBMY: presente in 6 copie ed espresso nei testicoli, codifica per una proteina legante l’RNA coivolta nella

spermatogenesi. La delezione di alcune copie non ha effetto sulla spermatogenesi. L’omologo su X

(RBMX) ha espressione in vari tessuti ed ha funzione sconosciuta.

- AMELY: codifica per l’melogenina, una proteina espressa nell’abbozzo dei denti e fondamentale per la

mineralizzazione di questi. L’omologo su X (AMELX) ha la medesima funzione.

- VCY: codifica per una proteina a funzione sconosciuta carica positivamente, espressa solo nei testicoli e

con una presunta funzione nella spermatogenesi. L’omologo su X (VCX) è espresso solo nei maschi,

anch’esso nei testicoli.

- PCDHY: codifica per una protocaderina, espressa nella membrana delle cellule neuronali del cervello,

coinvolta nelle interazioni cellula-cellula del sistema nervoso. L’omologo su X (PCDHX) svolge la stessa

funzione.

- PS4Y1: codifica per la proteina ribosomale S4. L’omologo su X (RPS4X1) svolge la stessa funzione.

La SRY è la regione determinante il sesso, codifica per un fattore di trascrizione responsabile della

determinazione del sesso ed il gene è espresso nelle cellule precursori dei testicoli e successivamente nei

testicoli. Questa regione è fondamentale affinchè un embrione in cui è presente il cromosoma Y si sviluppi in

maschio.

Mutazioni di SRY sono responsabili di diverse malattie, fra cui la disgenesi gonadica completa e la sindrome

di Swyer (malattia con eredità Y-linked). Questa malattia è causata da microdelezioni in SRY che rendono la

proteina non funzionale. I bambini, pur essendo cromosomicamente maschi, non presentano testicoli ma

ovaie non funzionali che possono degenerare in carcinomi. Sono ritenute femmine, hanno utero e tube di

Falloppio ma sterili, anche se possono però in generale ospitare embrioni e portare a termine una

gravidanza. Non producendo ormoni femminili, è necessaria la somministrazione di ormoni femminili per lo

sviluppo dei caratteri sessuali secondari. 19

Genetica Umana

Un’altra malattia causata da mutazioni di SRY è la disgenesi gonadica parziale, altra malattia con eredità Y-

linked causata da mutazioni in SRY che rendono la proteina ipofunzionale. I bambini, pur essendo

cromosomicamente maschi, presentano un’ovaia e un testicolo entrambi non sviluppati completamente e

non funzionali. Sono ritenuti maschi, in quanto in generale hanno un pene ma non producendo ormoni

maschili è necessaria la somministrazione di ormoni per lo sviluppo dei caratteri sessuali secondari.

L’ermafroditismo è causato da mutazioni in SRY, spesso ex novo, e in modo chimerico. Presentano sia ovaie

sia testicoli, in generale parzialmente sviluppati. La causa risiede nella produzione sia di ormoni maschili che

femminili, a seconda della predominanza di tessuto ovarico o testicolare i bambini vengono cresciuti come

femmine o maschi. Durante la pubertà verranno somministrati ormoni maschili o femminili.

Sesso cromosomico, sesso gonadico e sesso fenotipico

Uovo contenente un cromosoma X fecondato con spermatozoo contenente un cromosoma Y genera un

individuo maschile (embrione con cromosomi sessuali XY, sesso genetico). La regione del cromosoma Y di

determinazione del sesso (SRY) induce il differenziamento della gonade indifferenziata in testicolo (sesso

gonadico). I testicoli secernono ormoni mascolinizzanti come il testosterone, un potente androgeno. In

presenza degli ormoni secreti dal testicolo, i tratti genitali ancora indifferenziati e i genitali esterni si

sviluppano in senso maschile (sesso fenotipico).

Uovo contenente un cromosoma X fecondato con spermatozoo contenente un cromosoma X genera un

individuo femminile (embrione con cromosomi sessuali XX, sesso genetico). Assenza del cromosoma Y,

quindi assenza della regione SRY. In mancanza di induzione del differenziamento del testicolo le gonadi

indifferenziate si sviluppano in ovaie e non vengono secreti androgeni (sesso gonadico). In assenza degli

ormoni mascolinizzanti, i tratti genitali ancora indifferenziati e i genitali esterni si sviluppano in senso

femminile (sesso fenotipico). Insensibilità completa agli androgeni

L’insensibilità completa agli androgeni (chiamata anche sindrome CAIS, di Morris o femminilizzazione

testicolare) è dovuta a mutazioni del gene AR, situato sul cromosoma X ed ha un eredità recessiva X-linked.

Il gene codifica per il recettore degli androgeni, nei soggetti XY si produce il prodotto del gene SRY per cui si

ha sviluppo dei testicoli e assenza di apparato riproduttore femminile (sesso cromosomico e gonadico

coincidono). Tuttavia il recettore degli androgeni non è funzionale, per cui non si ha completamento dello

sviluppo maschile. I genitali esterni non si sviluppano in senso maschile, per cui è presente un apparato

esterno femminile. I soggetti avranno quindi sesso fenotipico femminile, ma non avendo un apparato

riproduttore funzionale non hanno mestruazioni e sono sterili.

Pseudoermafrodismo o intersesso gonadico

Questo fenomeno è dovuto a mutazioni in vari geni, fra cui il più comune è HSD17B3 (eredità AR). Il gene

codifica per un enzima che converte il testosterone in diidrotestosterone e inizialmente il sesso cromosomico

non corrisponde con il sesso fenotipico. Il diidrotestosterone è fondamentale per lo sviluppo dei testicoli, per

cui i maschi appaiono come femmine dotati di apparato esterno femminile. Durante la pubertà la presenza di

testosterone modifica parzialmente i genitali in senso maschile e porta allo sviluppo di caratteri secondari

maschili. Rapporto tra sessi (sex ratio)

Alla nascita il rapporto dei sessi non è 1:1 ma di 105 maschi a 100 femmine, questo è dovuto al fatto che gli

embrioni femminili sono più “deboli” e vanno incontro ad aborto spontaneo più frequentemente. Nel periodo

postnatale il rapporto scende circa a 104 maschi per 100 femmine, poichè la mortalità postnatale è

leggermente più alta nei maschi. Con il passare dell’età la differenza si assottiglia a causa di una maggiore

mortalità nei maschi per malattie recessive X-linked e, dopo la pubertà per la tossicità del testosterone

(ipotesi). Nella pubertà aumenta la secrezione di testosterone, da cui l’ipotesi della tossicità di questo. Infatti

20

Genetica Umana

l’aumento di testosterone causa conseguenze comportamentali come aumento di aggressività e

competitività ma anche conseguenze metaboliche come l’aumento dei livelli di LDL e la riduzione dei livelli di

HDL, favorendo l’aterosclerosi e l’insorgenza di infarti. Attorno ai 20/25 anni il sex ratio è 1:1 mentre con

l’aumentare dell’età si sposta a favore delle femmine, le quali presentano una maggiore longevità grazie

anche all’effetto protettore degli estrogeni. Questi, a differenza del testosterone, riducono i livelli di LDL e

aumentano quelli di HDL, con effetti opposti a quelli trattati precedentemente. Inoltre alcuni estrogeni hanno

effetti antiossidanti e determinano una riduzione dei danni ossidativi al DNA.

Evoluzione dei cromosomi sessuali

Probabilmente in un acestrone comune con riproduzione asessuata vi erano due autosomi, nei mammiferi si

pensa che da un gene comune ai due autosomi si è sviluppato SRY, il quale è stato responsabile della

diversificazione dei due sessi.

PAR1 è derivato probabilmente da altri autosomi e si è successivamente trasferito su X, in particolare

sembra che il braccio corto di X sia stato acquisito alcuni milioni di anni fa per una traslocazione da un

autosoma allo stesso cromosoma X.

Il cromosoma Y si è evoluto probabilmente dal cromosoma X mediante un processo di degenerazione, in

particolare affinché si mantenesse SRY su un solo cromosoma, si ritiene che Y abbia subito una

degenerazione tale che non vi possa essere più ricombinazione fra X e Y, eccetto nelle regioni PAR. Inoltre,

a causa dell’assenza di ricombinazione nella maggior parte di Y, tutte le mutazioni si sono accumulate su Y, il

quale infatti contiene molti pseudogeni non funzionali. Alle mutazioni sono seguite infine molte delezioni, le

quali hanno portato al rimpicciolimento di Y.

Inattivazione del cromosoma X (o Lyonizzazione)

In tutte le femmine di mammifero uno dei due cromosomi X è inattivato, per cui i geni presenti su di esso

(con poche eccezioni) non vengono espressi. Le femmine vengono perciò dette emizigoti funzionali, mentre i

maschi emizigoti costituzionali. Il rapporto fra i geni autosomici e i geni su X è di 2:1 nei maschi e di 1:1 nelle

femmine. Tuttavia i prodotti genici di X interagiscono con i prodotti genici sugli autosomi, ed è fondamentale

che il rapporto di espressione sia specifico e di 2:1. Per questo, grazie all’inattivazione di X, si osserva una

compensazione del dosaggio.

Nelle prime fasi dello sviluppo embionale entrambi i cromosomi X sono attivi negli embrioni femminili.

Durante lo stadio embrionale, in cui il numero di cellule è di alcune centinaia, un cromosoma X viene

inattivato. L’inattivazione del cromosoma X paterno o X materno è casuale e varia da cellula a cellula. Tutte

le cellule che derivano da una cellula in cui è inattivato un X hanno inattivato quell’X specifico (eridità

clonale), e di conseguenza tutte le femmine di mammifero sono mosaici funzionale, in cui in alcune cellule è

inattivo X materno mentre in altre X paterno a seconda del caso. Il mosaicismo funzionale è spesso

respondabile di un mosaicismo fenotipico.

Un solo cromosoma X è geneticamente attivo nelle cellule somatiche, ma non nelle cellule germinali, delle

femmine di mammifero mentre il secondo cromosoma X è inattivato e fortemente condensato e forma il

corpo di Baar.

L’inattivazione avviene presto nel corso dello sviluppo, dopo quattro o cinque cicli di divisioni cellulari

successive alla fecondazione ogni cellula dell’embrione inattiva casualmente un cromosoma X. Questa

inattivazione è permanente (eccetto nelle cellule germinali) e tutte le cellule discendenti da una data cellula

avranno lo stesso cromosoma X inattivato. L’inattivazione casuale di un cromosoma X nelle femmine rende

equivalente l’espressione dei geni legati al cromosoma X nei maschi e nelle femmine.

La regione Xic è il centro di inattivazione di X, da questa regione infatti inizia l’inattivazione di X:

- la mancanza di Xic inibisce l’inattivazione di X

- la presenza di Xic regola il numero dei cromosomi X, in modo tale che un solo Xic rimanga attivo. Nelle

femmine XX si inattiva un cromosoma X, nei maschi nessuno (eccetto negli spermatogoni), nelle femmine

XXX se ne inattivano due, nelle femmine XXXX se ne inattivano tre, nei maschi con sindrome di

Klinefelter (XXY) si inattiva un cromosoma X mentre nelle femmine con sindrome di Turner (X) nessuno.

21

Genetica Umana

Su Xic è presente il gene XIST, il quale codifica per un RNA non codificante fondamentale per l’inizio

dell’inattivazione, ma non per il mantenimento. Questo gene è prodotto da un solo cromosoma X, cioè da

quello che verrà inattivato.

L’RNA XIST ricopre il cromosoma X tramite modificazione degli istoni e metilazione del DNA, una

condensazione del cromosoma X che forma il corpo di Barr. Non tutti i geni su X vengono silenziati, ad

esempio non vengono silenziati i geni presenti su entrambi i cromosomi (X e Y) che, in generale, devono

essere espressi in duplice copia. Questi sono i geni omologhi su PAR1, PAR2, PAR3, NRY1 e NRY3. Nei

maschi vi è inattivaione di X negli spermatogoni, i quai contengono un corpo di Barr.

La Regione Xce è l’elemento di controllo dell’X, è responsabile della scelta di quale X rimane attivo e quale

X rimane inattivo, dopo che è avvenuta l’inattivazione nella prima cellula.

Xce è una regione regolatrice che sembra controllare l’espressione di XIST.

Il gene TSIX codifica per un RNA antisenso con sequenza complementare a XIST. E’ espresso nelle cellule

embrionali in cui non si ha inattivazione di X. L’RNA TSIX lega l’RNA XIST e lo inattiva. Variazioni geniche in

Xce possono favorire l’espressione di XIST, e dunque l’inattivazione o l’espressione di TSIX, e dunque la

permanenza dello stato attivo. Caratteri influenzati dal sesso

Molti caratteri sebbene determinati almeno parzialmente dal genoma hanno diversa espressione nei due

sessi. Ciò avviene ad esempio per i caratteri multifattoriali (altezza, comparsa di alcune malattie quali piede

equino, displasia dell’anca e palato schisi) oppure per caratteri monogenici. Ad esempio la alopecia

androgenetica (calvizie) è un carattere dominante nei maschi e recessivo nelle femmine. Nel caso specifico

la maggior parte dei casi di calvizie è dovuta ad una mutazione nel recettore del diidrotestosterone che si

esprime nei bulbi piliferi dei capelli. Nei maschi la presenza di diidrotestosterone mantiene attivo il recettore

mutato, che come conseguenza porta ad indebolimento e perdita del capello. L’effetto è cumulativo e

aumenta col progredire dell’età. Caratteri legati al sesso

I caratteri legati al sesso sono determinati da geni legati al sesso, presenti sia sugli autosomi (la maggior

parte) sia sui cromosomi sessuali. I geni legati al sesso sono espressi in maniera diversa nei due sessi e

sono responsabili del differenziamento sessuale e dei caratteri sessuali secondari.

Nei maschi si ha maggiore espressione dei geni per enzimi coinvolti nella sintesi di androgeni, ma si ha

anche un’espressione basale di geni per enzimi coinvolti nella sintesi di estrogeni mentre nelle femmine

avviene il contrario.

Sono legati al sesso anche i geni che codificano per i recettori degli ormoni. Come ad esempio avviene per il

gene LHCGR, il quale codifica per il recettore dell’ormone luteinizzante espresso nei testicoli e nelle ovaie.

Mutazioni nel gene causano nei maschi pubertà precoce, in particolare nei maschi l’eredità è AD, mentre

nelle femmine è AR e a seconda della mutazione causa diverse patologie fra cui la resistenza all’ormone

luteinizzante, responsabile di amenorrea e infertilità.

Anche i geni regolatori che influenzano l’espressione dei geni precedenti sono legati al sesso.

Genoma mitocondriale

Il genoma nucleare comprende 24 molecole di DNA a doppio filamento e presenta circa 20/25mila geni. Solo

il 4.5% circa del genoma presenta regioni rigorosamente conservate, del quale l’1.5% rappresenta la

percentuale codificante di queste regioni.

Il genoma mitocondriale invece è composto da una molecola di DNA circolare a doppio filamente e presenta

37 geni. In questo caso il 98% circa del genoma presenta regioni rigorosamente conservate, del quale circa

il 93% rappresenta la percentuale codificante di queste regioni.

I mitocondri sono organelli intracellulari di forma granulare o filamentosa (dimensioni comprese tra 0,5 e 3

μm), presenti in tutte le cellule eucariotiche con metabolismo aerobio. All’interno dei mitocondri sono

contenuti gli enzimi dei principali cicli metabolici deputati alla produzione di energia, quali il ciclo dell’acido

22

Genetica Umana

citrico, della β-ossidazione degli acidi grassi e della fosforilazione ossidativa (processi che producono la

maggior parte dell’energia sotto forma di ATP utilizzata dalla cellula). Il numero di mitocondri presente in ogni

cellula varia nei diversi tipi cellulari, secondo le dimensioni della cellula e le richieste energetiche. Il

mitocondrio è delimitato da due membrane concentriche, con proprietà e funzioni biologiche distinte,

separate da uno spazio intermembrana. Il doppio sistema membranoso delimita il compartimento interno che

contiene una fase il cui stato fisico è simile a un gel, detta matrice mitocondriale. La membrana

mitocondriale esterna consiste per circa il 50% di fosfolipidi e per il restante 50% di proteine. In essa è

presente la proteina porina che, formando canali nel doppio strato lipidico. La membrana mitocondriale

interna, molto più impermeabile, si ripiega in un grande numero di pliche, dette creste, che ne aumentano

notevolmente la superficie.

I mitocondri non sono organelli separati, vi è un continuo processo di fusione e fissione fondamentale per la

funzionalità mitocondriale e il mantenimento del DNA mitocondriale (mtDNA).

Svolgono importanti funzioni come ossidazione del piruvato, ciclo di Krebs, beta-ossidazione degli acidi

grassi, sintesi di alcuni amminoacidi, accumolo e rilascio di calcio, apoptosi, sintesi di alcuni steroidi,

fosforilazione ossidativa eccetera.

Il DNA mitocondriale umano (mtDNA) è lungo 16.7 Kb (37 geni) , circolare e complessato a proteine a

formare il nucleoide e non presenta introni. Ogni tessuto contiene un numero diverso di mitocondri e dunque

un numero diverso di copie di mtDNA. Ad esempio in tessuti epiteliali maturi ed eritrociti non vi sono copie,

negli spermatozoi alcune centinaia, nei linfociti circa 1000 copie, in epatociti e fibre muscolari decina di

migliaia di copie e ancora di più negli ovociti maturi.

Struttura dell’mtDNA

Il DNA mitocondriale è un cromosoma circolare superavvolto a doppia elica privo di istoni, e quindi non

organizzato in nucleosomi. Le dimensioni del cromosoma variano da organismo a organismo ma sono

costanti all’interno dele specie ed inoltre il codice genetico mitocondriale è diverso dal codice genetico

universale. La replicazione dell’mtDNA avviene per opera delle DNA polimerasi nucleari. Come avviene nella

replicazione del DNA nucleare, per l’inizio della replicazione vengono sintetizzati degli RNA che fungono da

innesco. Il processo di replicazione del DNA mitocondriale si verifica durante tutto il ciclo cellulare, senza

nessuna preferenza per la fase S durante la quale viene replicato il DNA nucleare. Il DNA mitocondriale

contiene l’informazione per un certo numero di componenti mitocondriali, quali tRNA, rRNA e alcune

proteine. Gli RNA messaggeri sintetizzati nei mitocondri rimangono nell’organulo e sono tradotti dai ribosomi

mitocondriali. Le due eliche dell’mtDNA hanno una densità diversa, una è pesante (H) mentre l’altra è

leggera (L).

Vi sono 13 geni che codificano per proteine dei complessi respiratori: sette del complesso I (ND1, 2, 3, 4, 4L,

5, 6), uno del complesso III (CYB), tre del complesso IV (CO1, 2, 3) e due del complesso V (ATP6, 8). Inoltre

vi sono anche ventidue geni che codificano per tRNA e due che codificano per l’rRNA dei ribosomi

mitocondriali (23S rRNA e 16S rRNA). I geni delle subunità 6 e 8 della ATPasi mitocondriale sono

parzialmente sovrapposti e vengono tradotti secondo differenti moduli di lettura.

Mutabilità mitocondriale

Secondo più recenti stime il DNA mitocondriale muta con una frequenza di 10 volte maggiore rispetto al DNA

nucleare. Poichè il DNA mitocondriale è presente in più copie, la comparsa di una nuova mutazione non dà

un fenotipo patologico immediato, ma ha tempo di fissarsi fino all’eventuale superamento dell’effetto soglia.

Inoltre nel DNA mitocondriale le regioni codificanti sono il 93% dell’intero genoma (mentre nel DNA nucleare

la regione codificante non supera l’1.6%), per cui è più probabile che una mutazione sia deleteria. In questo

caso vi sono molti cicli di replicazione, mentre i cromosomi si replicano una volta per ciclo l’mtDNA si replica

5/10 volte per ciclo e non solo in fase S. La duplicazione delle due catene H ed L non è sincrona, il

cromosoma non è protetto da istoni ed il meccanismo di riparazione è meno adeguato (ad esempio dimeri di

timina) o addirittura assente in alcuni casi. 23

Genetica Umana

Le malattie mitocondrial sono per lo più dovute a difetti nella catena respiratoria, e dunque nella

fosforilazione ossidativa e possono presentarsi sia in età infantile (spesso più gravi) oppure in età adulta.

Disordini mitocondriali possono esserci a causa di mutazioni nell’mtDNA oppure a causa di mutazioni nel

DNA nucleare. Le mutazioni nell’mtDNA possono essere sporadiche (delezioni su larga scala o duplicazioni)

oppure far parte dell’eredità materna in sè (mutazioni puntiformi). Quelle nel DNA nucleare invece possono

essere associate o meno all’instabilità dell’mtDNA (eredità mendeliana). Queste malattie colpiscono

soprattutto i tessuti dove la funzionalità mitocondriale è più elevata, fra cui muscoli (miopatie mitocondriali),

tessuno nervoso centrale (encefalopatie mitocondriali) e fegato (epatopatie mitocondriali). Spesso sono

multisistemiche e colpiscono più organi, per cui la precedente classificazione è in parte superata.

Il genoma mitocondriale viene ereditato solo dalla madre, perciò tutti i figli, sia maschi che femmine, di madri

affette sono affetti (se la penetranza è completa) mentre i maschi non trasmettono mai la malattia ai figli.

Spesso la penetranza è incompleta e l’espressività variabile. Per eteroplasmia si intende il fenomeno per cui

il soggetto è portatore di due tipi di mtDNA (ad esempio wild-type e mutato) e in ogni cellula sono presenti i

due tipi. Per effetto soglia si intende invece il fenomeno per cui la patologia si verifica solo se nei tessuti

affetti la percentuale di copie di mtDNA mutato supera una certa soglia, variabile da malattia a malattia.

Effetto collo di bottiglia: l’ovocita contiene circa 100.000 molecole di mtDNA, durante l’ovogenesi le cellule

figlie dell’ovocita sono sottoposte all’effetto “collo di bottiglia”, confluttuazioni del numero di copie di mtDNA.

A tre settimane il feto femminile contiene circa 50 cellule germinai primordiali, con circa 100 copie di mtDNA

per cellula. A nove settimane ci sono circa 500.000 oogoni con 2000 copie di mtDNA per cellula.

L’effetto collo di bottiglia si verifica anche col procedere dell’età a causa di effetti stocastici (casualmente in

alcune cellule si accumulano più molecole di DNA mutate) oppure per la comparsa di nuove mutazioni.

Come conseguenza con il passare delle generazioni la patologia può aggravarsi o subentrare prima.

Malattie mitocondriali con eredità materna

La malattia di LHON (atrofia ottica di Leber) ha una frequenza di un soggetto affetto su 15/50mila ed è

dovuta ad una ventina di mutazioni note nei geni codificanti per le subunità ND (il 90% in ND1, ND4 e ND6)

che inibiscono l’attività del complesso I. Insorge nella II-III decade di vita con perdita della visione centrale

improvvisa e indolore. Interessa entrambi gli occhi, o simultanemante o sequenzialmente con perdita della

vista nel secondo occhio dopo alcune settimane/mesi. La perdita della vista in genere si manifesta in

maniera subacuta nell’arco di due settimane per poi stabilizzarsi. Possono essere presenti altri sintomi

neurologici fra cui disturbi motori, distonia, tremore posturale e atassia cerebellare. I sintomi sono per lo più

limitati al nervo ottico per l’effetto soglia, che è minore nel tessuto oculare.

La sindrome di Leigh ha una frequenza di un soggetto affetto su 30/40mila ed è dovuta ad una mutazione

nel gene codificante per ATP6 nel 30% dei casi, mentre gli altri sono dovuti a mutazioni nucleari ad eredità

mendeliana. La patologia è dovuta a riduzione della sintesi di ATP per riduzione dell’attività del complesso V.

Insorge nei primi dodici mesi di vita, i primi sintomi più comuni sono la mancata acquisizione delle tappe

dello sviluppo motorio, ipotonia con incapacità di reggere il capo, vomito ricorrente e disturbi motori. Spesso

subentrano disturbi cardiaci, nistagmo (movimenti oscillatori involontari dei globi oculari), disturbi del respiro,

oftalmoplegia (paralisi della muscolatura del bulbo oculare e neuropatia periferica. L’aspettativa di vita per i

soggetti affetti è ridotta, con elevata mortalità nella prima decade di vita.

La NARP (sindrome neuropatia, atassia e retina pigmentosa) ha una frequenza di 1 soggetto affetto su

10/15mila ed è dovuta ad una mutazione nel gene codificante per ATP6, la stessa che determina la sindrome

di Leigh (le differenze stanno nel diverso valore di soglia che assumono queste due malattie) e, in generale,

insorge nei primi dodici mesi di vita.

La NARP ha una soglia più bassa, per cui la patologia si manifesta quando la percentuale di mtDNA è

inferiore rispetto alla percentuale sopra cui si manifesta la sindrome di Leigh (circa 30% contro 90%).

Spesso nella stessa famiglia si possono avere casi di sindrome di Leigh e NARP, con l’aggravarsi della

patologia da una generazione all’altra. 24

Genetica Umana

La NARP di solito colpisce nella II o III decade di vita, la sintomatologia comprende retinopatia precoce,

retinite pigmentosa (riduzione del campo ottico e cecità notturna), nistagmo, cecità, debolezza muscolare

prossimale, ritardo nello sviluppo. Più tardi insorgono inoltre atrofia corticospinale, demenza, ipoacusia,

convulsioni, atassia (mancanca di coordinazione dei movimenti volontari), neuropatia e debolezza

muscolare.

La MELAS (encefalomiopatia mitocondriale con acidosi lattica e episodi simili a ictus) ha una frequenza di un

soggetto affetto su 6mila nella popolazione bianca, inferiore nelle altre, ed è dovuta a mutazioni nel gene per

il tRNA codificante per leucina. Queste mutazioni riducono la capacità del tRNA di essere riconosciuto dalla

leucil-tRNA sintetasi, con conseguenziale riduzione della sintesi proteica mitocondriale. La patologia si

manifesta nella I o II decade di vita, i pazienti sono soggetti di solito a crisi acute, forse causate da

un’infezione o da uno sforzo fisico. Le crisi sono associate a cefalee, vomito, convulsioni e ad episodi

pseudoischemici ed emiparesi. In alcuni casi si manifestano deficit motorio, sordità, diabete, bassa statura,

cardiomiopatia, ritardo dello sviluppo, difficoltà di apprendimento, di memoria e attenzione.

La MERRF (epilessia mioclonica con fibre rosse sfilacciate) ha una frequenza di un soggetto affetto su

50/100mila nella popolazione bianca ed è dovuta a mutazioni nei geni per tRNA, nell’80% dei casi nei geni

che codificano per lisina. Queste mutazioni riducono la capacità del tRNA di essere riconosciuto dalla lisil-

tRNA sintetasi, con conseguente riduzione della sintesi proteica mitocondriale. L’effetto soglia è di circa il

90%.

Le red ragged fibers (fibre rosse sfilacciate) si osservano al microscopio dopo colorazione con Gomori e

sono dovute all’accumolo di mitocondri sotto la membrana plasmatica. I pazienti presentano epilessia

mioclonica (con spasmi muscolari violenti) durante l’asolescenza o all’inizio della vita adulta in associazione

con eventuale sordità, atrofia ottica, bassa statura o neuropatia periferica. In alcuni casi sono state osservati

altri sintomi come cardiomiopatia, rerinite pigmentosa e oftalmoparesi. La malattia è progressiva e determina

una riduzione dell’aspettativa di vita.

La Sindrome di Kearns-Sayre ha una frequenza di un soggetto affetto su 30/100mila ed è dovuta alla

delezione di grosse porzioni del DNA mitocondriale. Le delezioni sono eteroplasmatiche, cioè le molecole

delete coesistono nella cellula con le molecole normali. La soglia è tessuto-specifica ed è di circa il 60% nei

muscoli. Le mutazioni sono spesso ex-novo (non ad eredità materna) e si verificano durante l’ovogenesi o

l’embriogenesi precoce. I primi sintomi esordiscono della II decade di vita ed includono oftalmoplegia, retinite

pigmentosa e ptosi (abbassamento della palpebra). Successivamente vi è sordità, coinvolgimento cardiaco,

miopatia dei muscoli scheletrici, disturbi intestinali, deficit ormonali e insufficienza renale. L’aspettativa di vita

è ridotta ma molto variabile.

La PEO (oftalmoplegia esterna progressiva) ha frequenza molto variabile, ma è la patologia mitocondriale

più diffusa. La sindrome è dovuta a diverse mutazioni puntiformi o piccole delezioni nel genoma

mitocondriale. Solo una percentuale di circa il 30/40% è ad eredità materna (mutazioni du mtDNA), mentre la

percentuale rimanente è dovuta a mutazioni in geni nucleari per proteine mitocondriali con eredità AR o AD.

La patologia è causata da una riduzione dell’attività respiratoria mitocondriale. Il sintomo caratteristico è

l’oftalmoplegia esterna, che esordisce nella I o II. Possono essere presenti altri sintomi neurologici (perdita

dell’udito, retinopatia, neuropatia), endocrini (diabete, ipogonadismo, ipoparatiroidismo), renali (insufficienza

renale) e cardiaci (difetti di conduzione, miocardiopatia). L’aspettativa di vita è molto variabile.

Genoma nucleare

Nel genoma umano sono presenti 23 molecole di DNA in doppia copia nelle femmine e 24 (22 autosomi, X

ed Y) nei maschi. Il genoma è lungo 3.2 Gbp dei quali 3 Gbp sono costituiti da eurocromatina mentre i 200

Mbp rimanenti sono di eterocromatina costitutiva.

La percentuale di guanina e citosina (GC content) è in media del 41.7%: 25

Genetica Umana

GC content = (G+C) / (G+C+A+T) x 100 = 41.7%

Il GC content varia da cromosoma a cromosoma ed entro il cromosoma. Entro il cromosoma, considerando

regioni di almeno 1 Mbp, può variare dal 33% al 60%. La differenza composizionale delle basi è

responsabile del diverso bandeggio dei cromosomi, ad esempio delle bande G.

Prima del sequenziamento del genoma si pensava che il genoma umano fosse costituito da 100mila geni.

Dal sequenziamento, avvenuto nel 2001, è emersa la presenza di non più di 30/35mila geni. Analisi più

recenti hanno dimostrato come molti siano pseudogeni non funzionale, la stima attuale è di 20/25mila geni. Il

numero di geni non è correlato con la complessità dell’organismo, ad esempio molte piante hanno

probabilmente più geni dell’uomo.

Per l’RNA ci sono circa 3mila geni (12/15% del genoma). L’RNA si può trovare sotto diverse forme: RNA

antisenso (probabilmente utile alla regolazione), tRNA e rRNA (utili alla traduzione), miRNA (microRNA utile

alla regolazione), snRNA (small nuclear RNA con varie funzioni tra cui lo splicing) ed snoRNA (small

nucleolar RNA utile per il processamento dei preRNA).

Gli rRNA sono presenti in tandem. Gli rRNA 28S, 5.8S e 18S sono trascritti come RNA policistronico

(prerRNA) e successivamente tagliati da specifiche RNasi nei tre rRNA, Ogni gene per rNA si trova in

un’isola contenente 30/40 ripetizioni in tandem su 5 cromosomi (13, 14, 15, 21, 22) e la sintesi avviene nel

nucleolo. L’rRNA 5S viene trascritto come singolo rRNA, sono presenti diverse ripetizioni ognuna di 200/300

rRNA.

Per tRNA vi sono circa 500 geni, che nel complesso codificano per 49 tipi di tRNA sulla base della specificità

dell’anticodone. Ogni tRNA è codificato da più geni, alcuni in tandem altri separati. Al contrario di mutazioni

in geni per tRNA mitocondriali, mutazioni in singoli geni per tRNA citoplasmatici non provocano malattie visto

che sono presenti più copie geniche (ugualmente avviene per gli rRNA citoplasmatici).

Gli snRNA sono in generale codificati da più geni. Si trovano nel nucleo e sono ricchi in uridina, da cui il

nome generico snRNA U (*numero*). La maggior parte degli snRNA fa parte dello spliceosoma (almeno 70

snRNA). Lo snRNA U7 è coinvolto nella terminazione della trascrizione degli RNA per gli istoni.

Gli snoRNA sono in generale codificati da più geni. Si trovano nel nucleo e sono ricchi in uridina, da cui il

nome generico snRNA U (*numero*). Ve ne sono due classi: gli sno RNA C/D box sono coinvolti (insieme

alle proteine) nella metilazione del ribosio di alcuni nucleotidi degli rRNA mentre gli snoRNA H/ACA sono

coinvolti (sempre insieme alle proteine) nella pseudouridilazione di alcune uridine degli rRNA.

I miRNA sono molecole molto piccole di RNA (20/25 basi), sono molecole antisenso rispetto a specifici

mRNA codificanti proteine e ne regolano l’espressione. Una volta processati si legano al 3’ dell mRNA,

inibendone la traduzione.

Altri RNA non codificanti sono: RNA 7SK, che inibisce la trascrizione da parte della RNA polimerasi (II)

durante la fase di allungamento. SRAI1, coattivatore di alcuni recettori per gli ormoni steroidei, fondamentale

per il loro funzionamento. XIST, responsabile dell’inattivazione in cis del cromosoma X. TSIX, inibitore di

XIST e altri centinaia di RNA antisenso, complementari a mRNA, a funzione ancora sconosciuta.

I geni per le proteine codificano per mRNA che vengono poi tradotti in proteine, sono di lunghezza

estremamente variabile e contengono esoni (generalmente codificanti) ed introni (non codificanti).

La lunghezza media degli esoni umani è di 200 bp, la lunghezza degli introni è molto variabile (da poche

basi a più di 10 kbp).

Organizzazione del gene della beta-globina umana:

Geni per proteine 26

Genetica Umana

Nell’uomo, il gene per la beta-globina codifica per l’isoforma adulta della catena beta dell’emoglobina. In tutti

i mammiferi il gene per la beta-globina è costituito da tre esoni interrotti da due introni. Il trascritto primario

(pre-mRNA) contiene sia gli esoni che gli introni. Gli introni vengono rimossi dal complesso ezimatico dello

splicing per formare l’mRNA maturo. Gli esoni alle estremità 5’ e 3’ contengono una regione non tradotta

(UTR, untranslated region). Le regioni 5’-UTR e 3’-UTR contengono delle sequenze importanti per

indirizzare il processamento dell’RNA e per i meccanismi di traduzione. La sequenza AAUAAA (vicino

all’estremità 3’ del trascritto primario) indirizza il taglio dell’RNA da parte di una nucleasi, 15/30 nucleotidi più

avanti lungo la molecola. L’estremità generata da questo taglio rappresenta il sito per l’aggiunta di una fila di

basi A (coda di poli(A)).

Per famiglia genica si intende una classe si intende una classe di due o più geni che codificano per proteine

che svolgono funzioni simili. Per copie geniche invece si intendono due o più geni che codificano

esattamente per la stessa proteina, come ad esempio i geni per gli istoni. Le copie genetiche in tandem sono

geni che codificano per la stessa proteina situati in tandem, come ad esempio i geni per l’ubiquitina (trascritti

come RNA policistronico). Nel caso di geni per proteine non uguali i geni hanno sequenze correlate ma le

proteine, sebbene simili, svolgono funzioni non identiche. Deviano tipicamente da processi di duplicazione

ed eventualmente trasposizione genica, come avviene ad esempio nei geni per le globine.

Distribuzione dei geni che codificano prodotti funzionalmente correlati:

Geni che codificano: Organizzazione Esempi

stesso prodotto spesso raggruppati, ma i due geni dell’alfa-globina in 11p, i

possono anche essere su geni che codificano l’rRNA e alcune

cromosomi differenti sottofamiglie di istoni

isoforme proteiche o isozimi tessuto- talvolta raggruppati, talvolta raggruppamento dei geni per

specifici non sintenici l’amilasi pancreatica e salivare,

assenza di sintenia per i geni

dell’alfa-actina espressi nel muscolo

scheletrico

isozimi specifici per differenti comparti solitamente non sintenici isozimi citoplasmatici e mitocindiali

cellulari di vari enzimi come ad esempio

aldeide deidrogenasi(c)-9q e

(m)-12q.

enzimi della stessa via metabolica solitamente non sintenici geni che codificano gli enzimi della

steroidogenesi

subunità della stessa proteina solitamente non sintenici alfa-globina-16p e beta-globina-11p

componenti che interagiscono nello solitamente non sintenici JAK-1p, STAT1-2q

stesso percorso di segnalazione

ligando più recettore associato solitamente non sintenici insulina-11p e recettore

dell’insulina-19p

Geni sovrapposti

Normalmente i geni nucleari sono separati nei mammiferi ma in alcuni casi sono sovrapposti, coma ad

esempio nel caso dei geni del complesso HLA (human leucocyte antigen). Alcuni geni, ad esempio molti

snRNA o snoRNA, si trovano dentro ad altri geni. Ad esempio: gene NF1 (se mutato causa

neurofibromatosi), gene OGMP (due esoni, codifica per una glicoproteina della mielina), geni EVI2B E EVI2A

(entrambi due esoni, codificano per proteine a funzione sconosciuta, se mutati possono portare a 27

Genetica Umana

leucemina). Altri geni con dentro altri geni sono infine: F8 per il fattore di coagulazione VIII (due geni

all’interno) e RB1, il quale mutato determina suscettibilità al retinoblastoma (un gene all’interno).

Pseudogeni

Gli pseudogeni sono sequenze omologhe a geni funzionali ma che non svolgono funzione, poichè non

vengono trascritti o tradotti. Sono residui genici dell’evoluzione e in generale derivano da eventi di

duplicazione e mutazione. Vi sono varie classi:

- Pseudogeni non processati: come i geni attivi da cui derivano hanno la stessa organizzazione esonica o

intronica, vengono trascritti (hanno un promotore funzionale) ma non vengono tradotti in proteine perchè

gli esoni hanno accumulato codoni di stop. Esempio: geni del raggruppamento delle globine.

- Copie tronche: mancano di una porzione in 5’ o in 3’ rispetto al gene da cui derivano. Se il promotore è

funzionale possono essere trascritti, ma non vanno incontro a traduzione.

- Pseudogeni processati: rispetto ai geni da cui derivano hanno solo gli esoni e non vengono trascritti, si

sono evoluti tramite un processo di retrotrascrizione e integrazione nel genoma.

- Retrogeni: rispetto ai geni da cui derivano hanno solo gli esoni come nel caso dei pseudogeni processati,

ma questi si trovano sotto un promotore funzionale e vengono trascritti (in alcuni casi anche tradotti).

Esempi: GK2 (produce glicerolo chinasi), PDHA2 (produce piruvato deidrogenasi), PGK2 (produce

fosfoglicerato chinasi). Dna non codificante

La maggior parte del genoma umano contiene sequenze non codificanti fra cui vi sono promotori,

terminatori, regolatori trascrizionali e introni. Quasi tutto il DNA è costituito da sequenze ripetute a funzione

tutt’ora sconosciute. Le sequenze ripetute si possono trovare anche all’interno di introni di geni. Si possono

suddividere in classi a seconda delle dimensioni complessive delle ripetizioni: DNA satellite, DNA

minisatellite, DNA microsatellite, trasposoni.

Il DNA satellite è costituito da sequenze ripetute, le cui singole ripetizioni sono lunghe da 5 a 170 nucleotidi

(il numero di ripetizioni è di alcune migliaia). Si trovano sottoforma di eterocromatina nella vicinanza del

centromero (eterocromatina pericentrica).

Il DNA minisatellite è costituito da sequenze ripetute, le cui singole ripetizioni soo lunghe da 6 a 94 nucleotidi

(la lunghezza complessiva delle ripetizioni è di 0.10/0.20 Kbp) e si trovano sotto forma di eterocromatina

nella vicinanza o dentro i telomeri. Si dividono in microsatelliti ipervariabili, costituiti da centinaia di sequenze

ripetute in tandem le cui ripetizioni hanno lunghezza variabile e microsatelliti telomerici, i quali costuiscono le

unità ripetute dei telomeri (TTAGGG) e vengono replicate dalla telomerasi.

Il DNA microsatellite (o SSR: simple sequence repeats) è costituito da sequenze ripetute, le cui singole

ripetizioni sono lunghe 1-12 nucleotidi (la lunghezza complessiva delle ripetizioni varia in genere da 10 a 100

bp). Si trovano su tutto il genoma (il 2% contiene SSR) e si ritiene che derivino da errori di slippage nella

replicazione. Vi sono diverse classi:

- Mononucleotidiche: (1% del genoma): sono ripetizioni continue di A o T, più raramente di C o G. Sono

altamente polimorfiche, cioè la loro lunghezza varia da individuo ad individuo, per cui sono molto utili nei

test genetici (come ad esempio nei test di paternità e nella genetica forense in generale).

- Dinucleotidiche (0,5% del genoma): ripetizioni di sequenze CA (le più comuni), AT, AG e CG (molto rare).

Sono altamente polimorfiche, cioè la loro lunghezza varia da individuo ad individuo.

- Trinucleotidiche: si trovano sia all’interno di DNA non codificante che dentro esoni (ripetizione di codoni).

Queste ultime sono soggette a errori di replicazione e in alcuni casi a espansioni instabili associate a

patologie.

Per trasposone si intende una sequenza in generale ripetitiva (ma non sempre) di DNA mobile, che può

quindi migrare da una regione all’altra all’interno del genoma. Vi sono due classi: trasposoni a DNA e

retrotrasposoni.

I trasposoni a DNA (circa 3% del genoma umano) derivano da un fenomeno di trasposizione conservativa. Il

trasposone viene tagliato e reinserito in un altro punto del genoma. 28

Genetica Umana

Nel caso dei retrotrasposoni, in maniera similare ai retrogeni, il DNA è trascritto dalla polimerasi e

successivamente retrotrascritto a cDNA da una trascrittasi inversa e quindi integrato sul genoma. Dopo

questo processo da un retrotrasposone se ne generano due, per cui la trascrizione è replicativa. I

retrotrasposoni autonimi contengono un gene che codifica per una trascrittasi inversa, il cui compito è quello

di retroscrivere l’RNA del retrotrasposone a cDNA. Vi sono tre famiglie:

- Sequenze LINE (long interspersed nuclear elements, autonome), 20% del genoma: a sua volta vi sono tre

famiglie principali a seconda della lunghezza (LINE-1, LINE-2, LINE-3). Hanno tutte due ORF e si trovano

principalmente nell’eucromatina in bande G scure. La LINE-1 è lunga 6.1 Kbp e contiene un promotore

(che viene anch’esso trascritto), una regione non trascritta in 5’, due ORF (geni) per proteine e una

piccola regione 3’ (non trascritta con una sequenza di poliA e due sequenze ripetute all’estremità). Dopo

essere stato trascritto, l’RNA viene tradotto nel citoplasma nelle de proteine e successivamente, nel

nucleo, viene retrotrascritto. La proteina p40 lega l’RNA, lo stabilizza e lo trasporta ne nucleo. La seconda

proteina è sia una trascrittasi inversa che retroscrive l’RNA a cDNA sia un’endonucleasi che taglia il sito

bersaglio, in modo che il cDNA possa integrarsi. Quasi tutte le LINE umane sono più corte e non

funzionali poichè prive di una regione. Delle 600mila LINE-1 solo 100 sono complete e possono trasporre,

causando in alcuni casi patologie.

- Sequenze SINE (short interspersed nuclear elements, autonome), 13% del genoma: divise a loro volta in

tre famiglie principali a seconda della lunghezza (Alu, MIR e MIR3). Sono lunghe 100/400 bp, Alu è

specifica dei primati mentre MIR di tutti i mammiferi. Alu si è originata da copie di tRNA, per

retrotrascizione e integrazione. Le Alu hanno un braccio sinistro di 130 bp e uno destro di 160 bp per

aggiunta di 32 bp (alcune hanno solo il braccio sinistro o destro). Le Alu possono venire trascritte dalla

RNA polimerasi III (la stessa che sintetizza i tRNA) grazie alla presenza di un promotore interno. Tuttavia

una volta trascritte, l’RNA non è funzionale e viene degradato. La loro sequenza è però simile a quella

delle estremità delle LINE, per cui la proteina p40 e la ORF2 di una LINE può agire anche sulla SINE

permettendone la rilocalizzazione nel nucleo, la retrotrascizione a cDNA e l’integrazione. Nella maggior

parte delle Alu il promotore è degenerato, per cui esse non vengono trascritte. Si trovano in generale in

regioni ricche di GC (bande G chiare dei cromosomi), in contrasto con le LINE che si trovano in regioni

ricche di AT.

- Trasposoni LTR (long terminal repeats, autonome o non autonome), 8% del genoma: sono sequenze

derivanti da retrovirus, una classe di virus a cui appartengono alcuni virus tumorali e HIV. Gli LTR

autonomi contengono sequenze retrovirali endogene (HERV) e contengono i geni gag e pol. Pol codifica

per una proteasi, una trascrittasi inversa, una Rnasi H e un’integrasi, fondamentali nei processi di

trasposizione (vi sono varie famiglie HERV). L’RNA viene trascritto e pol viene espresso come un

un’unica proteina. La proteasi catalizza la propria escissione e il processamento di pol a formare le altre

tre proteine. La RT sintetizza il cDNA, l’RNasi H degrada l’RNA retrotrascritto e l’integrasi catalizza il taglio

e l’integrazione sul genoma del cDNA. In quasi tutte le famiglie HERV uno o più proteine, sebbene

presenti, non sono funzionali, per cui non si ha più retrotrascizione e integrazione (fatta eccezione per le

HERV-K). Gli LTR non autonomi non contengono gag e o pol, per cui sono inattivi (famiglia principale:

MaLR) Ricombinanti

Durante la profase I della meiosi avviene crossing over, il quale permette la formazione di nuove

combinazioni di geni. Se la funzione di questi geni è nota (o meglio determina un particolare fenotipo) è

possibile determinare la distanza genetica che li separa.

Si parla di ricombinazione singola a due punti quando da un singolo evento di ricombinazione meiotica si

producono due ricombinanti e due non ricombinanti. Soltanto se il genotipo (e di conseguenza il fenotipo) dei

ricombinanti e dei non ricombinanti è diverso, questo sarà utile per il mappaggio.

Ricombinazione multipla a due punti: 29

Genetica Umana

Per sintenia (o associazione, o linkage) si intende quando due geni, o due loci, si trovano sullo stesso

cromosoma.

Un aplotipo è un blocco di alleli specifici di due o più loci associati che si trasmettono da una generazione

all’altra. Più due geni associati sono distanti, più è probabile che avvenga ricombinazione durante la meiosi e

che pertanto le coppie di alleli di cui sono portatori si separino.

La frequenza di ricombinazione fra due geni (o loci) è dunque una misura della distanza genetica che separa

i due loci. La distanza genetica viene misurata in centiMorgan (cM): 1 cM è definito come la distanza

genetica di due loci che presentano una frequenza di ricombinazione dell 1% (= avviene ricombinazione 1

volta su 100).

La frazione di ricombinazione non supera mai lo 0.5 o 50%, cioè il numero di ricombinanti non può essere

mai maggiore del numero di non ricombinanti. Per questo motivo una distanza fra due loci singoli associati

non può essere più elevata di 50 cM.

Dall’analisi della progenie di una, o meglio più, famiglie è possibile determinare la frequenza di

ricombinazione e dunque la distanza di mappa. La relazione matematica fra frazione di ricombinazione (r) e

distanza di mappa (d) è chiamata funzione di mappa.

Esistono tre modelli principali per calcolare la funzione di mappa, ognuno dei quali fornisce una stima

diversa.

Primo modello: se si ipotizza che avvenga un solo crossing over fra due loci, si può direttamente usare la

frequenza di ricombinazione. Per far in modo che questo modello sia valido i loci devono essere molto vicini

(per cui improbabile che si verifichi più di un crossing over). Ad esempio, se si considerano due loci associati

A (alleli A o a) e B (alleli B o b), se la frequenza dei ricombinanti nella progenie è di 0.04 (cioè la frazione di

ricombinazione è 0.04), allora la distanza sarà di 4 cM.

Secondo modello: se si ipotizza che possano avvenire più eventi di crossing over indipendenti e che non si

influenzano a vicenda, si usa la funzione di Haldane. Per far si che questo modello sia valido i loci devono

essere lontani, per cui è probabile che avvengano più crossing over indipendenti.

distanza di mappa = d = - (1/2) ln(1 - 2r)

frazione di ricombinazione = r = (1/2) (1 - e )

-2d

Ad esempio, se si considerano i due loci associati (alleli A o a) e B (alleli B o b), se la frequenza di

ricombinanti nella progenie è di 0.20 (cioè la frazione di ricombinazione è di 0.20):

d = -0.5 ln(1 - (2)(0.20)) = 0.255

La distanza (d) sarà di 25.5 cM, se calcolata con il primo modello sarebbe stata di 20 cM.

Terzo modello: se si ipotizza che possono avvenire più eventi di crossing over ma che uno sfavorisca quelli

successivi, si usa la funzione di Kosambi. Questa è la condizione più vicina alla realtà poichè la formazione

di un chiasma inibisce, per interferenza, la formazione di altri chiasmi (per loci vicini o lontani l’interferenza è

bassa).

distanza di mappa = d = (1/4) ln[(1 + 2r)/(1 - 2r)]

frazione di ricombinazione = r = (1/2) [(e - 1)/(e + 1)]

4d 4d

Ad esempio, se si considerano i due loci associati (alleli A o a) e B (alleli B o b), se la frequenza di

ricombinanti nella progenie è di 0.10 (cioè la frazione di ricombinazione è di 0.10):

d = 0.25 ln[(1 + (2)(0.10))/(1 - (2)(0.10))] = 0.101

La distanza sarà di 10.1 cM, se calcolata con la prima formula sarebbe stata di 10 cM.

Considerando che un singolo evento di ricombinazione (crossing over) produce due cromatidi ricombinanti e

due non ricombinanti, un singolo crossing over contribuisce al 50% di ricombinazione (50 cM). Ogni crossing

over al microscopio risulta un chiasma, per cui contando i numeri dei chiasmi in cellule in profase 1 è

possibile determinare la lunghezza di mappa.

Negli spermatociti primari il numero medio di chiasmi è di 50.6/cellula, per un totale di 50.6(50) cM = 2530

cM. Negli ovociti primari il numero medio di chiasmi è 70.3/cellula, per un totale di 70.3(50) cM = 3515 cM.

Di conseguenza la distanza di ricombinazione fra due loci può essere diversa se considerata tramite analisi

di gameti maschili o femminili (anche se la distanza fisica è la medesima). 30

Genetica Umana

Analizzando i singoli cromosomi si osserva che: la distanza genetica complessiva nelle femmine è maggiore

rispetto a quella nei maschi, all’interno di uno stesso cromosoma la frequenza di ricombinazione varia a

seconda della regione del cromosoma, all’interno di una regione del cromosoma la frequenza di

ricombinazione è diversa nei due sessi e che fra cromosomi diversi la frequenza di ricombinazione media è

diversa.

Di conseguennza la distanza genetica fra due geni in generale ha una bassa correlazione con la loro

distanza fisica espressa in basi. Grossolanamente si puù dire che 1cM = 1Mbp.

Nei maschi, dove si ha meno ricombinazione, 1 cM equivale a più di 1 Mbp, nelle femmine a meno. In alcune

zone la ricombinazione è scarsa (1 cM = 5 Mbp), in altre (hot spot) molto frequente (1 cM = 0.3 Mbp). Una

situazione estrema si verifica nella regione PAR1 del cromosoma Y, dove nei maschi la ricombinazione in

questa regione è obbligatoria. La regione è lunga circa 2.6 Mbp, che nell’uomo equivalgono a 50 cM (50% di

ricombinazione, sempre obbligatoria). Per cui 1 cM = 0.052 Mbp = 52 Kbp. Nelle femmine, dove non è

obbligatoria, è 1 cM = 0.37 Mbp = 370 Kbp.

Per marcatore si intende un qualsiasi carattere mendeliano esistete in due o più alleli che viene utilizzato per

seguire un segmento cromosomico (come ad esempio un gene associato ad una malattia) nelle generazioni

di un albero genealogico. Maggiore è il grado di polimorfismo (più alleli), maggiore è la possibilità che un

individuo sia eterozigote. Sono stat utilizzati come marcatori, prima del sequenziamento del genoma:

- Gruppi sanguigni: 20 loci, basso polimorfismo, omozigosi dominante uguale all’eterozigosi

- Proteine del siero che, se separate, hanno diversa mobilità a causa di polimorfismi di sequenza (SNP): 30

loci, basso polimorfismo, omozigosi (una banda), diversa da eterozigosi (due bande).

- Antigene HLA (human leukocyte antigen): 1 locus, molto polimorfico, omozigosi diversa da eterozigosi,

solo per il cromosoma 6.

- In tempi più recenti sono stati utilizzati anche marcatori molecolari di DNA come minisatelliti, microsatelliti

e SNP, ognuno con centinaia o milioni di loci, vario grado di polimorfismo e distinzione fra omozigosi ed

eterozigosi.

Nel mappaggio genico a due punti, per trovare la localizzazione genetica di un gene (come ad esempio il

gene associato ad una malattia), si usa un solo marcatore. Nel mappaggio genico a tre punti se ne usano

due. L’analisi a tre punti è utile per stabilire l’ordine di tre marcatori, oppure di un gene-malattia rispetto a due

marcatori. 31

Genetica Umana

Il clonaggio posizionale è una tecnica che prevede l’identificazione di un gene (ad esempio associato alla

patologia) mediante confronto fra mappe genetiche, bandeggio dei cromosomi e mappe fisiche (possibile

solo dopo il sequenziamento di ampie regioni di DNA). È necessario il confronto e la sovrapposizione di una

mappa genetica fine (mappaggio con centinaia o migliaia di punti) e una mappa fisica. E’ stato fondamentale

lo sviluppo della tecnologia del DNA ricombinante.

Grazie al sequenziamento del genoma umano sono stati dentificati centinaia di nuovi geni associati a

patologie. È stato scoperto che mutazioni in uno stesso gene possono dare origine a diverse patologie.

Inoltre è stato scoperto che la suscettibilità al cancro ha una forte componente genetica, con coinvolgimento

di oncogeni e oncosoppressori. Milioni di basi possono essere diverse da individuo a individuo, anche in

regioni codificanti. I più comuni sono gli SNP (single nucleotide polymorphisms), definiti come sostituzione di

una base con una frequenza maggiore di 1% nella popolazione, e neutrali. Un blocco di SP sullo stesso

cromosoma, se ravvicinati, tendono ad esssere ereditati insieme e formano un aplotipo. La presenza di SNP

è ciò che principalmente distingue una persona dall’altra, e può influire potenzialmente su tutti gli aspetti

legati alla genetica umana (penetranza, espressività, genetica multifattoriale, genetica del comportamento,

farmacogenetica, tossicogenetica, ecc..). È stata scoperta la presenza di CNV, cioè variazioni del numero di

copie (delezioni o duplicazioni del genoma anche per migliaia di basi). Hanno varie conseguenze:

alterazione del dosaggio genico, produzione di proteine non funzionanti con azione dominante negativa,

interferenza con l’espressione o la regolazione genica, ecc.

Mutazioni

Mutazioni cromosomiche: alterano il numero o l’organizzazione di un cromosoma. In genere non sono

ereditarie quelle che cambiano il numero, ma sono ereditarie le alterazioni della struttura.

Mutazioni genetiche: alterano la sequenza, l’espressione o il numero di copie di un gene. Sono ereditarie

quelle che colpiscono (anche) le cellule germinali, ma non lo sono quelle che colpiscono solo le cellule

somatiche (spesso associate a tumori).

Le mutazioni geniche possono essere affrontate in base al tipo di alterazione della sequenza genica, in base

ai meccanismi che le causano, in base alle conseguenze a livello fenotipico o in base alle conseguenze

nell’intera popolazione.

Le mutazioni puntiformi sono definite come mutazioni che riguardano un solo nucleotide: per sostituzione o

singole delezioni/inserzioni. Nelle mutazioni per sostituzione (o sostituzioni nucleotidiche) una base viene

sostituita con un’altra base. Si hanno due tipi di sostituzione: transizione (una purina viene sostituita con

l’altra purina, oppure un pirimidina con l’altra pirimidina) e trasversioni (una purina viene sostituita con una

pirimidina, o viceversa). Le mutazioni spontanee sono più frequentemente transizioni nei mammiferi per vari

motivi:

- Nel caso di mutazioni spontanee (non dovute ad agenti mutageni), la causa principale di sostituzioni sono

errori che avvengono durante la replicazione. La DNA polimerasi tende ad appaiare ad una purina (es. A)

più frequentemente una pirimidina (T e più raramente C), e molto più difficilmente una seconda purina (A o

G) perché vi sarebbe una maggiore distorsione del DNA se sono appaiate due purine (o due pirimidine).

- Le transizioni sono favorite rispetto alle trasversioni perché è più frequente che siano silenti.

- Nei mammiferi la transizione C!T è molto favorita, perché ci sono regioni ricche di isole CpG in cui la C è

metilata (funzione legata all’epigenetica). La metilcitosina può andare incontro a deaminazione ossidativa

spontanea con formazione di T (infatti le isole CpG sono hotspot per mutazioni C-T, più frequenti di circa

8,5 volte)

Inserzioni o delezioni di singoli nucleotidi (mutazioni frameshift): mutazioni in cui un singolo nucleotide si

inserisce nella sequenza codificante di un gene (inserzione (mononucleotidica)) e mutazioni in cui un singolo

nucleotide viene rimosso dalla sequenza codificante di un gene (delezione (mononucleotidica)) hanno effetti

molto simili e portano ad un frameshift della traduzione del gene, in modo da produrre un proteina

32

Genetica Umana

completamente diversa (dopo la mutazione) e in generale tronca. Solitamente, entro 10-30 codoni vi è un

codone di stop.

Le sostituzioni nucleotidiche possono essere sinonime (se la sostituzione fa si che il prodotto genico sia

uguale) e silenti (di cui fanno parte le mutazioni sinonime, la sostituzione fa si che il prodotto genico sia

uguale). In verità alcune mutazioni che sembrano silenti, pur non cambiando in teoria il prodotto genico, non

lo sono, per vari motivi:

Es. 1. Dopo mutazione genica, il codone codifica per lo stesso aminoacido (prodotto genico uguale) ma la

traduzione può essere alterata dal codon usage.

Es. 2. Dopo mutazione genica, il codone codifica per lo stesso aminoacido, ma quella base potrebbe essere

coinvolta nello splicing, per cui si potrebbe produrre un prodotto genico non funzionale a causa di errori di

splicing

Es. 3. Le mutazioni silenti negli introni, che per natura dovrebbero portare allo stesso prodotto genico,

possono anch’esse alterare lo splicing, producendo un prodotto genico non funzionale.

Inoltre, le sostituzioni nucleotidiche possono anche essere non sinonime e in questo caso la sostituzione fa

si che il prodotto genico sia diverso. Queste si distinguono in mutazioni missenso (la sostituzione fa si che il

codone mutato codifichi per un altro aminoacido, per cui la proteina mutata sarà diversa per un

amminoacido) e non senso (la sostituzione fa si che il codone mutato sia di stop (UAG, UGA UAA), in modo

per cui si produce una proteina tronca). Alcune mutazioni non sinonime possono avere altre conseguenze:

Es. 1. Dopo mutazione genica, il codone codifica per un diverso aminoacido, ma allo stesso tempo la base

mutata potrebbe essere coinvolto nello splicing, per cui si potrebbe produrre un prodotto genico non

funzionale a causa di errori di splicing.

Es 2. La proteina che presenta un singola mutazione potrebbe essere instabile ed essere fortemente

degradata.

Mutazioni puntiformi in geni per tRNA: in questo caso parlare di sostituzioni sinonime, o silenti, o mutazioni

non sinonime, o mutazioni di frameshift non ha senso, visto che il prodotto non viene convertito in un

prodotto proteico. Vi sono vari effetti a seconda della mutazione e del tRNA.

Una mutazione in un tRNA può far sì che il tRNA non assuma più la sua struttura secondaria e dunque

terziaria, e venga degradato (non è un problema per i tRNA citoplasmatici, lo è per quelli mitocondriali).

Una mutazione in un tRNA può far sì che il tRNA non venga più riconosciuto o riconosciuto con una minore

affinità da interattori. Una mutazione in un tRNA può alterare la sua espressione visto che il promotore dei

geni per tRNA citoplasmatici si trova dentro il gene stesso).

Una mutazione nell’anticodone ha normalmente invece effetti deleteri. Vi sono due possibilità: il tRNA mutato

"nessuna

non viene riconosciuto dall’aminoacil-tRNA sintetasi conseguenza per i cittRNA, grave per gli

mttRNA) oppure il tRNA mutato viene riconosciuto dall’aminoacil-tRNA sintetasi che lo carica col giusto

aminoacido, ma poiché l’anticodone è diverso riconoscerà un codone diverso e incorporerà un aminoacido

sbagliato (mutazione parizialmente dominante).

Mutazioni puntiformi in geni per altri RNA: una mutazione in un rRNA può far sì che l’rRNA non assuma più

la sua struttura secondaria e dunque terziaria, e venga degradato (non è un problema per rRNA

citoplasmatici, lo è per quelli mitocondriali). Una mutazione in un rRNA in una regione di autoappaiamento

può far si che venga meno un appaiamento base-base, con alterazione della struttura dell’rRNA e, in

generale, nel ribosoma (non è un problema per rRNA citoplasmatici, lo è per quelli mitocondriali).

Mutazioni in piccoli RNA come snRNA, snoRNA e miRNA possono far si che l’RNA non si leghi più o si leghi

con meno affinità al suo ligando. Gli effetti possono variare a seconda della sostituzione, a seconda del ruolo

del’RNA mutato e soprattutto a seconda che vengano codificati da più geni.

Mutazioni puntiformi in sequenze regolatrici: mutazioni in un promotore possono fa si che vi sia

un’alterazione dell’espressione genica del gene. Se il promotore mutato è ipofunzionale si avrà una ridotta

33

Genetica Umana

espressione della proteina, se è iperfunzionale un’aumentata espressione (alterazione del dosaggio genico).

Mutazioni in una sequenza regolatrice possono far si che un gene che non debba essere espresso sia

(parzialmente) espresso, o un gene che debba essere espresso non lo sia.

Mutazioni patologiche ex novo: sono mutazioni che insorgono per la prima volta in un individuo (i progenitori

non sono mai affetti) e se insorgono anche nella cellule germinali vengono trasmesse alla progenie).

Mutazioni trinucleotidiche (es. espansioni di esoni): alcune mutazioni non coinvolgono un solo nucleotide,

ma più nucleotidi. Gli effetti di mutazioni (sostituzioni o di frameshift) dinucleotidiche sono molto simili a

quelle di mutazioni nucleotidiche, ma sono molto più rare. Gli effetti di mutazioni trinucleotidiche sono vari,

ad esempio sostituzioni di tre basi determinano il cambiamento di uno o due codoni, e possono essere

sinonime entrambe (molto raro), una sinonima e una non sinonima (più frequente), e fra queste una

missenso o una nonsenso. Inoltre, inserzioni o delezioni di tre basi possono portare all’inserzione o alla

delezione di un aminoacido nella proteina, il cui frameshift di traduzione è però intatto. Sono pertanto meno

gravi di delezioni o inserzioni mono o dinucleotidiche.

Alcuni geni umani posseggono codoni in tandem che codificano per lo stesso aminoacido, dette ripetizioni di

triplette o di codoni (la proteina avrà dunque uno stretch contenente varie copie dell’aminoacido codificato

dall codone). Alcune mutazioni aumentano il numero di queste ripetizioni, portando alla formazione di una

proteina il cui stretch monoaminoacidico è molto più lungo oppure portando ad un’inibizione dell’espressione

genica. Questo fenomeno è chiamato espansione allelica. A sua volta questo stretch lungo può interferire

con la funzione della proteina e determinare una patologia. Storicamente l'espansione di codoni è stata

osservata nel gene FMR-1 sul cromosoma X, ed è associata alla sindrome dell’X-fragile.

La sindrome dell’X-fragile è la sindrome più frequente fra quelle che causano ritardo mentale nei maschi

(>1%), con frequenza di 1/1250 maschi. In questo caso: FMR1 codifica per una proteina espressa nei

neuroni, a funzione sconosciuta, fondamentale per lo sviluppo psicocognitivo. FMR1 wt contiene vicino

all’estremità 5’ non codificante da 6-52 ripetizioni del codone CGG per arginina. FMR1 mutato contiene più

di 230 copie di questa ripetizione CGG. Come conseguenza il gene non viene espresso e non si produce

proteina (la amancanza di espressione è dovuto a meccanismi epigenetici).

Il sito fragile più comune su X è FRAXA, legato a FMR1. A causa di queste modificazioni (es. espansioni di

triplette) alcune proteine del cromosoma non si legano più in quei punti al DNA, che pertanto rimane

scoperto e protetto.

Atrofia muscolare spinale e bulbare, atassia spinocerebellare di tipo 1, malattia di Hungtinton, sindrome di

Haw-River e malattia di Machado-Joseph hanno una caratteristica in comune. Oltre la tripletta ripetuta (CAG

per glutammina), sono tutte dominanti e causano una degenerazione progressiva del sistema nervoso

(anche la distrofia miotocnica). Inoltre si ha che entro un determinato numero di ripetizioni l’allele è normale

(gene-specifico), sopra un determinato numero è mutato e causa della patologia. In generale maggiore è il

numero di triplette, maggiore sarà la gravità dei sintomi e più precoce sarà l’insorgenza dei sintomi. Tuttavia

è possibile che da un genitore non affetto si sviluppi un individuo affetto, oppure da uno affetto con sviluppo

della malattia in età tardiva si sviluppi un soggetto affetto in un periodo antecedente della vita (anticipazione).

Come si spiega che un genitore non affetto dia origine ad un figlio affetto? Si spiega col fatto che, durante il

processo di sintesi del DNA nelle cellule germinali, il numero di triplette possa aumentare, portando il

numero di triplette sopra il valore soglia a cui si sviluppa la malattia.

Come si spiega l’anticipazione? In un soggetto già affetto, un numero eccessivo di ripetizioni rende il DNA

ancora più instabile, cioè tendono ad aumentare ulteriormente il numero di triplette ripetute, cosicché nella

progenie la sintomatologia appare prima. 34

Genetica Umana

Frequenza di mutazione spontanea: definita come il numero di alleli mutati per gene per generazione.

Es. una frequenza di 2x10 /allele generazione significa che su 100000 alleli (50000 persone nel caso geni

-5

autosomici) 2 saranno mutati:

f = (alleli mutati per quel gene sotto analisi)/(numero di alleli totali) = (2/100000) = 2x10

-5

Nel caso di geni su X, il numero degli alleli coincide col numero di donne *2 più il numero di uomini. Cioè se

si analizzano 25000 uomini e 25000 donne, il numero di alleli totali sarà 75000 (e non 100000). Nel caso di

geni su Y, il numero degli alleli coincide col numero di uomini.

La variabilità della frequenza di mutazione si spiega con lunghezza genica, sequenza nucleotidica e

modificazioni chimiche spontanee. Maggiore è lungo un gene (soprattutto maggiore è la lunghezza della

regione codificante) maggiore è la probabilità che si verifichi una mutazione, per effetti probabilistici. La

presenza di ripetizioni estese (mono-bi- e soprattutto trinucleotidiche) aumenta la probabilità di errori di

replicazione che aumentano o, più probabilmente, aumentano il numero di ripetizioni. Inoltre, fra tutte le basi,

la citosina può andare incontro a modificazioni spontanee più frequenti rispetto a A, G e T, perciò geni ricchi

in C (e G) vanno incontro a mutazioni spontanee con più frequenza.

Mutazioni indotte

Per mutazioni indotte si intendono mutazioni che non avvengono spontaneamente, ma vengono indotte dalla

presenza o dal trattamento di molecole o in generale agenti mutageni. I mutageni si possono dividere in due

grandi classi: agenti fisici e chimici.

Le radiaizoni (agenti fisici) possono indurre mutazioni. I raggi UV inducono tipicamente mutazioni qualora

siano presenti due timine adiacenti. L’energia degli UV è tale che rompe doppi legami, con formazione di

nuovi doppi legami. Le mutazioni non sono dirette, ma sopraggiungono nel tentativo della replicasi di

bypassare queste lesioni durante la replicazione, e sono tipicamente mono o dinucleotidiche. I raggi X e

gamma sono raggi ionizzanti (producono ioni a contatto con atomi per liberazione di elettroni) e sono

anch’essi altamente mutageni.

Per mutageni chimici si intendono tutte quelle molecole che aumentano la frequenza di mutazione del DNA e

si distinguono in mutageni diretti, promutageni e mutageni indiretti.

I mutageni diretti sono tutte quelle molecole che interagiscono direttamente col DNA provocando delle

mutazioni. A loro volta si distinguono in analoghi di base (es. 5-bromuracile, 2-aminopurina), specie che

reagiscono con il DNA (acido nitroso e nitriti, agenti alchilanti) e molecole intercalanti (acridine, bromuro di

etidio).

I promutageni sono composti relativamente non polari (e quindi chimicamente poco reattivi) che possono

essere attivati metabolicamente a forme più reattive in grado di interagire con i centri nucleofili nel DNA.

Sono tipicamente xenobiotici che vengono convertiti soprattutto nel fegato ad opera dei citocromi P450 in

sostanze reattive in grado di causare mutazioni sul DNA (es. ammine aromatiche, idrocarburi policiclici

aromatici e nitroderivati, benzene e stirene, aflatossine, N-nitrosammine, carbammati, idrocarburi alogenati).

Al gruppo dei mutageni indiretti appartengono quegli agenti chimici che non interagiscono direttamente col

DNA, ma che sono in grado di formare specie reattive dell'ossigeno (mutageni ossidativi) o che

interagiscono con la sintesi, la replicazione e il corretto mantenimento della struttura del DNA (antimetaboliti

e inibitori mitotici). Molti di questi agenti sono utilizzati come farmaci antineoplastici e il loro meccanismo di

azione risulta in diversi casi legato alla specificità della fase cellulare. Si dividono in molecole che generano

ROS, antimetabolici e inibitori mitotici. Alcuni farmaci (Bleomicina, Mitomicina C, Antracicline) e alcune

sostanze (acqua ossigenata) generano dei ROS che possono modificare le basi. Fra i ROS più attivi vi sono

l’anione superossido e il radicale ossidrile. 35

Genetica Umana

Riparazione del DNA

La maggior parte degli organismi hanno sistemi di riparazione, cioè pathway il cui compito è riparare

mutazioni sul DNA. I principali sistemi di riparazione sono: proofreading della DNA polimerasi, base excision

repair (BER), nucleotide excision repair (NER), mismatch repair e riparazione postreplicativa.

Mutazioni in geni coinvolti nella riparazione del DNA danno origine in generale a gravi patologie, molte delle

quali sono associate alla comparsa deterministica di tumori o ad un aumento della suscettibilità a sviluppare

tumori. Esempi:

Xeroderma pigmentoso con eredità AR è dovuta a mutazioni nel gene XPA, coinvolto nella NER. Sindrome

di Bloom con eredità AR dovuta a mutazioni nel gene BLM, codificante un’elicasi che interviene nella

riparazione postreplicativa. Atassia telangiectasia con eredità AR dovuta a mutazioni in ATM, una proteina

regolatrice che modifica, attivandoli, geni coinvolti nella riparazione in seguito a danni sul DNA.

Suscettibilità allo sviluppo di tumori al seno: mutazioni nei geni BRCA2 e BRCA1, coinvolti nella riparazione

di rotture a doppio filamento del DNA. Alcune mutazioni in uno di questi due geni rendono la proteina

ipofunzionale, e determinano una forte suscettibilità (fino all’85% per alcune mutazioni) a sviluppare tumori al

seno nelle donne.

Proofreading della DNA polimerasi: le DNA polimerasi “replicative” sono in genere dotate di un’attività di

proofreading, di “correzione di bozze”. Esse posseggono un dominio polimerasico responsabile della sintesi

del nuovo filamento e un dominio 3’-5’ esonucleasico di proofreading. Se durante la sintesi viene incorporata

una base sbagliata, la replicazione si ferma e il dominio esonucleasico rimuove la base sbagliata.

Base excision repair (BER): questo sistema ha il compito di riparare, cioè rimuovere, basi che sono

modificate. Nel primo step intervengono specifiche DNA glicosilasi, che scindono il legame fra il

desossiribosio e la base modificata, dando origine ad un sito apurinico. Intervengono poi endonucleasi e

ligasi.

Nucleotide excision repair (NER): questo sistema ha il compito di riparare danni estesi a una o più basi

contigue, come dimeri di timina, basi con addotti ingombranti. In questo caso gli enzimi iniziali che

intervengono sono uguali indipendentemente dal danno, ma sono diversi da quelli che agiscono nella BER.

Inoltre sono coinvolte molti complessi proteici il cui compito è quello di “trovare” regioni distorte di DNA a

causa della lesione.

Mismatch repair: questo sistema ha il compito di riparare mismatch (malappaiamenti) cioè un sito in cui sono

appaiate due basi non complementari (Es. AC). Gli enzimi coinvolti sono vari, fra cui enzimi che riconoscono

il mismatch, endonucleasi, esonucleasi, polimerasi, ligasi.

Riparazione postreplicativa: questo sistema ha il compito di riparare vari danni, fra cui basi danneggiate,

rotture a singolo e doppio filamento. Gli enzimi coinvolti sono vari, ma differentemente dagli altri casi implica

una ricombinazione. Patologia molecolare

Una mutazione produce un allele mutato responsabile della malattia. Vi sono due tipi di mutazioni: mutazioni

con perdita funzionale e mutazioni con acquisizione di funzione.

Nelle prime, il prodotto genico mutato non ha la stessa funzionalità del prodotto genico normale. Si dividono

in mutazioni ipofunzionali (allele ipomorfo) e non funzionali (allele nullo o amorfo). In caso di null loss-of-

function (allele nullo), l’allele mutato non produce un prodotto genico (es. mutazioni nel promotore). Queste

mutazioni possono portare anche a prodotto genico degradato, non in grado di assumere la giusta

conformazione o alla formazione di un prodotto genico la cui attività è nulla. In caso di leaky loss-of-function

(allele ipomormo), l’allele mutato produce meno prodotto genico (es. mutazioni nel promotore). Queste

mutazioni possono portare anche a prodotto genico parzialmente degradato o alla produzione di un prodotto

genico con attività ridotta.

Nelle mutazioni con acquisizione di funzione invece, il prodotto genico funziona mutato in modo anomalo.

Queste mutazioni possono provocare interferenze con il prodotto genico funzionale e tossicità. Nel caso in

cui l’allele mutato sia ipermorfo, questo codifica per un prodotto genico maggiormente funzionale, ad

36

Genetica Umana

esempio aumento del prodotto genico oppure prodotto genico con una maggiore attività. Può essere causa

di patologia. Nel caso in cui l’allele mutato si neomorfo, questo codifica per un prodotto genico che ha

acquisito un’altra funzione. Infine, nel caso in cui l’allele mutato sia antimorfo, questo codifica per un prodotto

genico che ha una funzione antagonista rispetto all’allele wt.

Alleli nulli e ipomorfi determinano una condizione di emizigosità e possono portare come conseguenza a due

tipi di eredità: il prodotto genico wt è sufficiente affinché non si produca la patologia (l’eredità sarà di tipo

recessivo) oppure il prodotto genico wt non è sufficiente affinché non si produca la patologia (l’eredità sarà

di tipo dominante per aploinsufficienza).

Alleli ipermorfi possono determinare una patologia in quanto l’attività è in eccesso. In questo caso: se la

mutazione in un solo allele (eterozigosi) non determina patologia l’eredità è di tipo recessivo. Se la

mutazione in un solo allele determinà patologia l’eredità è di tipo dominante per eccesso di funzione (più

comune).

Alleli neomorfi determinano una patologia recessiva (se la nuova funzione non interferisce col metabolismo)

oppure dominante per acquisizione di funzione (se la nuova attività interferisce col metabolismo

dell’organismo, più comune).

Alleli antimorfi determinano sempre una patologia dominante per acquisizione di funzione negativa, o

dominante negativo: il prodotto genico mutato interferisce con l’attività del prodotto genico wt oppure, il

prodotto genico mutato forma dei complessi non funzionali col prodotto genico wt, riducendo l’attività

complessiva.

Mutazioni possono rendere un allele nullo o ipomorfo in vari modi:

- Delezione dell’intero gene (nullo)

- Delezione di parte del gene (in generale nullo, raramente ipomorfo)

- Inserimento di una lunga regione all’interno del gene, es. sequenza LINE (nullo)

- Traslocazione di parte del gene, che risulta tronco (in generale nullo)

- Inversione di una parte del gene, he risulta tronco (in generale nullo)

- Mutazione nel promotore (allele nullo o più in generale ipomorfo)

- Mutazione nel sito di poliadenilazione che rende l’mRNA instabile (in generale ipomorfo)

- Mutazione nel sito 5’UTR che riduce la traduzione (in generale ipomorfo)

- Mutazione esonica nonsenso che porta a degradazione dell’mRNA mediante mRNA decay (in generale

nullo)

- Mutazione nel sito donatore di splicing o nel sito accettore di splicing (nullo o ipomorfo)

- Mutazione che attiva un sito criptico di splicing (allele nullo o ipomorfo)

- Inserzione o delezione esonica con frameshift (nullo)

- Mutazione missenso (nullo o ipomorfico)

- Mutazione non senso (in generale nullo)

- Mutazione in una sequenza di regolazione posttraduzionale (nullo o spesso ipomorfico)

- Mutazione in una sequenza di localizzazione subcellulare (nullo o ipomorfo)

Mutazioni possono rendere un allele ipermorfo in vari modi (esempi: duplicazione del gene DSS (maschi con

disgenesi gonadica, XR), duplicazione del gene PMP22 (sindrome di Charcot-Marie-Tooth, AD)):

- Duplicazione genica

- Traslocazione del gene, che può trovarsi sotto un promotore più forte

- Mutazione nel promotore

- Mutazione missenso

- Mutazione in una sequenza di regolazione posttraduzionale

Mutazioni possono rendere un allele neomorfo in pochi modi (esempi: sostituzione Met358Arg nella proteina

codificata dal gene PI. Il gene PI codifica per l’antitripsina, coinvolta nella coagulazione. L’elastasi rompe il

37


PAGINE

52

PESO

1.18 MB

PUBBLICATO

6 mesi fa


DETTAGLI
Corso di laurea: Biologia
SSD:
Università: Trieste - Units
A.A.: 2018-2019

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher valentinareverberi95 di informazioni apprese con la frequenza delle lezioni di Genetica umana e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Trieste - Units o del prof Baruffini Enrico.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Biologia

Biologia - Evoluzione, classificazione dei viventi ed ecologia
Appunto
Citologia 1
Appunto
Riassunto di Istologia
Appunto
Biologia - Struttura della cellula e ereditarietà
Appunto