Che materia stai cercando?

Genetica umana Appunti scolastici Premium

Gli appunti comprendono: genetica dei caratteri mendeliani (trasmissione e studio dei pedigree); eredità non mendeliana; genetica di popolazione; consulenza genetica; genetica diretta e indiretta (clonaggio posizionale, analisi di linkage, polimorfismi e LOD score); aplotipi e linkage disequilibrium; fibrosi cistica; analisi di restrizione e varie metodiche; eredità dei caratteri complessi;... Vedi di più

Esame di Genetica umana docente Prof. G. Rose

Anteprima

ESTRATTO DOCUMENTO

unità di mappa (um).

La distanza di mappa tra due geni è misurata in Una u.m. è

l’intervallo entro il quale avviene l’1% di eventi di crossing-over.

Frequenze Di Ricombinazione

Gli incroci genetici forniscono le (F.R.): vengono

utilizzate per stimare la distanza di mappa; quindi:

1 um = F.R. dell’1%

Una unità di mappa è la distanza tra 2 geni per i quali viene prodotto 1 ricombinante

su 100 (F.R. tra due geni = 1 % corrisponde a 1 unità di mappa).

Le unità di mappa possono essere espresse anche in centiMorgan (cM).

La frequenza di ricombinazione è data da:

N ° FIGLI RICOMBINANTI

F . R .= ×100

N ° TOTALE DEI FIGLI

Esistono molti modi per arrivare all’identificazione di un gene, sia esso patologico o

non. Tutti i percorsi, comunque, passano attraverso un gene candidato, che può essere

identificato con strategie diverse:

Clonaggio funzionale. Le basi biochimiche della patogenesi sono conosciute e

 vengono sfruttate per isolare un clone del gene. Se il prodotto genico è noto, la sua

parziale purificazione può permettere l’adozione di varie strategie per identificare il

gene responsabile. Alternativamente, può essere usato un saggio funzionale per

controllare la presenza del gene.

Clonaggio posizionale. Il gene viene identificato senza conoscere nient’altro che la

 sua localizzazione sub cromosomica. La strategia è di cercare di costruire la mappa

fisica e la mappa genetica della regione, precisare la localizzazione sub

cromosomica e poi identificare i geni presenti nella regione.

Strategie con gene candidato indipendenti dalla localizzazione . Si può sospettare

 che un gene sia responsabile di un dato fenotipo senza sapere nulla della sua

localizzazione cromosomica. Ciò può avvenire se un certo fenotipo assomiglia ad

un altro fenotipo, in animali o esseri umani, per il quale si conosca il gene

responsabile o se la patogenesi molecolare suggerisce che il gene possa essere

membro di una famiglia genica nota.

Strategie con gene candidato per posizione . Una volta che una patologia sia stata

 mappata, è possibile ricorrere alla ricerca nelle banche dati per identificare i geni

candidati. La regione cromosomica del locus viene identificata tramite l’analisi del

linkare studiando una o più famiglie con la malattia.

Si riconoscono essenzialmente due tipologie di approcci sperimentali

nell’identificazione di geni patologici:

Genetica diretta

1. (clonaggio funzionale).

Si tratta di un approccio di analisi che permette di risalire dal fenotipo al gene che

lo determina.

Si compone di più fasi:

Isolamento della molecola mutante;

 Sequenziamento aminoacidico;

 Sintesi di una sonda oligonucleotidica (tenendo in considerazione la

 degenerazione del codice genetico);

Screening di una genoteca genomica o di cDNA;

 Clonaggio molecolare (e conseguente identificazione del gene);

 Analisi di sequenza e di espressione che porta all’identificazione della

 mutazione.

Questo tipo di approccio è stato impiegato nel 1984 per isolare il gene che codifica

per il fattore VIII della coagulazione, la cui mancanza è causa di Emofilia A. Si è

preceduto, anzitutto, con la purificazione della proteina dal maiale, cui hanno fatto

seguito il sequenziamento aminoacidico e la determinazione della sequenza

nucleotidica. Si è poi passati alla generazione di oligonucleotidi specifici da ibridare

ad una libreria di cDNA. Per ultimo, il clone isolato è stato utilizzato per isolare il

gene umano.

La metodica diretta ha trovato applicazione anche nell’identificazione del gene

betaglobinico implicato nell’insorgenza dell’Anemia falciforme, condizione

patologica caratterizzata dalla produzione di una forma anomala di emoglobina,

denominata emoglobina S. le molecole di emoglobina S tendono ad aggregarsi fra

loro formando globuli rossi con un tipico aspetto “a falce”.

In questa circostanza si è preceduto con:

- Isolamento della molecola mutante da individui con globuli rossi a falce;

- Sequenziamento aminoacidico;

- Identificazione della sostituzione Glu/Val in posizione VI della catena β;

- Generazione di oligonucleotidi specifici da ibridare ad una libreria di cDNA

genomico;

- Isolamento del clone con la sequenza desiderata;

- Mappaggio del gene sul cromosoma.

Altro esempio di applicazione dell’approccio diretto è fornito dall’identificazione dl

gene coinvolto nello sviluppo della Fenilchetonuria (PKU). Si tratta di un disordine

caratterizzato da deficit della Fenilalanina-idrossilasi (PHA), che comporta

l’impossibilità di convertire fenilalanina in tirosina. La fenilalanina tende così ad

accumularsi nel tessuto nervoso o ad essere convertita in acido fenilpiruvico. In

questo caso, la procedura è stata differente:

- Analisi del tessuto;

- Isolamento della proteina;

- Produzione di anticorpi specifici nel coniglio o nel topo;

- Utilizzo di anticorpi diretti contro la proteina come sonda per vagliare

sistematicamente una libreria di cDNA, mediante l’uso di vettori d’espressione.

Una strategia alternativa prevede l’identificazione del gene patologico

conoscendone la sua normale funzione . Si parte da un saggio di

complementazione funzionale, in cui si cercano frammenti di DNA isolati a caso che

modifichino una funzione in un organismo ricevente o in una linea cellulare

difettiva.

Si riconoscono diversi sistemi modello:

Linee cellulari di mammifero. Si impiegano linee deficitarie per una determinata

 funzione; le cellule vengono trasdotte con frammenti di DNA umano; si

selezionano le linee in cui la funzione normale è ripristinata.

Lievito. Si impiegano mutanti funzionali di lievito; per alcune proteine l’omologia

 di sequenza lievito/uomo è sufficientemente elevata per cui proteine umane

possono ripristinare funzioni di lievito.

Topi transgenici. Si incrociano topi portatori di mutazioni con topi transgenici

 (portatori di un gene umano) e si valuta quale transgene sia in grado ripristinare

la normale funzione nella progenie.

Genetica inversa

2. (clonaggio posizionale).

Ad oggi si contano circa 1200 patologie mappate mediante clonaggio posizionale.

La strategia è di cercare di costruire la mappa fisica e la mappa genetica della

regione, precisare la localizzazione sub cromosomica e poi identificare i geni

presenti nella regione.

Distinguiamo:

Mappaggio fisico. Localizza i geni sui cromosomi; la distanza fisica tra i geni è

 espressa come “coppie di basi”, bp. Ve ne sono di due tipi:

- A bassa risoluzione fornisce al gene un’assegnazione cromosomica e/o una

localizzazione in una regione cromosomica (braccio);

- Ad alta risoluzione consente il mappaggio fine (fino al singolo nucleotide)

della regione che contiene il gene e/o l’ordine di mappaggio.

Mappaggio genetico. Descrive l’ordine dei geni lungo i cromosomi. Le mappe

 genetiche sono costruite usando incroci genetici e, nel caso dell’uomo,

ANALISI DI LINKAGE

attraverso l’analisi dei pedigree o . Quest’ultima permette

di mappare un gene sulla base dello studio della sua vicinanza ad un altro locus

sullo stesso cromosoma. Le distanze tra i geni sono espresse in centimorgan

(cM).

Scopo del mappaggio genetico è, dunque, scoprire con quale frequenza due loci

vengono separati dalla ricombinazione durante la meiosi.

tendenza di geni o di altre sequenze di DNA in specifici loci a essere

Il LINKAGE è la

ereditati insieme in conseguenza della loro vicinanza fisica su un singolo cromosoma .

Due geni che mappano sullo stesso cromosoma si dicono “sintenici”. Due geni

sintenici segregherebbero sempre assieme se non esistesse il crossing-over nella

prima divisione meiotica. L’evento di crossing-over da luogo alla formazione di gameti

ricombinanti.

Se due loci non sono associati avremo il 50% di gameti non ricombinanti ed il 50% di

gameti ricombinanti per questi due loci. Il crossing-over separerà raramente loci che si

trovano molto vicini sullo stesso cromosoma, in quanto solo un crossing-over

localizzato esattamente nel piccolo spazio che li separa creerà dei ricombinanti.

Quindi, gruppi di alleli di loci contigui tendono ad essere trasmessi in blocco lungo le

aplotipo

generazioni di un dato albero genealogico. Tale blocco di alleli è detto .

Più due loci sono distanti, più è probabile che un evento di crossing-over li separi. Si

frazione di ricombinazione (

definisce un valore detto θ), che fornisce una misura

della distanza di due loci.

n ° meiosiricombinanti

θ= n° meiosi totali

0 loci molto vicini (Associati)

θ=¿ 

0,5 loci molto lontani o su cromosomi diversi (Assortimento Indipendente)

θ=¿ 

La frazione di ricombinazione alla meiosi è una misura della distanza genetica.

L’unità di misura è il centimorgan cM, ossia la lunghezza genetica in cui si ha l’ 1% di

ricombinazione (θ=0,01).

Conoscendo la frazione di ricombinazione e sapendo che due loci distanti 1 cM

avranno una frazione di ricombinazione uguale a 0,01, possiamo ricavare la distanza

genetica fra due loci, ricordando che la distanza genetica non e’ uguale alla distanza

fisica.

Le mappe fisiche mostrano l’ordine dei loci, corrispondenti a geni e marcatori, lungo il

cromosoma e le loro distanze in chilobasi o in megabasi; le mappe genetiche mostrano

il loro ordine e la probabilità che essi siano separati dalla ricombinazione.

La ricombinazione non è casuale. Il sesso eterogametico ha un numero di chiasmi

inferiore. I chiasmi sono più frequenti nella meiosi femminile.

Grossolanamente 1cM= 1Mb, ma ci possono essere zone di scarsissima

ricombinazione lunghe fino a 5Mb, con una ricombinazione media fra i due sessi

inferiore a 0,3 cM per Mb e viceversa zone con ricombinazione superiore a 3cM per

1Mb (hot spots). La variazione più estrema è rappresentata dalla regione

pseudoautosomica situata all’estremità del braccio corto dei cromosomi X e Y. Nei

maschi avviene un crossing-over obbligatorio entro questa regione di 2,6Mb, per cui

essa risulta lunga 50cM. Per questa ragione:

- Nei maschi 1 cM = 1,o5 Mb

- Nelle femmine 1 cM = 0,70 Mb

Ne consegue che in media 1 cM = 0,88 Mb

Ancora, nei maschi la frequenza di crossing-over è più alta in corrispondenza delle

regioni subtelomeriche rispetto a quelle centromeriche, mentre le regioni

centromeriche presentano ricombinazione nelle femmine.

L’analisi di linkage permette di determinare la posizione cromosomica di un locus

responsabile di una determinata malattia/carattere genetico rispetto a marcatori

polimorfici la cui localizzazione è nota.

locus marcatore

2 loci locus gene-malattia fenotipo

L'analisi si basa sulla co-segregazione, alla meiosi, di due o più loci più

frequentemente di quanto ci si aspetti nella segregazione indipendente. Se due loci

vengono frequentemente ereditati assieme è probabile che siano vicini sullo stesso

cromosoma.

Obiettivo dell’analisi di linkage è identificare un segmento di DNA a localizzazione

nota, indicato da tutti i membri affetti della famiglia ma non ereditato dai membri non

mappa di marcatori: marcatore

affetti. Requisito essenziale è una il è un qualsiasi

carattere mendeliano polimorfico che possa essere usato per seguire un segmento

cromosomico nelle generazioni in un dato albero genealogico.

Per mappare il gene è necessario conoscere la posizione del marcatore. Vengono

costruite per questo delle mappe genetiche dei marcatori usando un mappaggio

marcatore-marcatore.

Il linkage è un metodo statistico parametrico.

Qualsiasi carattere mendeliano e polimorfico può essere usato come marcatore: e’

meglio che il carattere possa essere individuato facilmente e a basso costo, utilizzando

materiale facilmente reperibile. Per rendere più facile il mappaggio è necessario che i

marcatori siano tanti e quanto più possibile vicini fra loro (progetto genoma).

Nei primi anni ’80, i polimorfismi del DNA hanno fornito per la prima volta un gruppo di

marcatori sufficientemente numerosi e spaziati lungo tutto il genoma.

Polimorfismo

Il è definito come la presenza, nella popolazione, con frequenza

maggiore all'1%, di 2 o più forme (“alleli” o “varianti”) di un gene o di una data

sequenza di DNA. I polimorfismi possono essere silenti, ovvero non avere alcun effetto

sul fenotipo. Possono essere dovuti a sostituzione, mutazione, o delezione, di una

singola base, o alla variazione del numero di “ripetizioni tandem”. La maggior parte

scompare nel tempo e alcuni si stabilizzano, per fatti legati al caso oppure si

mantiene in seguito a selezione naturale, perché conferisce vantaggio agli individui

che lo presentano. La frequenza di questa mutazione aumenta e si può fissare nella

popolazione. Il gene ancestrale scompare e rimane il polimorfismo con frequenza

superiore all’1%.

Migliaia di siti polimorfici sono stati identificati nell'ambito dell'Human Genome Project.

I polimorfismi usati nello studio delle famiglie affette da malattie genetiche sono:

RFLP (Restriction Fragments Length Polymorphisms) Gli enzimi di restrizione

 tagliano il doppio filamento di DNA a livello di specifiche sequenze palindromiche.

Le sequenze palindromiche possono venire interessate da mutazioni che alterano il

sito riconosciuto dall'enzima per cui alla digestione vengono generati frammenti di

lunghezza diversa da quella canonica. Tramite il Southern Blot (elettroforesi su gel)

i frammenti generati vengono separati in base alla loro lunghezza in bande di

migrazione differenti. Gli RFLP sono sistemi a due alleli (il sito di restrizione può

esserci o non esserci).

VNTR (Variable Number of Tandem Repeats). I microsatelliti sono ripetizioni, in

 numero variabile, di 2 – 4 basi che sono sparsi nel genoma. Il numero di ripetizioni

è variabile e quindi questi sistemi sono a più alleli e sono molto informativi; sono

utili per le analisi di linkage e di segregazione. Le sequenze ripetute sono affiancate

da sequenze uniche che permettono l'identificazione delle ripetizioni stesse. I

microsatelliti più usati sono i CArepeats (...CACACACA...). Amplificandoli con la PCR

e facendoli scorrere in elettroforesi otteniamo bande di migrazione diverse in base

al numero delle ripetizioni, cioè in base alla lunghezza del frammento. Attualmente

la lunghezza dei frammenti può essere determinata automaticamente con il

sequenziatore. Studiando in una famiglia un polimorfismo situato vicino al gene di

nostro interesse possiamo determinare il genotipo dell'individuo. Per esempio, se il

gene malattia nella madre è vicino ad una ripetizione di lunghezza nota, e troviamo

la stessa lunghezza di ripetizione nel figlio, vuol dire che il gene della madre è stato

ereditato dal figlio.

SNPs (Single Nucleotide Polymorphisms). Sono variazioni di singole basi e sono

 sistemi a 2 alleli, ma sono molto frequenti nel genoma (circa 3'000'000 di SNPs).

Sono utili per le analisi di linkage e di segregazione. Il vantaggio degli SNP è che

consentono un’altissima resa di genotipizzazione e presentano un’elevata densità

in ogni regione del genoma; inoltre, possono essere analizzati con metodi

automatici. Recentemente si è formato un consorzio con l'obiettivo di tracciare una

mappa degli SNPs per cercare come le loro variazioni incidano sulla suscettibilità a

diverse malattie.

La prima mappa genetica completa del genoma umano si basava sugli RFLP (1987). La

distanza media tra due marcatori è di 10 cM. Mappe genetiche ad alta risoluzione

ottenute mediante l’uso di micro satelliti, con risoluzione 1 cM. Con il Progetto Genoma

Umano sono stati individuati oltre 10.000 marcatori altamente distanziati e polimorfici

(risoluzione < 1cM).

Mappatura genetica a due punti.

1. Raccolta famiglie con diagnosi certa di una specifica malattia il cui locus genico è

ignoto

2. Costruzione degli alberi genealogici di tutte le famiglie

3. Determinazione del genotipo di tutti gli individui per uno o più marcatori polimorfici

4. Se la famiglia è informativa, si classificano gli individui in ricombinanti o non

ricombinanti tra il locus della malattia ed il marcatore analizzato.

Una famiglia è informativa se le meiosi nella suddetta famiglia sono informative. Una

meiosi informativa,

è cioè utile per gli studi di linkage, quando si può identificare la

fase dei due loci e quindi stabilire se il gamete sia o meno ricombinante.

Perché la meiosi sia informativa il genitore deve essere doppio eterozigote per i due

loci. L’eterozigosità (H) media di un marcatore (la probabilità che una persona presa

a caso nella popolazione risulti eterozigote) è un buon indice di informatività. Se gli

p p p

alleli del marcatore A A A hanno frequenze la proporzione di individui

1 2 3

1 2 3

eterozigoti è: ¿ p p p …p

2 2 2 2 )

  

H=1−¿ 1 2 3 i

La tipizzazione di famiglie ampie ed informative, dove segrega una specifica malattia

genetica, consente di stabilire se esiste una “concatenazione” tra un marcatore

specifico ed il locus malattia.

L’esistenza di un rapporto di concatenazione viene dimostrata tramite vari metodi, tra

rapporto di massima verosimiglianza lod score

cui quello del (o metodo dei ).

l'indice Z,

Il metodo del Lod Score calcola che è un rapporto tra la probabilità H0 che la

progenie di quella famiglia sia ottenuta in assenza di concatenazione (q = 0.5) e la

probabilità H1 che la stessa progenie si sia generata in presenza di concatenazione

(0 < < 0.5). Queste probabilità vengono più esattamente definite come

q

verosimiglianza delle osservazioni nelle due ipotesi di indipendenza e di linkage.

Si calcola quindi il rapporto di verosimiglianza (L =H1/H0 ) e si cerca il valore di θ per

cui tale rapporto risulta massimo. Per semplicità di calcolo si usa il logaritmo in base

10 del rapporto di verosimiglianza:

Z(q) = log [H(q)/H(q =0.5)]

10

Le analisi di linkage nell'uomo utilizzano metodi basati sul calcolo della

verosimiglianza o likelihood.

Come si procede per calcolare i LOD score?

1. calcolo della verosimiglianza ‘a posteriori’ ( sulla base del risultato osservato) per

q

una serie di ipotesi di linkage, cioè di valori di ricombinazione ;

i

q q

2. calcolo, per ciascun valore , dell’ODD ratio (= verosimiglianza dell’ipotesi /

i i

verosimiglianza dell’ipotesi di indipendenza);

3. calcolo del Logaritmo degli ODD (= LOD).

Le analisi di linkage nell'uomo utilizzano metodi basati sul calcolo della

verosimiglianza o likelihood. probabilit à c h e iloci siano associatia un dato θ

LOD SCORE=Z(θ)= (θ=0,5)

probabilit à c h e i loci non siano∈linkage

Il LOD SCORE è definito come il logaritmo delle probabilità che i loci siano associati

(con frazione di ricombinazione θ) piuttosto che non associati (frazione di

ricombinazione 0,5).

Conteggio ricombinanti e calcolo del lod score

PEDIGREE A FASE NOTA

Modello di ereditarietà: deduco i genotipi per il locus malattia

 La fase è nota

 Individuo i ricombinanti

 R NR

(1−θ)

θ ¿

LOD SCORE = R+ NR

=log ¿

Ζ ¿ 0,5

( )

10

PEDIGREE A FASE NON NOTA

Modello di ereditarietà: deduco i genotipi per il locus malattia:

 La fase non è nota

 Individuo i ricombinanti.

 R NR

(1−θ)

θ ¿

NR R

(1−θ)

θ

LOD SCORE = ¿

1 1

+ +NR

R NR R

=log ¿ + ¿

Ζ ¿ ¿

0,5 0,5

( ) ( )

10 2 2

La mappatura di una malattia si ottiene quando il valore di Z e uguale o superiore a 3.

In

effetti questo valore sta ad indicare che l’ipotesi di concatenazione per un determinato

valore di θ è 1000 volte più probabile di quella di indipendenza.

Limiti di significativita:

- Z > 3 : evidenza di linkage significativa

- 2<Z<3 : suggestiva evidenza di linkage

- -2<Z<2 : linkage non informativo

- Z < -2 : si può escludere la presenza di linkage.

L’analisi di linkage è meno ambigua se viene effettuata utilizzando famiglie con un

elevato numero di figli e in cui può essere ricavato il genotipo dei membri di almeno

tre generazioni. Presso il CEPH sono state collezionate linee cellulari immortalizzate di

membri di famiglie selezionate in base alla loro struttura ideale per l’analisi di linkage.

Le 40 famiglie CEPH comprendono individui di tre generazioni, con i 4 nonni, i 2

genitori e almeno 6 figli, il cui DNA è a disposizione di tutti i ricercatori per la

costruzione di mappe genetiche. I risultati delle mappe sono disponibili in banca dati

ad uso di tutti.

È possibile utilizzare le frequenze di ricombinazione per mappare un consistente

numero di loci, considerandone due alla volta.

Nel caso in cui i dati ricavati da una solo famiglia non siano sufficienti per stabilire la

presenza /assenza di linkage è possibile utilizzare i dati nel loro complesso, in quella

analisi di linkage a più punti (Multipoint Lod Score).

che è nota come I lod score

ottenuti da famiglie indipendenti (per lo stesso valore di θ) si possono sommare fra

loro : il valore di θ per cui il Lod Score è massimo è la stima più probabile della

frazione di ricombinazione. Definiamo il Maximum Likelihood Score (MLS) come il

valore massimo di lod score che si ottiene al variare del parametro θ. Data una mappa

di markers con posizione nota, si calcola la likelihood per ogni posizione del locus

malattia lungo il cromosoma. Permette di estrarre il massimo dell’informazione data da

tutti i markers sul cromosoma.

Mappaggio di geni malattia mediante l’analisi di linkage

Una delle applicazioni più importanti dell’analisi di linkage è rappresentata dalla

localizzazione sul cromosoma di geni malattia. A tal fine si procede, inizialmente, con

un’analisi di linkage a due punti considerando il locus malattia e una serie di loci

marcatori (considerati uno alla volta).

Nelle famiglie in esame si procede quindi ad analizzare la segregazione degli alleli al

locus marcatore rispetto a quella del fenotipo. Se il locus della malattia e il locus

marcatore sono strettamente associati, verranno trasmessi insieme alla progenie, a

meno che durante la meiosi non siano avvenuti eventi di crossing-over.

L’associazione degli alleli al locus marcatore con il locus malattia prende il nome di

“determinazione della fase”; poiché l’allele al locus marcatore non è responsabile

della malattia, la fase deve essere determinata in ogni singola famiglia.

Per poter calcolare il LOD score a due punti è necessario specificare qual è il modello

genetico della malattia in questione. Le componenti di tale modello sono:

- Il tipo di ereditarietà (dominante o recessiva, associata all’X o autosomica);

- La frequenza dell’allele malattia;

- La penetranza dell’allele malattia;

- La frequenza delle nuove mutazioni al locus malattia;

- La possibile presenza di fenocopie;

- La possibile eterogeneità genetica;

- La frequenza degli alleli al locus marcatore.

Dopo aver delineato il modello genetico, viene effettuata l’analisi statistica per

stabilire la probabilità dell’associazione tra locus marcatore e locus malattia,

utilizzando le formule per il calcolo del LOD score. Una volta identificato un LOD score

significativo (Z ≥+3) tra il locus malattia e un locus marcatore, si ricercano nelle

mappe genetiche del cromosoma implicato altri loci marcatori situati in vicinanza del

primo e si tipizzano le famiglie. Si esegue un’analisi multipoint, in cui la localizzazione

del gene malattia viene considerata in combinazione con tutti gli altri loci testati. In

questo tipo di analisi, data una serie di marcatori di cui sono noti localizzazione, ordine

e spaziatura sul cromosoma, viene determinata la migliore localizzazione del locus

malattia in modo sequenziale, mettendolo in ogni possibile intervallo della mappa

genetica della regione precedentemente individuata.

L’ipotesi di associazione tra il locus malattia e il pannello dei loci marcatori viene poi

confrontata con l’ipotesi di non associazione.

Nella figura è rappresentato il grafico di un analisi di

LOD score multipoint. L’asse delle ascisse rappresenta

la distanza genetica tra marcatori, mentre nell’asse

delle ordinate è indicato il lod score. Il valore massimo

di lod score è -6 e si ottiene tra i loci 3 e 4 e i loci 5 e 6.

Un complemento all’analisi multipoint è rappresentato

dallo studio degli aplotipi, ovvero dell’ordine degli

alleli sui rispettivi cromosomi omologhi, che conduce

all’identificazione della regione critica (contenente il locus malattia). Per ricostruire gli

aplotipi è necessario identificare quale allele viene trasmesso nei gameti di ciascun

genitore e localizzare gli eventuali eventi di ricombinazione tra marcatore e marcatore

o tra marcatore e malattia.

I metodi di linkage parametrici sono generalmente applicati ai tratti mendeliani; il loro

utilizzo, tuttavia, comporta una serie di limitazioni quali:

- Necessità di specificare un modello genetico esatto per la patologia (penetranza e

frequenze alleliche).

- Problemi con l’eterogeneità di loci (mutazioni su loci differenti possono dare lo

stesso fenotipo patologico); assume l’esistenza di un solo locus.

- Limiti nella risoluzione definitiva raggiungibile (circa 1 Mb).

Offre anche una serie di vantaggi:

- Statisticamente è un approccio molto più potente di ogni altro metodo non

parametrico.

- Utilizza informazioni genotipiche e fenotipiche di ogni membro della famiglia.

- Fornisce una stima della frazione di ricombinazione.

L’equilibrio di HW riguarda il modo in cui i gameti si assortiscono due a due a formare

equilibrio diploide.

gli individui, possiamo definirlo quindi un L’altro importante

EQUILIBRIO APLOIDE

equilibrio genetico è un e riguarda il modo con cui alleli di loci

diversi (polimorfici) si assortiscono entro i singoli gameti. Sono entrambi equilibri

stabili.

Se in una popolazione i due loci A e B hanno ciascuno due alleli (A1 e A2; B1 e B2), il

pool gametico della popolazione sarà composto da 4 tipi diversi di gameti:

A1B1 A1B2 A2B1 A2B2

Ognuno caratterizzato da specifiche frequenze:

p(A1) = freq. allele A1 p(B1) = freq. allele B1

q(A2) = freq. allele A2 q(B2) = freq. allele B2

Esiste equilibrio aploide quando le frequenze gametiche sono:

fr.(A1B1) = p(A1) x p(B1)

fr.(A1B2) = p(A1) x q(B2)

fr.(A2B1) = q(A2) x p(B1)

fr.(A2B2) = q(A2) x q(B2)

Esiste quindi una sola serie di frequenze che soddisfa la condizione di equilibrio,

mentre ne possiamo immaginare molte che costituiscono condizioni di disequilibrio.

Se i loci A e B sono in disequilibrio, la probabilità di trasmettere un allele ad un locus e

un altro allele all’altro locus e non sono indipendenti. Per cui:

A B

fr.(AB) f(A) x f(B)

Supponiamo che: locus A p(A1) = 0.8 q(A2) = 0.2

locus B p(B1) = 0.7 q(B2) = 0.3

le frequenze gametiche all’equilibrio sono:

A1B1 0.8 x 0.7 = 0.56

A1B2 0.8 x 0.3 = 0.24

A2B1 0.2 x 0.7 = 0.14

A2B2 0.2 x 0.3 = 0.06

gameti freq. attese freq. osservate D(oss – att)

all’eq.

A1B1 0.8 x 0.7 = 0.56 0.65 +0.09

A1B2 0.8 x 0.3 = 0.24 0.15 -0.09

A2B1 0.2 x 0.7 = 0.14 0.05 -0.09

A2B2 0.2 x 0.3 = 0.06 0.15 +0.09

Disequilibrio (D)

Si definisce la differenza tra le frequenze gametiche osservate e

quelle attese: D(oss) = 0.09

| |

D = P P

P  P

A1B1 A2B2 A1B2 A2B1

Il disequilibrio osservato è grande o piccolo?

Per rispondere a questa domanda dobbiamo confrontare il D osservato con quello

massimo teoricamente possibile in questo sistema, cioè con quello che si avrebbe in

caso di associazione completa tra due alleli e conseguente assenza di una

combinazione gametica. D(max)

Esistono due diversi tipi di

- D(max) I tipo l’allele meno comune dei 4 (in questo caso A2) sta sempre con

à

l’allele meno comune dell’altro sito (in questo caso B2), viene a mancare

l’assortimento A2B1 (la cui freq all’equilibrio è 0.2 x 0.7 = 0.14). Quindi D(max) I

tipo = 0.14

- D(max) II tipo l’allele meno comune dei 4 (A2) sta sempre con il più comune

à

dell’altro sito (B1); viene a mancare l’assortimento A2B2 (la cui freq all’equilibrio è

0.2 x 0.3 = 0.06).

Quindi D(max) II tipo = 0.06

In questo caso abbiamo un D di I tipo: l’allele meno comune dei 4 (A2) è associato

preferenzialmente con il meno comune dell’altro sito (B2). Infatti:

f(A2B2) attesa all’equilibrio = 0.06

mentre f(A2B2) osservata = 0.15

Dobbiamo quindi confrontare il D(oss) con il D(max) di I tipo (= 0.14) e calcolare il

Disequilibrio relativo (D’)

D’ = D(oss)/D(max) = 0.09/0.14 = 0.64

Dove Dmax e il massimo disequilibrio possibile per le frequenze alleliche osservate.

- Se D > 0 allora Dmax = min(P , P ),

P P

A1 B2 A2 B1

- Se D < 0consideriamo il valore assoluto di D1 e Dmax = min(P ; P ).

P P

A1 B1 A2 B2

Il D osservato è pari al 64% di quello massimo possibile date queste frequenze. Il

coefficiente D’ fornisce una misura degli eventi di ricombinazione nella regione

genomica. coefficiente r 2

Altro parametro utilizzato nella valutazione del LD è il , che tiene conto

della frequenza dei marcatori, risultando migliore di D’:

2

D

¿2 =

r P ∙ P ∙ P ∙ P

A 1 A 2 B 1 B 2

Quando si studiano due loci polimorfici quanto spesso li si trovano in disequilibrio

aploide? Quasi mai quando i due loci non sono associati; molto spesso, invece,

quando i due loci sono associati e tanto più i loci sono associati tanto più forte è il

grado di disequilibrio osservato.

Quando la causa del disequilibrio gametico è il linkage esso viene indicato con il

termine di Linkage Disequilibrium.

LINKAGE DISEQUILIBRIUM

Il è una situazione per cui un particolare aplotipo è

statisticamente più probabile in un sottogruppo di una popolazione. Indica che la

popolazione deriva da un comune ancestore o, nel caso delle mutazioni patogene, che

la mutazione è avvenuta su un cromosoma ancestrale comune alla popolazione.

Mutazioni e ricombinazioni sono i principali fattori che rispettivamente generano e

distruggono il LD. Quando si verifica una mutazione, si genera LD tra il sito mutato e

gli alleli adiacenti. Inizialmente la mutazione sarà associata solo a quei particolari

alleli, fino a quando non interviene la ricombinazione che separa la mutazione dagli

alleli a cui era associata e la congiunge ad altre forme alleliche.

Il livello di LD decresce con il tempo e con la distanza tra i marcatori (frazione di

ricombinazione) secondo la legge: t

D = (1 - r) D

t 0

dove D rappresenta il LD al momento di inizio e D è il LD dopo t generazioni.

0 t

Per loci indipendenti r = 0.5, quindi il Disequilibrio si dimezza ad ogni generazione,

sono cioè sufficienti poche generazioni per raggiungere le frequenze di equilibrio.

Quanto più i loci sono vicini tanto più r è piccolo e quindi sono necessarie parecchie

generazioni per il linkage equilibrium.

Il linkage disequilibrium si può spiegare con l’effetto fondatore: viene mantenuta la

stessa posizione degli alleli presente al momento in cui è avvenuta la mutazione sul

cromosoma ancestrale.

Consideriamo il gene CF: Linkage equilibrio tra A e

CF (CF può trovarsi sia in

coupling con A1 che con

A2): 50% CF-A1 e 50%

CF-A2.

Linkage disequilibrio tra

B1 e CF (CF si trova

sempre e solo in

coupling con B1): 100%

CF-B1.

Linkage disequilibrium

come strumento di

mappaggio per geni

malattia

Gene della Fibrosi

Cistica

Fibrosi Cistica

La è una patologia autosomica recessiva, che si caratterizza per

un’eccessiva produzione di secrezioni dense. Si osserva un malassorbimento cronico

che comporta incapacità di crescere normalmente (deficit della secrezione degli

enzimi pancreatici e quindi insufficiente digestione delle proteine e grassi); inoltre, si

hanno frequenti infezioni del tratto respiratorio da semplici raffreddori a polmoniti

(ostruzione delle vie respiratorie minori da parte di un muco denso e loro

colonizzazione da parte di batteri.

Caratteristica è la secrezione di NaCl nel sudore (rappresenta anche un test

diagnostico).

Nel 1985 il gene della fibrosi cistica (CF) viene associato ad un polimorfismo proteico

(enzima paraossonasi) di cui si ignora la localizzazione, nediante analisi di linkage.

Per una patologia autosomica recessiva l’analisi di linkage e’ ostacolata dal fatto che

non si conosce la fase, per cui il calcolo si effettua prima considerando che i 2

cis trans lod score

loci(allele polimorfico e locus malattia) siano in e poi in e il valore di

sara’ la media tra i due valori ottenuti.

Nel 1986 furono trovati altri marcatori associati alla CF e il gene della paraossonasi

viene mappato sul cromosoma 7. Tra ognuno di questi marcatori e il gene della CF

sono stati trovati dei ricombinanti; nessuno di questi marcatori è, però, il reale

responsabile della CF. Fu identificata la regione, utilizzando gli RFLP della regione: si

restringe la mappatura di CF alla bande citogenetiche 7q31-32. Met

Si definirono inoltre i marcatori fiancheggianti, come l’oncogene prossimale e il

D7S8 (clone anonimo) distale.

Dal 1986 in poi, si identificano altri polimorfismi nella regione e si fonda un consorzio

chromosme walking,

per cumulare i dati raccolti in più centri. Viene attuato prima il

successivamente, per ovviare alla brevità delle sonde disponibili, si passò al

chromosme jumping.

Nel 1989, si riesce ad evidenziare la presenza di linkage disequilibrium per i marcatori

XV2.c e KM19 che risulteranno far parte del 5’ del gene . Dai dati ottenuti su 114

famiglie britanniche con un figlio affetto: Il cromosoma CF è stato identificato perché

presente nell’affetto, il quale tende a portare gli alleli X1 e K2.

una volta clonato il gene putativo, bisogno’ dimostrare che era il gene della fibrosi

cistica. Furono pertanto esaminati gli affetti e si trovo’ che il 70% dei cromosomi CF

ORF.

presentavano la delezione di una tripletta (ΔF508) senza che venisse alterata la

cystic fibrosis transmembrane conductance

Il prodotto del gene e’ stato definito CFTR(

regulator).

La presenza in omozigosi della ΔF508 in individui gravemente affetti non era

conclusiva, anche se molto convincente: la delezione avrebbe potuto essere un

linkage disequilibrium

polimorfismo come altri in strettissimo con il gene. L’

identificazione del coinvolgimento di CFTR nel trasporto dello ione cloro attraverso le

membrane apicali e la caratterizzazione di alcune mutazioni il cui effetto era piu’

evidente sull’espressione del gene confermarono che CFTR era il gene della Fibrosi

Cistica.

Oggi sono state descritte oltre 700 mutazioni nel gene CFTR. Molte vengono definite

mutazioni private, perché individuate in una sola famiglia. In molti casi non è certo che

siano patogene, potrebbero essere sequenze varianti in un cromosoma in cui è

presente un allele CF.

Non ci sono altre mutazioni molto frequenti, sono tutte mutazioni con frequenza che

non supera qualche punto percentuale: in media il 70% degli alleli mutati sono ΔF508;

altre 12 mutazioni hanno una frequenza combinata del 15%.

La presenza di centinaia di mutazioni diverse rende molto difficili i test diagnostici per

la CF. Questi consistono in:

- Screening per PCR e successiva amplificazione

- Amplificazione specifica con primer che legano sequenze mutate

La patologia ha una frequenza di 1 affetto su 25000 individui mentre si stima che i

portatori siano 1 su 25.

Difatti, supponendo che la popolazione sia in equilibrio di HW:

2

q = 1/2500 q=1/50

Þ

poiché p = 1-q = 49/50

la frequenza dell’eterozigote (2pq) è pari a

2pq = 2x49/50x1/50 = 1/25

I genitori portatori hanno, dunque, il 25% di

probabilità di avere un figlio affetto e individui sani

con un fratello o sorella affetto hanno 2/3 di

probabilità di essere portatori.

I portatori di CF sono molto frequenti anche per

vantaggio dell’eterozigote:

effetto del gli eterozigoti

hanno un vantaggio riproduttivo rispetto agli omozigoti (potrebbe essere dovuto al

salmonella tiphi,

fatto che sono maggiormente resistenti alla un batterio che richiede

Cl per crescere e riprodursi e la CF e’ causata da un difetto del canale del Cl). Altra

ipotesi è legata al fatto che gli eterozigoti per CF secernono grandi quantità di

mucopolisaccaridi nel muco polmonare che li rende maggiormente resistenti alle

infezioni batteriche. E ancora, si ritiene che il ridotto flusso d’acqua attraverso la

mucosa intestinale conferisca ali eterozigoti una maggiore capacità di sopravvivenza

alle infezioni intestinali responsabili di diarrea infantile (un tempo frequente causa di

morte).

In base al tipo di approccio sperimentale, i metodi usati per la diagnosi molecolare

genetica possono essere distinti in diretti e indiretti.

La “diagnosi indiretta” è l’unico mezzo di indagine molecolare disponibile quando si

conosce solo la localizzazione del locus malattia sul genoma umano. È un tipo di

indagine possibile esclusivamente nei casi familiari (coinvolge infatti l’intera famiglia)

e viene condotta mediante studi di linkage utilizzando marcatori associati alla

malattia, di cui viene seguita la segregazione all’interno della famiglia stessa.

La “diagnosi diretta” è possibile solo dopo l’identificazione del gene malattia: in questo

caso la mutazione responsabile di una patologia viene ricercata e rilevata

direttamente su DNA, RNA o prodotto proteico del probando.

La ricerca diretta di mutazioni può essere effettuata mediante due approcci:

1. Analisi specifica di una mutazione nota. Da un punto di vista metodologico sono

stati approntati diversi metodi di indagine: analisi di restrizione, ASO (Allele Specific

Oligoprobe), ARMS (Amplification Refractory Mutation System), OLA

(Oligonucleotide Ligation Assay).

2. Ricerca aspecifica di mutazione, ignota o nota. Si conoscono differenti approcci

metodologici da usare a seconda delle dimensioni del gene in esame e del numero

di campioni da analizzare: sequenziamento del DNA, tecnica SSCP (Single Straind

Conformation Polymorphism), tecnica DGGE (Denaturing Gradient Electrophoresis),

tecnica DHPLC (Denaturing High Performance Liquid Chromatogrphy).

La scelta del metodo diagnostico per la ricerca di mutazioni dipende da fattori vari

come:

- Dimensione del gene

- Tipi di mutazione

- Eterogeneità allelica

- Materiale biologico disponibile

- Numero di campioni da testare

- Ricerca di mutazioni note o ignote.

Analisi di restrizione. È operata da enzimi specifici, detti “endonuleasi di

 restrizione”, che sono stati isolati da numerosi ceppi batterici. Questi enzimi si

legano a una sequenza di DNA, detta sito di riconoscimento o sito di restrizione,

lunga solitamente 4-8 nucleotidi, e tagliano entrambi i filamenti di DNA.

Se una mutazione puntiforme con sostituzione anche di una sola base crea o

abolisce un sito di restrizione, può essere facilmente individuata ponendo

l’amplimero all’azione dell’enzima. La semplice elettroforesi in gel di agarosio o di

poliacrilamide, seguita da colorazione con bromuro di etidio, permette di

visualizzare direttamente la presenza o l’essenza del sito di restrizione.

Nel caso in cui la mutazione crei un sito di restrizione per uno specifico enzima,

questo taglia il DNA con la mutazione. Il prodotto della PCR viene digerito con

l’enzima appropriato: il frammento corrispondente all’allele mutato viene digerito

creando due frammenti; il frammento corrispondente all’allele normale non verrà

diferito in quanto non possiede il sito di restrizione.

Dopo elettroforesi su gel di agarosio è possibile discriminare il soggetto omozigote

normale (presenza di una banda, per l’assenza del sito di restrizione), dal soggetto

omozigote mutato (presenza di due bande, che testimoniano la digestione su

entrambi i frammenti), dal soggetto eterozigote (presenza di tre bande

corrispondenti al frammento intero e a quello digerito)

Bisogna, infine, effettuare la conta genica, tramite Equilibrio di H-W, per questo

polimorfismo.

L’errore nell’analisi di restrizione può riguardare il soggetto omozigote normale, a

seguito di una digestione enzimatica non eseguita correttamente, oppure può

interessare il soggetto eterozigote.

In quest’ultimo caso, errori nell’esecuzione della digestione enzimatica (carenza di

enzima, corsa elettroforetica lenta, poca tenuta del gel) possono produrre una

digestione parziale che risulta in un eccesso di frequenza dell’eterozigote.

Nel caso in cui la mutazione abolisca un sito di restrizione, il prodotto di PCR viene

digerito con uno specifico enzima:

- il frammento corrispondente all’allele normale verrà tagliato in due frammenti,

- il frammento corrispondente all’allele in cui la mutazione ha abolito il sito di

restrizione non verrà tagliato, producendo un unico frammento.

Dopo elettroforesi su gel di agarosio è possibile discriminare il soggetto omozigote

normale (presenza di 2 bande) dal soggetto omozigote mutato (presenza di una

banda) e dal soggetto eterozigote (presenza di tre bande corrispondenti al

frammento intero e a quello digerito).

Se la mutazione non altera i siti di restrizione, è possibile inserire artificialmente nel

 prodotto di amplificazione un sito di restrizione utilizzando un primer

complementare al sito corrispondente alla mutazione in esame. Tale primer viene

modificato nella sequenza in mood da creare un sito di restrizione nel prodotto

normale mentre in quello mutato il sito non è presente (e viceversa). Nonostante il

cattivo appaiamento indotto utilizzando un primer contenente una base non

appaiata correttamente (mismatch), in condizioni adeguate di stringenza è

possibile ottenere il prodotto di amplificazione: l’allele normale sarà tagliati, quello

mutato no lo sarà (e viceversa).

La tecnica di Ibridazione con oligonucleotidi allele-specifici (ASO probe) permette di

 discriminare tra loro alleli che differiscono anche di un solo nucleotide, qualora sia

nota a priori la variazione di sequenza da identificare.

La presenza di una mutazione viene riconosciuta facendo reagire il DNA amplificato

con sonde oligonucleotidiche complementari alla sequenza mutata o normale

(separatamente). Solo in presenza del 100% di omologia tra le sequenze si avrà

l’ibridazione della sonda con il DNA.

La tecnica viene realizzata mediante:

1. Dot blot. Si realizza in più fasi:

- Amplificazione del DNA

- Denaturazione

- Immobilizzazione DNA su filtro di nylon o nitrocellulosa

32

- Aggiunta di oligonucleotidi di sintesi marcati con P e complementari alla

sequenza normale e a quella mutata

- Ibridazione con la sequenza complementare di DNA

- Esposizione del filtro alla lastra radiografica (autoradiografia): se la rezione

di ibridazione è avvenuta si avrà la comparsa di una macchia.

• 1 macchia con oligo mutato indica un omozigote per la mutazione

• 1 macchia con oligo normale indica un soggetto normale

• 2 macchie con oligo normale e mutato indica un eterozigote per la

mutazione

ESEMPIO: Diagnosi prenatale per b-talassemia major.

2. Reverse dot blot. Un esempio è fornito dal test per la rivelazione di mutazioni

β-talassemiche.

Il campione di DNA è amplificato con primers biotinilati. L’amplificato è poi

denaturato chimicamente e ibridato con sonde oligonucleotidiche

complementari alle sequenze normali (N) e mutate (M) per otto diverse

mutazioni per la β-talassemia, immobilizzate su pozzetti di una micropiastra .

Segue un lavaggio stringente che rimuove l’amplificato legatosi in modo non

specifico alla membrana. Viene aggiunta streptavidina coniugata con una

fosfatasi alcalina, che si lega ad ogni ibrido biotilinato (amplificato-sonda)

formatosi con l’ibridazione. Dopo lavaggi ripetuti, si aggiunge un substrato

contenente un cromogeno (in questo caso la tetrametilbenzidina - TMB) che per

azione della fosfatasi alcalina forma un precipitato di color giallo/blu.

La rivelazione dell’avvenuta ibridazione è, dunque, effettuata attraverso una

reazione enzimatico-colorimetrica che indica quali sequenze, nomali o mutate,

sono presenti nel campione. La lettura è effettuata a 450 nm: la colorazione blu

è indice di positività (presenza di mutazione).

La tecnica ARMS (amplificazione allele-specifica) prevede una PCR nella quale

 vengono utilizzati separatamentemente due primer di cui uno è rappresentato da

un oligonucleotide allele-specifico costruito in modo che il nucleotide in posizioni 3’

sia complementare o alla sequenza mutata del gene o a quella normale, mentre

l’altro primer è comune. Il DNA genomico non viene amplificato quando si usa il

primer non perfettamente complementare alla sequenza in esame. La

visualizzazione dei prodotti amplificati avviene dopo elettroforesi su gel di agarosio

e colorazione con etidio di bromuro.

ESEMPIO: rappresentazione schematica di una ARMS PCR per analisi di mutazioni

note. Per ogni campione vengono allestite due reazioni di PCR utilizzando in ogni

reazione il primer comune in combinazione con quello corrispondente

rispettivamente alla sequenza normale e a quella mutata.

Dalla lettura della corsa elettroforetica emerge che:

- L’omozigote normale ha amplificato solo il filamento wild-type

- L’omozigote mutato ha amplificato solo il filamento che porta la mutazione.

- L’eterozigote ha amplificati entrambi i filamenti .

La tecnica OLA (saggio di legame degli oligonucleotidi) si basa sull’uso di sonde

 fluorescenti specifiche per le mutazioni analizzateSi costruiscono due

oligonucleotidi che ibridano alle due sequenze adiacenti nel DNA bersaglio, con il

punto di giunzione a livello della mutazione: dopo la reazione di ibridazione tra il

DNA in esame e le sonde, una DNA ligasi unirà i due oligonucleotidi solo se sono

perfettamente ibridati.

Due sonde oligonucleotidiche sono complementari sia all’allele mutato sia a quello

normale e sono associate in posizione 5’ a modificatori di mobilità (code di ossido

di pentaetilene) di diversa lunghezza. La terza sonda utilizzata è comune ed è

coniugata con un fluoro cromo che permette la rivelazione dei prodotti ibridati dopo

elettroforesi capillare. Le sonde oligonucleotidiche vengono utilizzate per

l’allestimento di una multiplex PCR a cui segue una reazione di ligazione: la ligasi

unità le due sonde solo se sono perfettamente complementari al DNA bersaglio.

La visualizzazione dei risultati avviene con elettroforesi capillare su sequenziatore

automatico dotato di un programma che riporta il grafico della corsa elettroforetica

e di un programma che interpreta i risultati e fornisce la genotipizzazione del

campione. Le dimensioni degli oligonucleotidi, infatti, sono tali che i prodotti di

ciascuna mutazione e il corrispettivo allele wild-type possono essere differenziati

per dimensione e/o colore del marcatore.

Questa tecnica permette di analizzare contemporaneamente diverse mutazioni e

rappresenta, per esempio, una tecnica di screening di primo livello comunemente

usata nella ricerca di mutazioni del gene CFTR responsabile della fibrosi cistica.

Il sequenziamento con Metodo a terminazione di catena, altrimenti noto come

 Metodo di Sanger comporta la sintesi di nuovi filamenti di DNA, complementari ad

uno stampo a singolo filamento. La sintesi di un singolo filamento non prosegue

indefinitamente perché la miscela di reazione contiene piccole quantità di ciascuno

dei quattro dideossinucleotidi che bloccano l’allungamento.

In generale, il sequenziamento con metodo di Sanger necessita di:

Un primer oligonucleotidico che si appai al DNA stampo (il primer svolge inoltre

 la funzione critica di stabilire la regione della molecola stampo che verrà

sequenziata);

Un DNA templato, ossia uno stampo a singolo filamento della molecola di DNA

 da sequenziale;

Una DNA polimerasi stampo-dipendente

 Una miscela di quattro deossiribonucleotidi trifosfato e un dideossinucleotide

 trifosfato; 35 32

Un marcatore fluorescente ( S o P) che si leghi a ciascun dideossinucleotide

 35

(per es. S-dATP). Nel sequenziamento automatico, il deossinucleotide

radioattivo è stato sostituito con dideossinucleotidi fluorescenti.

Il campione di DNA da sequenziale viene clonato e, successivamente, denaturato

per ottenere lo stampo a singolo filamento. Questo è suddiviso in quattro provette

di sintesi con l'aggiunta di:

 Un primer specifico complementare al filamento da sequenziare e marcato radio

attivamente

 DNA polimerasi

Una

 Una miscela dei quattro dNTP

 Un ddNTP diverso in ognuna delle quattro provette e in concentrazione 1:100

rispetto al dNTP corrispondente.

Il legame al filamento stampo guida l’incorporazione dei deossinucleotidi trifosfato:

finché viene incluso un dNTP, continua l’estensione della catena, ma

occasionalmente verrà incorporato un ddNTP e si avrà la terminazione della

catena. Ciascuna delle quattro reazioni base-specifiche genererà una serie di

frammenti di DNA marcati e di dimensioni diverse, con un’estremità 5' comune ed

estremità 3' variabili (a seconda della posizione 3' in cui è stato incorporato il

ddNTP).

Anticamente, i frammenti erano visualizzati attraverso autoradiografia come

bande radioattive di lunghezze diverse. In questo caso, vengono condotte in

parallelo quattro reazioni di sintesi: al termine della reazione ogni provetta

conterrà nuovi frammenti di DNA marcati di lunghezza diversa che vengono poi

caricati in 4 pozzetti diversi e separati con elettroforesi su gel di poliacrilammide.

La sequenza del DNA viene ricostruita a partire dall'estremità 5' a quella 3' (cioè

dal frammento più corto a quello più lungo) in base alla posizione delle bande nei

diversi pozzetti, che corrisponde alla terminazione della sintesi a livello di una

delle quattro basi nucleotidiche per incorporazione di un ddNTP.

“sequenziamento automatizzato”

Nella tecnica di il deossinucleotide radioattivo è

sostituito con dideossinucleotidi fluorescenti: difatti, il DNA viene marcato

facendogli incorporare un primer o ddNTP a cui sono attaccati dei fluorofori.

L’uso di fluorofori differenti per ciascuna base implica che i frammenti possano

essere caricati in un'unica corsia e, soprattutto, che la sequenza possa essere letta

in modo automatizzato. In una tipica reazione di sequenza è possibile sequenziare

frammenti di dimensioni fino a 800 paia di basi (500 bp dimensione ottimale).

All’interno della provetta, il primer si appaia all’estremità in 3’-OH del filamento di

DNA e rende disponibile il proprio terminale idrossilico per la reazione di

polimerizzazione, catalizzata dalla DNA polimerasi. Quando la catena nascente

incorpora un ddNTP, la reazione di polimerizzazione si arresta e si ha la

terminazione della catena; ciò avverrà più volte, in posizioni diverse della

sequenza, generando una serie di frammenti interrotti di lunghezza variabile.

I prodotti di reazione vengono caricati in singoli tubi capillari del diametro di circa

(elettroforesi capillare).

50 μm contenenti un polimero di corsa

Durante l’attraversamento del capillare i vari frammenti di DNA vengono colpiti da

un raggio laser, focalizzato su uno specifico punto del gel. Man mano che i singoli

frammenti di DNA superano quel punto, il laser eccita i vari fluorocromi che

marcano i singoli frammenti. Ciascuno dei quattro fluorocromi emette una diversa

lunghezza d’onda. Una cellula fotoelettrica rileva sequenza, tipo e intensità delle

varie emissioni luminose e il tutto viene registrato in forma grafica. La sequenza

dei picchi corrisponde alla sequenza dei nucleotidi: il tipo, ossia il colore del picco,

corrisponde al tipo di base azotata.

elettroferogramma

Ciò permette la costruzione di un , nel quale ogni picco ed ogni

colore corrisponde ad un determinato nucleotide.

La presenza di una mutazione puntiforme in eterozigosi si evidenzia per la

contemporanea presenza di due picchi nella stessa posizione.

La presenza di una mutazione puntiforme in omozigosi è evidenziabile come la

presenza di un picco singolo corrispondente all’allele mutato.

La tecnica di analisi dei polimorfismi di conformazione dei singoli filamenti (SSCP)

 sfrutta la tendenza del DNA a singolo filamento ad assumere ripiegamenti dovuti ai

legami intramolecolari che si instaurano tra basi complementari. Queste

conformazioni sono strettamente dipendenti dalla sequenza nucleotidica del

campione. La mobilità elettroforetica di una molecola di DNA a singolo filamento

cambia quindi in funzione delle sue dimensioni, della sua sequenza nucleotidica,

della temperatura di analisi e della forza ionica.

La tecnica SSCP è basata sulla differenza di mobilità elettroforetica tra DNA

mutato a singolo filamento rispetto a quello non mutato.

I singoli filamenti di DNA ottenuti mediante amplificazione in PCR, denaturati e

sottoposti a rapido raffreddamento, vengono fatti migrare su un gel di

poliacrilamide in condizioni non denaturanti, con il risultato di un cambiamento

nella mobilità elettroforetica per quei frammenti che presentano alterazioni anche

di una singola base. I frammenti di DNA sono identificabili dopo corsa

elettroforetica su gel di poliacrilamide mediante colorazione argentica: una

variazione di sequenza, anche minina, è evidenziabile come una banda anomala di

migrazione, a livello del singolo filamento edell’eteroduplex.

La tecnica DGGE (denaturino gradient gel electrophoresis) sfrutta il principio

 secondo cui la temperatura di denaturazione di una specifica sequenza di DNA

(definita “temperatura di melting” o Tm) dipende dalla sua sequenza nucleotidica

ed è caratteristica per ogni frammento. Quindi, variazioni anche di un singolo

nucleotide modificano la temperatura di denaturazione del frammento e

conseguentemente la sua mobilità elettroforetica. La DGGE è, dunque, basata sul

differente comportamento di denaturazione del DNA mutato rispetto a quello

normale.

Le regioni del DNA che devono essere analizzate vengono amplificate mediante

PCR, utilizzando un primer modificato dall’aggiunta di una coda stabilizzante ricca

in guanina e citosina (detta GC clamp) che crea un dominio ad alta temperatura di

denaturazione.

Il prodotto di amplificazione viene denaturato e lasciato rinaturare lentamente in

modo da favorire la formazione di eteroduplex:

Le molecole omoduplici sono dovute all’appaiamentotra i due filamenti normali

e tra i due filamenti mutati. Le molecole eteroduplici sono dovute all’appaiamento

di un filamento normale con uno mutato.

Questi prodotti vengono sottoposti a elettroforesi su gel di poliacrilamide con

gradiente denaturante crescente di formamide-urea che induce la parziale apertura

della doppia elica del frammento e il rallentamento della corsa nel punto in cui il

frammento di DNA incontra su gel la concentrazione di denaturazione. La presenza

dell’eteroduplex destabilizza la doppia elica e induce la sua denaturazione e un

rallentamento della corsa elettroforetica: i frammenti di DNA con sostituzioni

nucleotidiche in eterozigosi e/o omozigosi sono individuati perché danno luogo a un

pattern elettroforetici diversi rispetto al DNA wild-type.

La tecnica dHPLC (cromografia liquida ad alta risoluzione denaturante) detta anche

 HPLC denaturante rappresenta l’evoluzione della DGGE verso una procedura

automatica e permette l’identificazione di varianti nucleotidiche in brevissimo

tempo.

Si tratta di una cromatografia ionica in fase inversa che sfrutta, in condizioni di

parziale denaturazione, la diversa ritenzione delle molecole di DNA in

assenza/presenza di variazioni di sequenza. I frammenti di DNA vengono separati

sulla base delle loro dimensioni. L’apparecchiatura dispone di una colonna di

separazione riempita con una matrice di particelle non porose e di piccole

dimensioni. Grazie al fatto che la fase stazionaria è elettricamente neutra e

idrofobica, le molecole di DNA cariche negativamente vengono assorbite dalla

matrice. Il trietil-ammonio-acetato (TEAA) agisce da ponte tra i due perché da un

lato le sue caratteristiche positive formano un legame ionico con i gruppi fosfato

del DNA (carichi negativamente) e dall’altro i gruppi alchilici interagiscono con la

matrice idrofobica della resina. Il fattore eluente è l’acetonitrile che rompe il

legame tra il TEAA e il DNA consentendo l’eluizione. Maggiore è la lunghezza del

frammento da analizzare, maggiore sarà il tempo di ritenzione, che dipende anche

dalla composizione in basi nucleotidiche del frammento in esame: i frammenti corti

di DNA verranno diluiti più velocemente rispetto a quelli più lunghi. La separazione

viene effettuata in condizioni parzialmente denaturanti, cioè termostatando la

colonna ad una determinata temperatura (temperatura di quasi denaturazione). In

presenza di una mutazione la denaturazione e l’eluizione del frammento sarà

diversa rispetto al non mutato. Alla temperatura di quasi denaturazione gli

eteroduplici mostrano una parziale denaturazione in corrispondenza del

misappaiamento mentre gli omoduplici, alla stessa temperatura, sono ancora nella

forma di doppia elica. Gli eteroduplici hanno un comportamento cromatografico

diverso rispetto all’omoduplice non mutato e generalmente vengono eluiti più

rapidamente. La presenza di una mutazione si evidenzia con la comparsa nel

cromatogramma di picchi supplementari rispetto al normale.

Eredità dei caratteri complessi

Determinati caratteri vengono trovati con maggior frequenza in alcune famiglie, non

mostrando però la normale segregazione mendeliana.

La complessità della segregazione è dovuta a due motivi, spesso anche presenti

contemporaneamente:

1. Il carattere è “multifattoriale”, cioè la sua espressione è determinata

dall’interazione di fattori genetici con fattori ambientali.

2. Il carattere è “poligenico”, cioè la sua espressione è determinata da un insieme di

fattori genetici, molti geni non allelici.

La prima grande distinzione tra le diverse malattie genetiche è legata al numero di

geni coinvolti, per cui distinguiamo:

 Malattie monogeniche. L’eredità e “unifattoriale” o “monogenica”. Il carattere

biologico è specificato da un solo gene trasmesso secondo le leggi mendeliane

della dominanza, della segregazione, dell’indipendenza. I caratteri monogenici

qualitativi.

hanno la caratteristica di essere

 Malattie poligeniche. L’eredità e l’espressione del fenotipo dipende da più geni non

allelici (loci diversi) ognuno dei quali contribuisce in modo additivo all’espressione

del fenotipo. L’effetto dei geni è cumulativo e nessuno è dominante o recessivo

quantitativa

rispetto agli altri. Questi caratteri variano in manieri nella popolazione

e presentano una variabilità fenotipica continua.

 Malattie multifattoriali o complesse. L’ereditarietà delle malattie complesse è

multifattoriale quando il carattere biologico è controllato da un insieme di molti

geni che agiscono in concorso con fattori ambientali (alimentazione, condizioni

igieniche, clima, attività fisica, tabagismo, etc).

caratteri complessi

I possono essere

Continui (quantitativi) Quantitative trait loci - QTL

 Discontinui dicotomici (qualitativi)

o Loci di suscettibilità (determinano

 predisposizione).

I caratteri complessi sono distinguibili solo quantitativamente e variano in maniera

continua all’interno di un determinato intervallo. L’eredità e l’espressione del fenotipo

dipende da più geni non allelici (loci diversi) ognuno dei quali contribuisce in modo

additivo all’espressione del fenotipo. L’effetto dei geni è cumulativo e nessuno è

dominante o recessivo rispetto agli altri.

Caratteri che hanno una distribuzione continua sono: statura, peso corporeo, pressione

sanguigna, colore degli occhi, statura, circonferenza cranica, intelligenza.

I caratteri complessi non seguono le leggi di ereditarietà mendeliana, ma hanno

comunque una componente ereditaria. Secondo la “teoria poligenica di Fisher per

caratteri quantitativi” (1918), il carattere è soggetto al controllo da parte di più di

fattori mendeliani indipendenti (in tal caso definiti “poligeni”) ognuno dei quali esercita

un

piccolo effetto sul carattere in questione: ciascun allele intensifica o riduce

l’espressione fenotipica complessiva (effetto additivo).

La variabilità del carattere è la risultante degli effetti dei singoli loci; per cui

all’aumentare del numero dei loci la distribuzione nella popolazione si approssima ad

una distribuzione normale: le variazioni di tali caratteri risultano continue, invece che

discrete , ragion per cui si tratta di caratteri quantitativi:

Un locus contiene due alleli, A e a,

ognuno dei quali contribuisce al

fenotipo in modo diverso.

Supponendo che:

 a → 0

 A → +20

Avremo tre differenti genotipi.

Allo stesso modo, due loci

contengono ognuno due alleli, A,a,

B e b, ognuno dei quali esercita un

effetto diverso sul fenotipo:

 a → 0

 A → +10

 B → 0

 b → +10

In questo caso otterremo cinque fenotipi.

All’aumentare delle classi la distribuzione si approssima ad una curva normale

(gaussiana); diminuiscono le differenze tra le classi fenotipiche, che vengono

mascherate dai fattori ambientali.

La genetica dei caratteri quantitativi cerca di spiegare:

 Come molti geni controllano un carattere;

 In che modo geni ed ambiente agiscono sul carattere;

 Quanti e quali sono questi geni per ogni carattere;

 Come l’evoluzione modifica la distribuzione di frequenza di questi caratteri.

La distribuzione di frequenza è definita mediante una serie di parametri statistici:

Misure della tendenza centrale: la media.

 Misure della dispersione: la varianza e la deviazione standard.

 Misure di relazione: la correlazione e la regressione.

 x́

La MEDIA( ) fornisce informazioni sul centro di una distribuzione:

∑ x

i

x́= N

2

La VARIANZA ( ) è definita come la deviazione quadratica media dalla media. Essa

s

indica il grado di variabilità di un gruppo di fenotipi (misurazioni). Quanto maggiore è

la varianza, tanto più dispersi sono i valori di una distribuzione intorno alla media.

∑ 2

( )

−x́

x i

2 =

s −1

N

s

La DEVIAZIONE STANDARD ( ) è la radice quadrata della varianza. Essa misura la

dispersione dei dati intorno al valore atteso. Si esprime nelle stesse unità della misura

originale, pertanto descrive la variabilità di una misura.

√ 2

s= s r

Il COEFFICIENTE DI CORRELAZIONE ( ) è un parametro che stima la forza

dell’associazione tra due caratteri quantitativi. Il coefficiente di correlazione si ottiene

dividendo la covarianza di x e y per il prodotto delle deviazioni standard di x e y. Esso

spazia da +1 a -1. Un valore positivo indica l’esistenza di correlazione positiva fra le

due variabili.

cov xy

r= ⋅

s s

x y cov

La COVARIANZA di x e y ( ) è un indice che misura la "contemporaneità" della

xy

variazione (in termini lineari) di due variabili casuali. In pratica, la covarianza di due

variabili aleatorie X e Y è il valore atteso dei prodotti delle loro distanze dalla media.

Essa può assumere sia valori positivi che negativi. Nel caso di valori positivi indica che

al

crescere di una caratteristica statisticamente cresce anche l'altra, nel caso di valori

negativi accade il contrario.

∑ ( ) ( )

−x́ −

x y ý

i i

=

cov xy N−1 b

Il COEFFICIENTE DI REGRESSIONE ( ) indica l’entità dell’aumento di y all’aumentare

di x. Pertanto, b consente di prevedere il valore di una variabile, dato il valore dell’altra

ad essa correlata.

cov xy

b= 2

s x y=a+bx

curva di regressione

La è

a=¿ y

intercetta di , ovvero il valore

y x=0

di quando

b=¿ pendenza della curva, ovvero

y

l’aumento medio di all’aumentare di

x

Il coefficiente di regressione consente di

prevedere determinate

caratteristiche della progenie generata da

una data unione anche senza

conoscere i genotipi che codificano per

tale carattere.

Non tutti i caratteri complessi, però, sono di tipo quantitativo. Si parla, in questo caso,

di caratteri discontinui, dicotomici o qualitativi, ossia loci di suscettibilità che

conferiscono la predisposizione a sviluppare: cardiomiopatie congenite, diabete

mellito, ipertensione, schizofrenia, patologie dell’intestino, obesità,

resistenza/sensibilità ai farmaci e alle malattie infettive, etc.

Secondo il Modello multifattoriale a soglia (Liability Threshold Model), proposto da

Falconer (1984):

 La predisposizione genetica ad un malattia

è distribuita nella popolazione come una

distribuzione normale

 La predisposizione genetica è determinata

da un certo numero di loci, che

contribuiscono in modo additivo.

 Solo gli individui con predisposizione al di

sopra di una certa soglia sviluppano la

malattia (più fattori ambientali).

I “geni si suscettibilità” conferiscono un rischio moderato di contrarre una specifica

malattia, ma non di per se sufficiente a causare la malattia. Chi eredita geni di

suscettibilità per una data malattia, non eredita la certezza di ammalarsi, bensì un

rischio maggiore rispetto alla popolazione generale di svilupparla. Gli individui

geneticamente predisposti possono sviluppare la malattia, ma soltanto se esposti a

fattori ambientali scatenanti.

Nel caso dei caratteri quantitativi:

Fenotipo = contributo genetico + contributo ambientale

La varianza è una misura della variazione ed è definita come il valore medio del

quadrato della deviazione di un’osservazione dalla media aritmetica del campione:

∑ 2

( )

x x́

i

2

=s =

V N−1

La varianza è sempre positiva: più un’osservazione è distante dalla media, più

contribuisce alla varianza.

varianza fenotipica

È possibile suddividere la dei tratti quantitativi in varianza

associata agli effetti genetici e in varianza associata agli effetti ambientali:

+VE

VP=VG

Con:

 VP: varianza fenotipica

 VG: varianza genetica

 VE: varianza ambientale

Valori elevati di VP si possono avere sia quando la popolazione è geneticamente

omogenea e l’ambiente molto variabile sia quando l’ambiente è uniforme ma è

presente una notevole variazione genetica.

La varianza genetica può essere ulteriormente suddivisa in tre componenti:

Varianza genetica additiva (VA):

1. variazione genetica ereditabile poiché passa dai

genitori ai figli.

Varianza genetica di dominanza (VD):

2. alcuni alleli sono dominanti su altri e

mascherano il contributo degli alleli recessivi in quel locus.

Varianza genetica da interazione (VI):

3. dovuta fondamentalmente a fenomeni di

epistasi e interazioni fra geni diversi.

La varianza genetica totale è pari a: +VD +VI

VG=VA

Nella realtà la varianza fenotipica non equivale alla semplice relazione

+VE

VP=VG covarianza

Occorre considerare la covariazione del genotipo e dell’ambiente o di G e

E. Inoltre, la varianza fenotipica può essere influenzata anche dall’interazione fra il

VG × E

genotipo e l’ambiente, ovvero . Tale interazione esiste se le variazioni

ambientali influenzano in modo diverso i diversi genotipi.

La varianza fenotipica è ora pari a: +VE+2Cov (G

VP=VG , E)+VG × E

L’EREDITABILITA’ è definita come la proporzione della variabilità totale di una

popolazione che può essere attribuita alla variabilità genetica. Si usa comunemente

per indicare quanto un tratto è influenzato da fattori genetici in una data popolazione.

Misura, dunque, il contributo del genotipo alla variabilità fenotipica.

Si possono avere due tipi di ereditabilità:

2

Ereditabilità in senso lato (H ), ossia il rapporto tra la varianza genetica totale

 (dominanza ed epistasi) e la varianza fenotipica totale:

2 =V /V

H G P V

Varianza genetica Varianza genita

2 G

= = =

H +V

Varianza totale varianza genetica+Varianza ambientale V G E

 2

Ereditabilità in senso stretto (h ), vale a dire il rapporto fra varianza genetica

additivita e la varianza fenotipica totale:

2 =V /V

h A P

2 può variare da 0 (la variabilità del carattere dipende interamente da effetti di

h =0

V

natura ambientale, ) a 1 (la variabilità del carattere dipende interamente

A =V

V ,

da effetti di natura genetica, ) e spesso è espressa in termini

A P

percentuali.

Il calcolo dell’ereditabilità può essere effettuato con il metodo del confronto dei

fenotipi tra genitori e figli o tra individui con diversi gradi di parentela. Se i geni sono

importanti nel determinare la varianza fenotipica, allora individui imparentati

dovrebbero essere più somiglianti per un certo fenotipo, dal momento che possiedono

un numero di geni più elevato di geni in comune.

L’ereditabilità si può, dunque, calcolare dalla regressione dei valori fenotipici dei figli

rispetto ai valori medi nei genitori.

L’ereditabilità non deve, però, essere confusa con la “familiarità”: un carattere è

“familiare” se i membri della stessa famiglia lo presentano qualsiasi sia la ragione, ma

è “ereditabile” solo se la somiglianza deriva dal fatto di avere in comune i genotipi.

Concetti importanti sull’ereditarietà:

 L’ereditabilità non indica il grado in cui il carattere è genetico, ma misura la

proporzione di varianza fenotipica dovuta a fattori genetici.

 La stima dell’ereditabilità è un parametro della popolazione, non del singolo

individuo.

 La stima dell’ereditabilità è specifica per la popolazione e l’ambiente che si sta

analizzando, per questo non è costante: può cambiare nel tempo perché cambia la

varianza genetica, quella ambientale o la correlazione tra varianza genetica e

ambientale.

 Un alto valore di ereditabilità non implica che il carattere non possa essere

modificato dall’ambiente.

Per ottenere una misura dell’ereditabilità dei tratti si ricorre a tre metodi:

a. Il metodo dei gemelli allevati nello stesso ambiente

b. Il metodo dei gemelli allevati separatamente

c. Il metodo dell’adozione.

Per valutare la componente genetica di una patologia complessa esistono due

parametri da osservare. Il primo è rappresentato dall’Aggregazione familiare per cui la

patologia si presenta con frequenza più elevata nei parenti di primo grado di pazienti

affetti rispetto alla frequenza riscontrata nella popolazione generale.

È importante definire la relazione genetica tra i

parenti:

 Parenti di 1° grado (gemelli dizigotici; fratelli;

genitori/figli) condividono 1/2 dei loro geni.


ACQUISTATO

2 volte

PAGINE

55

PESO

705.97 KB

AUTORE

Fredo88

PUBBLICATO

8 mesi fa


DESCRIZIONE APPUNTO

Gli appunti comprendono: genetica dei caratteri mendeliani (trasmissione e studio dei pedigree); eredità non mendeliana; genetica di popolazione; consulenza genetica; genetica diretta e indiretta (clonaggio posizionale, analisi di linkage, polimorfismi e LOD score); aplotipi e linkage disequilibrium; fibrosi cistica; analisi di restrizione e varie metodiche; eredità dei caratteri complessi; ereditabilità; studio di gemelli; citogenetica; anomalie cromosomiche e imprinting genomico. Gli appunti includono le lezioni e sono integrati con lo studio dei libri consigliati: “Genetica Umana e Medica” (Neri-Genuardi) e “Genetica Medica” (Strachan).


DETTAGLI
Corso di laurea: Corso di laurea magistrale in biologia
SSD:
Università: Calabria - Unical
A.A.: 2014-2015

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Fredo88 di informazioni apprese con la frequenza delle lezioni di Genetica umana e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Calabria - Unical o del prof Rose Giuseppina.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Corso di laurea magistrale in biologia

Enzimologia - cinetica enzimatica
Appunto
Sequenziamento del genoma
Appunto
Enzimologia - funzioni di particolari proteine e cinetica enzimatica
Appunto
Enzimologia - catalisi enzimatica
Appunto